上周五,美国政府做了一件很反常的事:它逼着本国最领先的一家 AI 公司,把最先进的产品从市场上撤下来。首当其冲的是 Anthropic,它的前沿模型叫 Mythos,对外卖的那个版本叫 Fable。据报道,留给公司执行的时间,大约只有九十分钟。

这条新闻你大概率没注意到,正常。它发生在政府从伊朗战事抽身的阴影里,被更吵的头条盖住了。但拉长时间看,它可能比那场仗更要紧。因为华盛顿和 Anthropic 这一架,根本不是冲着哪一家公司去的。它是关于「谁来治理人工智能」的第一场摆上台面的较量,以及这种治理到底会通过规则和制度来落地,还是靠临场发挥和赤裸裸的权力。

让华盛顿恐慌的,是一次几小时的演示

要看懂政府为什么这么急,得先知道它怕的是什么。参议员马克·华纳最近转述了一份证词。作证的是约书亚·拉德将军,他同时执掌国家安全局和网络司令部。证词说:Anthropic 那个最先进的 Mythos,能攻破政府几乎所有的涉密系统。不是几周,也不是几天,是几个小时。

到这一步,「AI 要不要管」已经不值得再争。真正的问题只剩一个:怎么管。

政府的应对,自相矛盾

接下来的操作就开始拧巴了。两周半以前,特朗普刚签了一道行政令,给前沿 AI 模型设了一个自愿审查流程,还给各部门 60 天,去设计一套识别高风险系统的框架。这个方向其实是对的:有结构的监督、提前测试、清楚的门槛。

可这套流程还没建起来,五角大楼就先一步把 Anthropic 定成了「供应链风险」,政府一度要求各联邦部门停用它的系统。然后才有了上周那道九十分钟的最后通牒。

平心而论,政府的担忧不是无理取闹。Anthropic 确实犯过实打实的错。《华盛顿邮报》报道说,它把 Mythos 的访问权限放得比官方批准的还宽,而且在「到底谁能用」这件事上,回应得太慢。情报部门更倾向于强硬处置。

更麻烦的是,这种「针对个体、随意、不可预期」的做法,几乎成了这届政府对待商业的固定姿势。它不去设一套所有人都能照着玩的规则,而是直接下场:在英特尔里拿一块股份,逼英伟达交一笔特别的「税」,在美国钢铁里捏一份黄金股,很多时候法律依据都不清楚。这不是一个全球最发达的资本主义国家该有的治理方式。

中间还夹着私人恩怨。在跟五角大楼最初那场冲突里,国防部长指责 Anthropic「背叛」和「两面派」;高层官员反复批评这家公司「woke」、雇了太多民主党人;总统本人也公开嘲讽过它。AI 这么要紧的东西,不该拿来算这种私账。

给 AI 设一个美联储

骂完了,得给正解。Fareed 给的方案,根植于一个美国人自己发明、并且运转得极好的东西:美联储。银行对资本主义至关重要,可银行业天生爱出危机,一出就是大事。于是美国造了制度来兜底。美联储把公共权威和私营专业拧在了一起:它一刻不停地和市场沟通,同时保住独立性;它做检查、跑压力测试、定资本金要求、发指引;出手是分级的,不是一刀切;最关键的,规则对所有人一视同仁。

先进 AI 需要的,差不多就是这套东西。所谓「AI 美联储」,是一个独立机构,配齐懂技术、懂国家安全、懂商业的专家,具体该做的事是这样几条:

  1. 要求前沿开发者在模型发布前先交出来做评估;
  2. 为危险能力设下透明的门槛,而不是临时拍脑袋;
  3. 建一道阶梯式响应:先警告,再要求整改,再有条件部署,再限制,而不是动不动突然封杀;
  4. 让这些规则对每个玩家都一样。

美国该带头建这套系统。欧洲和日本可以建平行的机构。各个民主国家要像央行协调金融稳定那样,去协调 AI 的标准。这不是要给创新踩刹车——美国的银行能横扫全球,恰恰是因为它们被管得好,而不是因为没人管。

没有制度托底的速度,不是活力,是危险的剧烈波动。

油门有了,刹车呢

节目后半段,Anthropic 又出了条新闻,正好接上这个话题。Anthropic 研究院说,AI 的发展比一些人预想的要快,人越来越用不上了,因为 AI 正在逼近一件事:自己写代码,造出更高级的自己。他们因此建议,世界最好保留一个「踩慢或临时暂停前沿 AI」的选项,好让社会结构和对齐研究跟上。但他们也补了一句:如果一停下来反而让最不谨慎的玩家追上来,那所有人都会更不安全——这件事得靠多个国家的 AI 实验室在同样条件下一起停才行。

联合创始人杰克·克拉克上了节目,解释那个吓人的词——「递归自我改进」。他说,AI 行业最初的目标,就是造出聪明到能当通用科学家的系统,让它去做科学发现,而其中一项发现就是「怎么造出更好的 AI」。他认为现在很可能就站在这个临界点上,而且这一天来的时间,可能是几年,不是几十年,比大多数人预想的早得多。

好处是巨大的。今天要用 AI 在生物、医药、机器人上做点事,得把数字世界里的 AI 硬适配到复杂现实里,靠科学家一对一去配。而一个能改进自己的 AI,可以自己钻进医药、生物这些领域,自己琢磨要变强需要什么,再和人协作。科学可能因此猛地加速,AI 会从「科学家手里的工具」,变成「会创造的合作科学家」。

真正的风险,是你没法验证、没法核实、没法信任这些系统的行为。这就像往你的新闻编辑室里,一下子塞进成百上千个新同事——你得花好长时间才能搞清楚,能不能信他们、他们干活是不是按你预期的来。当这支队伍比以往任何时候都更庞大、更快,你怎么维持控制?

— 杰克·克拉克,Anthropic 联合创始人

所以 Anthropic 想要那个「暂停选项」。克拉克的比喻很传神:我们现在开的这辆车,只有油门,没有刹车。总有一天,我们会想要踩一脚刹车的选项——把已经造出来的科学成果先推向世界,把脚从「无脑加速 AI」的油门上挪开。怎么开始?先得有公司站出来说「我想要这个选项」,才谈得拢,才能去和别的公司、和政府商量它怎么落地。他还提了个先例:冷战最紧张的时候,几个互相敌对的国家也找到了办法,把核军备竞赛的某些环节稳住。这种事在别的领域做成过,AI 这边也许也得来一遍。

我的补充:可验证性,才是这一切的底层

视频里我最在意的,是克拉克那句「没法验证、没法核实、没法信任」。听着像是对递归自我改进的恐惧,但往底下挖,它其实是个老问题。

我之前精读 Karpathy 的方法论时记过一条判断:AI 真正强的地方,都满足三个条件——能反复试错、试错成本几乎为零、机器能自动打分。代码和数学之所以是 AI 的主场,就因为「跑通了 100 分,报错了 0 分」,它知道自己错在哪,于是能自我进化。反过来,凡是没法自动验收的任务,AI 就找不着北。克拉克怕的「信不过的同事」,本质就是 当 AI 强到能改进自己时,我们却拿不出一套能给它打分、判它对错的验收机制。能力跑在了验证前面。Mythos 几个小时攻穿涉密系统,就是一次能力对验证的碾压。

从这个角度看,Fareed 那个「AI 美联储」其实很聪明。它要求「发布前先交出来评估」「为危险能力设透明门槛」,翻译成工程语言,就是把可验证性从单个公司的自觉,升级成整个行业的制度。一家公司可以靠良心做评估,也可以在断合同的压力下跳过评估;但一套对所有人生效的规则不会。

还有一层值得说。我之前梳理过一个判断:模型层正在被三五家公司压扁、商品化,真正的权力在往基础设施和制度层走。Fareed 警告的那个「随时能按下的开关」,正是这种权力高度集中后的政治表现——当少数几家公司加少数几个政府,攥着一项流进所有人生活的技术,治理就不再是可选项。


原视频:CNN Fareed's Take,《Why Trump admin gave Anthropic 90 minutes to pull its newest AI model》。在 YouTube 观看 · 整理:toy