给 AI 设一个美联储

上周五，美国政府做了一件很反常的事：它逼着本国最领先的一家 AI 公司，把最先进的产品从市场上撤下来。首当其冲的是 Anthropic，它的前沿模型叫 Mythos，对外卖的那个版本叫 Fable。据报道，留给公司执行的时间，大约只有九十分钟。

这条新闻你大概率没注意到，正常。它发生在政府从伊朗战事抽身的阴影里，被更吵的头条盖住了。但拉长时间看，它可能比那场仗更要紧。因为华盛顿和 Anthropic 这一架，根本不是冲着哪一家公司去的。它是关于「谁来治理人工智能」的第一场摆上台面的较量，以及这种治理到底会通过规则和制度来落地，还是靠临场发挥和赤裸裸的权力。

让华盛顿恐慌的，是一次几小时的演示

要看懂政府为什么这么急，得先知道它怕的是什么。参议员马克·华纳最近转述了一份证词。作证的是约书亚·拉德将军，他同时执掌国家安全局和网络司令部。证词说：Anthropic 那个最先进的 Mythos，能攻破政府几乎所有的涉密系统。不是几周，也不是几天，是几个小时。

到这一步，「AI 要不要管」已经不值得再争。真正的问题只剩一个：怎么管。

政府的应对，自相矛盾

接下来的操作就开始拧巴了。两周半以前，特朗普刚签了一道行政令，给前沿 AI 模型设了一个自愿审查流程，还给各部门 60 天，去设计一套识别高风险系统的框架。这个方向其实是对的：有结构的监督、提前测试、清楚的门槛。

可这套流程还没建起来，五角大楼就先一步把 Anthropic 定成了「供应链风险」，政府一度要求各联邦部门停用它的系统。然后才有了上周那道九十分钟的最后通牒。

平心而论，政府的担忧不是无理取闹。Anthropic 确实犯过实打实的错。《华盛顿邮报》报道说，它把 Mythos 的访问权限放得比官方批准的还宽，而且在「到底谁能用」这件事上，回应得太慢。情报部门更倾向于强硬处置。

更麻烦的是，这种「针对个体、随意、不可预期」的做法，几乎成了这届政府对待商业的固定姿势。它不去设一套所有人都能照着玩的规则，而是直接下场：在英特尔里拿一块股份，逼英伟达交一笔特别的「税」，在美国钢铁里捏一份黄金股，很多时候法律依据都不清楚。这不是一个全球最发达的资本主义国家该有的治理方式。

中间还夹着私人恩怨。在跟五角大楼最初那场冲突里，国防部长指责 Anthropic「背叛」和「两面派」；高层官员反复批评这家公司「woke」、雇了太多民主党人；总统本人也公开嘲讽过它。AI 这么要紧的东西，不该拿来算这种私账。

给 AI 设一个美联储

骂完了，得给正解。Fareed 给的方案，根植于一个美国人自己发明、并且运转得极好的东西：美联储。银行对资本主义至关重要，可银行业天生爱出危机，一出就是大事。于是美国造了制度来兜底。美联储把公共权威和私营专业拧在了一起：它一刻不停地和市场沟通，同时保住独立性；它做检查、跑压力测试、定资本金要求、发指引；出手是分级的，不是一刀切；最关键的，规则对所有人一视同仁。

先进 AI 需要的，差不多就是这套东西。所谓「AI 美联储」，是一个独立机构，配齐懂技术、懂国家安全、懂商业的专家，具体该做的事是这样几条：

要求前沿开发者在模型发布前先交出来做评估；
为危险能力设下透明的门槛，而不是临时拍脑袋；
建一道阶梯式响应：先警告，再要求整改，再有条件部署，再限制，而不是动不动突然封杀；
让这些规则对每个玩家都一样。

美国该带头建这套系统。欧洲和日本可以建平行的机构。各个民主国家要像央行协调金融稳定那样，去协调 AI 的标准。这不是要给创新踩刹车——美国的银行能横扫全球，恰恰是因为它们被管得好，而不是因为没人管。

没有制度托底的速度，不是活力，是危险的剧烈波动。

油门有了，刹车呢

节目后半段，Anthropic 又出了条新闻，正好接上这个话题。Anthropic 研究院说，AI 的发展比一些人预想的要快，人越来越用不上了，因为 AI 正在逼近一件事：自己写代码，造出更高级的自己。他们因此建议，世界最好保留一个「踩慢或临时暂停前沿 AI」的选项，好让社会结构和对齐研究跟上。但他们也补了一句：如果一停下来反而让最不谨慎的玩家追上来，那所有人都会更不安全——这件事得靠多个国家的 AI 实验室在同样条件下一起停才行。

联合创始人杰克·克拉克上了节目，解释那个吓人的词——「递归自我改进」。他说，AI 行业最初的目标，就是造出聪明到能当通用科学家的系统，让它去做科学发现，而其中一项发现就是「怎么造出更好的 AI」。他认为现在很可能就站在这个临界点上，而且这一天来的时间，可能是几年，不是几十年，比大多数人预想的早得多。

好处是巨大的。今天要用 AI 在生物、医药、机器人上做点事，得把数字世界里的 AI 硬适配到复杂现实里，靠科学家一对一去配。而一个能改进自己的 AI，可以自己钻进医药、生物这些领域，自己琢磨要变强需要什么，再和人协作。科学可能因此猛地加速，AI 会从「科学家手里的工具」，变成「会创造的合作科学家」。

真正的风险，是你没法验证、没法核实、没法信任这些系统的行为。这就像往你的新闻编辑室里，一下子塞进成百上千个新同事——你得花好长时间才能搞清楚，能不能信他们、他们干活是不是按你预期的来。当这支队伍比以往任何时候都更庞大、更快，你怎么维持控制？
— 杰克·克拉克，Anthropic 联合创始人

所以 Anthropic 想要那个「暂停选项」。克拉克的比喻很传神：我们现在开的这辆车，只有油门，没有刹车。总有一天，我们会想要踩一脚刹车的选项——把已经造出来的科学成果先推向世界，把脚从「无脑加速 AI」的油门上挪开。怎么开始？先得有公司站出来说「我想要这个选项」，才谈得拢，才能去和别的公司、和政府商量它怎么落地。他还提了个先例：冷战最紧张的时候，几个互相敌对的国家也找到了办法，把核军备竞赛的某些环节稳住。这种事在别的领域做成过，AI 这边也许也得来一遍。

我的补充：可验证性，才是这一切的底层

视频里我最在意的，是克拉克那句「没法验证、没法核实、没法信任」。听着像是对递归自我改进的恐惧，但往底下挖，它其实是个老问题。

我之前精读 Karpathy 的方法论时记过一条判断：AI 真正强的地方，都满足三个条件——能反复试错、试错成本几乎为零、机器能自动打分。代码和数学之所以是 AI 的主场，就因为「跑通了 100 分，报错了 0 分」，它知道自己错在哪，于是能自我进化。反过来，凡是没法自动验收的任务，AI 就找不着北。克拉克怕的「信不过的同事」，本质就是当 AI 强到能改进自己时，我们却拿不出一套能给它打分、判它对错的验收机制。能力跑在了验证前面。Mythos 几个小时攻穿涉密系统，就是一次能力对验证的碾压。

从这个角度看，Fareed 那个「AI 美联储」其实很聪明。它要求「发布前先交出来评估」「为危险能力设透明门槛」，翻译成工程语言，就是把可验证性从单个公司的自觉，升级成整个行业的制度。一家公司可以靠良心做评估，也可以在断合同的压力下跳过评估；但一套对所有人生效的规则不会。

还有一层值得说。我之前梳理过一个判断：模型层正在被三五家公司压扁、商品化，真正的权力在往基础设施和制度层走。Fareed 警告的那个「随时能按下的开关」，正是这种权力高度集中后的政治表现——当少数几家公司加少数几个政府，攥着一项流进所有人生活的技术，治理就不再是可选项。

原视频：CNN Fareed's Take，《Why Trump admin gave Anthropic 90 minutes to pull its newest AI model》。在 YouTube 观看 · 整理：toy

给 AI 设一个美联储

本文解决

适合谁读

读后获得

让华盛顿恐慌的，是一次几小时的演示

政府的应对，自相矛盾

给 AI 设一个美联储

油门有了，刹车呢

我的补充：可验证性，才是这一切的底层