如何看待Anthropic的新模型Mythos?

封面

Anthropic 选择不公开 Mythos,这件事本身比模型能力更值得关注。

一、从两个漏洞说起

OpenBSD 里有一个漏洞活了 27 年。OpenBSD,那个号称全球最安全的操作系统,防火墙级别的关键基础设施,27 年没人发现。另一个在 FFmpeg,自动化测试工具命中那行代码 500 万次,愣是没测出来。

据 Anthropic 称,Mythos 全自主发现了这些漏洞,无需人工引导。几周内扫出了数千个零日漏洞,覆盖所有主流操作系统和浏览器。

我的判断是:AI 在网络安全领域已经完成了对人类的超越。

二、不公开才是信号

Anthropic 原话:We do not plan to make Claude Mythos Preview generally available。

一个 AI 公司做了最强的模型,然后说"不会公开发布"。

原因是攻防不对称。防守方要堵所有洞,攻击者只需要找到一个。Mythos 能自主发现零日,一旦公开,防守方修补的速度大概率跟不上攻击者利用的速度。

这揭示了一个转变:AI 安全的讨论重心,从"模型会不会产生有害内容"转到了"模型能力太强,强到不能放出来"。前者是发布后治理,后者是发布前隔离。

三、Glasswing 的透明,对谁透明?

Project Glasswing 把 Mythos 只给防守方——AWS、苹果、微软、Google、CrowdStrike,12 家启动伙伴。Anthropic 投了 1 亿美元使用额度加 400 万美元开源捐赠。

方向我是认可的:让防守者比攻击者快。

但访问门槛决定了谁受益。研究期后定价 $25/$125 每百万 token。这个价格,中小安全团队和独立研究员能承受吗?开源社区拿到的是捐赠,不是直接访问 Mythos——需要单独申请。发展中国家的关键基础设施呢?更不在优先名单上。

Glasswing 以蝴蝶翅膀命名,象征透明防御。但目前的"透明"更像是科技巨头之间的透明。安全能力的分配权集中在了少数大公司手里,而安全恰恰是最不该集中的东西——漏洞不挑大小公司。

说到这个,我倒想起一个更根本的问题。

四、克制能维持多久?

Mythos 不公开,是 Anthropic 的主动选择。但这个选择能撑多久?

如果是商业决策——竞争对手发布了同等模型,克制就变成了竞争劣势。如果是安全决策——AI 能力的天花板还在往上走,今天的"不能公开"明天可能变成"限制访问也不够",因为总有人会复现这个能力。

Anthropic 自己也意识到了这个困境:要建独立第三方机构、要跟政府沟通、要制定行业规范。但一个行业的规范从来不是靠一家公司单方面克制来建立的。它需要的是博弈均衡——所有玩家都意识到不克制的代价大于克制的收益。

我们离那个均衡点还很远。

比人强的 AI 该由谁掌控,这个问题比"Mythos 有多强"重要得多。

欢迎讨论。