如何看待Anthropic的新模型Mythos？

Anthropic 选择不公开 Mythos，这件事本身比模型能力更值得关注。

一、从两个漏洞说起

OpenBSD 里有一个漏洞活了 27 年。OpenBSD，那个号称全球最安全的操作系统，防火墙级别的关键基础设施，27 年没人发现。另一个在 FFmpeg，自动化测试工具命中那行代码 500 万次，愣是没测出来。

据 Anthropic 称，Mythos 全自主发现了这些漏洞，无需人工引导。几周内扫出了数千个零日漏洞，覆盖所有主流操作系统和浏览器。

我的判断是：AI 在网络安全领域已经完成了对人类的超越。

Anthropic 原话：We do not plan to make Claude Mythos Preview generally available。

一个 AI 公司做了最强的模型，然后说"不会公开发布"。

原因是攻防不对称。防守方要堵所有洞，攻击者只需要找到一个。Mythos 能自主发现零日，一旦公开，防守方修补的速度大概率跟不上攻击者利用的速度。

这揭示了一个转变：AI 安全的讨论重心，从"模型会不会产生有害内容"转到了"模型能力太强，强到不能放出来"。前者是发布后治理，后者是发布前隔离。

Project Glasswing 把 Mythos 只给防守方——AWS、苹果、微软、Google、CrowdStrike，12 家启动伙伴。Anthropic 投了 1 亿美元使用额度加 400 万美元开源捐赠。

方向我是认可的：让防守者比攻击者快。

但访问门槛决定了谁受益。研究期后定价 $25/$125 每百万 token。这个价格，中小安全团队和独立研究员能承受吗？开源社区拿到的是捐赠，不是直接访问 Mythos——需要单独申请。发展中国家的关键基础设施呢？更不在优先名单上。

Glasswing 以蝴蝶翅膀命名，象征透明防御。但目前的"透明"更像是科技巨头之间的透明。安全能力的分配权集中在了少数大公司手里，而安全恰恰是最不该集中的东西——漏洞不挑大小公司。

说到这个，我倒想起一个更根本的问题。

Mythos 不公开，是 Anthropic 的主动选择。但这个选择能撑多久？

如果是商业决策——竞争对手发布了同等模型，克制就变成了竞争劣势。如果是安全决策——AI 能力的天花板还在往上走，今天的"不能公开"明天可能变成"限制访问也不够"，因为总有人会复现这个能力。

Anthropic 自己也意识到了这个困境：要建独立第三方机构、要跟政府沟通、要制定行业规范。但一个行业的规范从来不是靠一家公司单方面克制来建立的。它需要的是博弈均衡——所有玩家都意识到不克制的代价大于克制的收益。

我们离那个均衡点还很远。

比人强的 AI 该由谁掌控，这个问题比"Mythos 有多强"重要得多。

欢迎讨论。