Mozilla 用 Anthropic 的 Mythos 一口气修了 Firefox 271 个漏洞:AI 安全审计时代来了

摘要:Mozilla 在 Firefox 150 版本中一次性修复了 271 个由 Anthropic Mythos 模型发现的安全漏洞。这不只是一个数字,它标志着软件安全审计正式进入 AI 工业化时代——防守方第一次有了赢的可能。

“几个月前,计算机完全做不到这件事。现在,它们在这方面已经出类拔萃了。”

这句话出自 Firefox 首席技术官 Bobby Holley 之口。他说这话的时候,Mozilla 刚刚完成了一件让整个安全行业都感到"眩晕"的事情——在本周发布的 Firefox 150 中,一次性修复了 271 个安全漏洞,全部由 Anthropic 的 Mythos Preview 模型发现。

要知道,就在不久前的 Firefox 148 版本中,Mozilla 使用 Anthropic 的 Opus 4.6 模型做了同样的事情,那次只找到了 22 个漏洞。从 22 到 271,不到两个版本的跨度,漏洞发现数量暴增了 12 倍。

这不是一个简单的"AI 又进步了"的故事。它揭示的是一个正在发生的结构性变化:软件安全的攻防平衡,正在被 AI 彻底重写。

一、271 个漏洞意味着什么

先说一个背景。Firefox 是全球使用最广泛的开源浏览器之一,它的代码库经过了几十年的人工审计、模糊测试(fuzzing)和外部安全研究人员的反复锤炼。在这样一个"久经沙场"的项目里,一次性找到 271 个安全漏洞,这个数字本身就足够让人震惊。

Bobby Holley 在博客中写道:“对于一个经过加固的目标来说,哪怕只找到一个这样的漏洞,在 2025 年都会触发红色警报。一次出现这么多,你不得不停下来想想,我们到底还能不能跟上。”

但他紧接着话锋一转:“我们的工作还没有完成,但我们已经转过了弯道,能够看到一个比’勉强跟上’好得多的未来。”

这种"先恐惧、后乐观"的态度,恰恰是这件事最值得关注的地方。

二、Mythos 做了什么,为什么比传统方法强这么多

过去几十年,软件安全领域的漏洞发现主要依赖两条路径:

第一条是自动化工具,最典型的就是模糊测试。简单来说,就是用程序自动生成大量随机输入,喂给目标软件,看它会不会崩溃。这种方法效率高,但有一个致命缺陷——它只能发现"表面"的问题,对于那些需要理解代码逻辑才能发现的深层漏洞,模糊测试基本无能为力。

第二条是人工审计。顶级安全研究员通过阅读源代码、理解程序逻辑来发现漏洞。这种方法能找到模糊测试找不到的深层问题,但瓶颈也很明显——太慢、太贵、太依赖稀缺的人类专家。

Holley 把这个困境总结得很精辟:“一直以来,存在一类漏洞,人类分析能找到但自动化工具找不到。所以如果你是一个威胁行为者,只要愿意花几百万美元,总能找到一个漏洞——我们能做的只是尽量把这个价格抬高。”

Mythos 打破了这个僵局。它不是传统的模糊测试工具,而是一个能够"阅读"和"推理"源代码的 AI 模型。它做的事情本质上和顶级安全研究员一样——通过理解代码逻辑来发现漏洞——但速度和覆盖范围完全不在一个量级。

Holley 的原话是:“顶级安全研究员之所以能找到模糊测试找不到的漏洞,主要靠的是对源代码的推理。这很有效,但耗时且受限于稀缺的人类专家。几个月前计算机完全做不到这件事,现在它们已经出类拔萃了。我们有多年评估世界顶级安全研究员工作的经验,Mythos Preview 的能力与他们不相上下。到目前为止,我们没有发现任何一类人类能找到但这个模型找不到的漏洞。”

这段话的分量极重。它意味着,在漏洞发现这个领域,AI 已经追平了人类最顶尖的水平,而且在速度和成本上有着碾压性的优势。

三、防守方第一次有了赢的可能

长期以来,网络安全领域有一个令人沮丧的共识:防守方永远处于劣势。

原因很简单——攻击者只需要找到一个漏洞就够了,而防守方需要堵住所有漏洞。这种不对称性意味着,安全团队能做的最好的事情,就是把攻击成本抬到足够高,让大多数攻击者觉得不划算。

但 Mythos 改变了这个等式。

Holley 的分析是这样的:“机器可发现的漏洞和人类可发现的漏洞之间的差距,一直有利于攻击者——攻击者可以集中数月的昂贵人力去找一个漏洞。缩小这个差距,就是在侵蚀攻击者的长期优势,因为所有发现都变得廉价了。”

换句话说,当 AI 能够以极低的成本批量发现漏洞时,防守方可以先于攻击者把这些漏洞全部修掉。漏洞的"库存"是有限的,如果防守方能够更快地清空这个库存,攻击者的优势就会被大幅削弱。

Holley 甚至用了加粗加斜体来强调一个判断:“令人鼓舞的是,我们也没有看到任何一个漏洞是顶级人类研究员找不到的。”

这句话的潜台词是:AI 没有发现什么"超越人类理解"的新型漏洞。它找到的都是人类理论上能找到、但因为时间和精力限制而没找到的问题。这意味着,漏洞的总量是有限的、可穷尽的。

"像 Firefox 这样的软件是以模块化方式设计的,目的就是让人类能够推理其正确性。它很复杂,但不是无限复杂的。"Holley 写道,“缺陷是有限的,我们正在进入一个终于可以把它们全部找出来的世界。”

四、开源世界的危机与机遇

如果说 Firefox 这样有组织、有资源的项目都被 Mythos 找出了 271 个漏洞,那么那些由一两个志愿者维护的开源项目呢?

这正是 Mozilla CTO Raffi Krikorian 在《纽约时报》发表的评论文章中提出的核心担忧。

"底层的经济学没有改变,"Krikorian 写道,“世界上最有价值的软件基础设施,继续由免费工作的人维护,而建立在其上的公司从未为其维护付过费。现在一种强大的新能力到来了——正如我们在科技行业反复看到的,有资源的组织会率先获得它并学会保护自己,而其他人则被留在脆弱之中。”

这段话直指一个残酷的现实:AI 安全审计工具的出现,可能会加剧开源生态中已经存在的不平等。大公司有钱、有人、有渠道获得最新的 AI 工具,可以快速修复自己的代码。但那些支撑着整个互联网基础设施的小型开源项目,它们的维护者可能连 Mythos 的访问权限都没有。

Holley 也承认了这个问题的严重性:“我跟一些大公司的工程负责人聊过,他们说接下来六个月要把几千名工程师从其他项目上抽调过来专门做这件事。所以这对整个行业来说都是一个巨大的挑战,而真正令人担忧的是那些小项目和开源社区。”

他说 Firefox 团队正在通过正式和非正式的渠道,尽可能多地与开源维护者分享知识和工具。“但归根结底,开源的问题是一个人的问题。技术能做的事情是有限的——需要整个行业和所有人一起来。”

五、每一行代码都要过这一关

Holley 提出了一个值得所有软件从业者深思的判断:“每一款软件都将不得不经历这个转变,因为每一款软件的表面之下都埋藏着大量现在可以被发现的漏洞。”

他把这个过程比作一个"训练营"——所有软件迟早都要经历一轮 AI 驱动的安全审计洗礼。Anthropic 和 OpenAI 这样的公司,目前正在试图让尽可能多的重要项目在 AI 能力被广泛获取之前完成这个过程。

"这是一个过渡性的时刻,它很困难,需要协调的专注和大量的毅力才能度过,但我相信这是一个有限的时刻,"Holley 说,“即使模型变得更先进,更先进的模型可能会在这里或那里多找到一些东西,但我相信,至少在 Firefox 这边,因为我们有了一点先发优势,我们已经转过了弯道。”

六、对工业软件的启示

这件事对我们工业智能领域同样有深远的启示。

工业软件——无论是 CAE 仿真、SCADA 系统还是 PLC 编程环境——同样面临着大量历史遗留代码和安全隐患。很多工业控制系统的代码库比 Firefox 还要古老,而且由于行业特殊性,安全审计的频率和深度远不如互联网软件。

如果 AI 安全审计工具能够以这样的效率发现浏览器中的漏洞,那么它们在工业软件中的应用前景同样巨大。对于正在推进智能制造和工业互联网的中国企业来说,这既是一个警示——你的工业系统可能比你想象的更脆弱——也是一个机遇——率先引入 AI 安全审计,可以建立真正的安全护城河。

Mozilla 的这次实践证明了一件事:AI 不是在取代安全工程师,而是在给防守方一件前所未有的武器。问题只在于,谁先拿起它。

分享到