微软发布的 MD 系统完胜 GPT-5.5，漏洞检测能力惊人！在网络安全日益重要的今天，微软自主代码安全团队于 5 月 13 日推出了一款名为 MDASH 的多模型智能体扫描框架

微软发布的 MD 系统完胜 GPT-5.5，漏洞检测能力惊人！

在网络安全日益重要的今天，微软自主代码安全团队于 5 月 13 日推出了一款名为 MDASH 的多模型智能体扫描框架。这一新系统的设计理念颠覆了传统的单一 AI 模型，采用了多智能体协作策略，以提升代码安全检测的准确性和效率。

MDASH 框架整合了超过 100 个基于不同前沿大模型或轻量化模型的专用 AI 智能体。这些智能体在整个漏洞检测过程中各司其职，包括代码准备、漏洞扫描、结果验证、数据去重、证据生成和补丁验证等环节。这种分工明确的设计使得系统在处理复杂的安全检测任务时，能够充分发挥每个模型的优势。

在权威的 CyberGym 公开基准测试中，MDASH 的表现引人瞩目，全面超越了 Anthropic 的 Mythos 模型和 OpenAI 的 GPT-5.5。经过多轮测试，MDASH 成功挖掘出 16 个之前未被发现的漏洞，其中包括 4 个高危的远程代码执行漏洞，展示了其强大的漏洞识别能力。

更令人惊叹的是，在面对人为植入的 21 个漏洞的私有测试驱动程序验证中，MDASH 实现了 100% 的识别率，同时零误报。这一成果表明，MDASH 不仅能够准确识别漏洞，还能有效减少误报现象，大大提升了安全检测的可靠性。

值得一提的是，回顾性测试数据显示，MDASH 在历史漏洞的召回率上也表现出色，对 clfs.sys 近五年的漏洞召回率高达 96%，对 tcpip.sys 则达到了 100%。这一数据充分证明了 MDASH 在漏洞检测领域的实力。

目前，MDASH 已经开始协助微软内部工程团队进行产品的安全加固，并已面向受限客户开启内部预览测试。可以预见一新系统将在未来的网络安全工作中发挥重要作用，保护用户的数字资产安全。

划重点：

🌟 MDASH 系统利用多智能体协作策略，整合了超过 100 个专用 AI 智能体，提升漏洞效率。

🔍 在 CyberGym 测试中，MDASH 成功发现 16 个新漏洞，超越了 GPT-5.5 和 Mythos 模型。

✅ 在私有测试中，MDASH 实现 100% 的漏洞识别率且误报，显示出其极高的准确性和可靠性。

via AI新闻资讯 (author: AI Base)