微软发布的 MD 系统完胜 GPT-5.5,漏洞检测能力惊人!

在网络安全日益重要的今天,微软自主代码安全团队于 5 月 13 日推出了一款名为 MDASH 的多模型智能体扫描框架。这一新系统的设计理念颠覆了传统的单一 AI 模型,采用了多智能体协作策略,以提升代码安全检测的准确性和效率。

MDASH 框架整合了超过 100 个基于不同前沿大模型或轻量化模型的专用 AI 智能体。这些智能体在整个漏洞检测过程中各司其职,包括代码准备、漏洞扫描、结果验证、数据去重、证据生成和补丁验证等环节。这种分工明确的设计使得系统在处理复杂的安全检测任务时,能够充分发挥每个模型的优势。

在权威的 CyberGym 公开基准测试中,MDASH 的表现引人瞩目,全面超越了 Anthropic 的 Mythos 模型和 OpenAI 的 GPT-5.5。经过多轮测试,MDASH 成功挖掘出 16 个之前未被发现的漏洞,其中包括 4 个高危的远程代码执行漏洞,展示了其强大的漏洞识别能力。

更令人惊叹的是,在面对人为植入的 21 个漏洞的私有测试驱动程序验证中,MDASH 实现了 100% 的识别率,同时零误报。这一成果表明,MDASH 不仅能够准确识别漏洞,还能有效减少误报现象,大大提升了安全检测的可靠性。

值得一提的是,回顾性测试数据显示,MDASH 在历史漏洞的召回率上也表现出色,对 clfs.sys 近五年的漏洞召回率高达 96%,对 tcpip.sys 则达到了 100%。这一数据充分证明了 MDASH 在漏洞检测领域的实力。

目前,MDASH 已经开始协助微软内部工程团队进行产品的安全加固,并已面向受限客户开启内部预览测试。可以预见一新系统将在未来的网络安全工作中发挥重要作用,保护用户的数字资产安全。

划重点:

🌟 MDASH 系统利用多智能体协作策略,整合了超过 100 个专用 AI 智能体,提升漏洞效率。

🔍 在 CyberGym 测试中,MDASH 成功发现 16 个新漏洞,超越了 GPT-5.5 和 Mythos 模型。

在私有测试中,MDASH 实现 100% 的漏洞识别率且误报,显示出其极高的准确性和可靠性。

via AI新闻资讯 (author: AI Base)
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
admin@oaibest.com