腾讯玄武实验室阿图因 AI 在 CyberGym 测试中超越 Mythos

腾讯玄武实验室宣布,其研发的阿图因 AI 在加州大学伯克利分校主导的 CyberGym 网络安全基准测试中获得 84.0% 的得分,超过 Anthropic 的 Claude Mythos Preview。该工具基于可本地部署的开源模型 GLM-5.1 构建,消耗的预算不到 Mythos「玻璃翼计划」的 0.1%。

阿图因 AI 还在 curl、gnark、OpenSSL、Python cryptography、Java bc-java 等重要项目中发现了多个 Mythos 未检出的高危逻辑漏洞,评分最高达 9.3。在伯克利 BVI 真实世界漏洞榜单中,阿图因 AI 的严重漏洞严重程度排名第 1,总数排名第 5。

腾讯玄武实验室

🌸 在花频道 · 茶馆水群 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
admin@oaibest.com