Anthropic 推出 Claude Mythos,凭借简明证明攻克 Erdős 数学猜想

5月26日,Anthropic 工程师 Sholto Douglas 在 X 平台宣布,其最新模型 Claude Mythos 成功通过一个“巧妙而简洁的证明”解决了组合几何领域的百年历史难题——Erdős 单位距离猜想。这一突破紧随 OpenAI 日前利用 GPT-5.5攻克该里程碑式数学难题之后,标志着头部 AI 厂商在纯数学发现领域的竞争已进入白热化阶段。

此次突破展现了不同于传统单一模型的智能体协同范式。据悉,团队构建了一个包含多个独立 Claude Code 实例的自动化测试系统。在该系统内,具备 Mythos 访问权限的智能体实例负责接收问题并生成不同的解决方案路径,随后由另一个实例进行汇总并分发给其余独立运行的实例进行交叉验证。

尽管数学家 Daniel Litt 评价 Mythos 的初始结果在绝对表现上“略逊于” OpenAI 的解法,但该模型最终成功找到了与 OpenAI 相同的解题路径,并且独立推导出了更具独创性的精简证明。目前,Anthropic 已正式发布由 Opus4.7整理完成的证明版本。

这一进展再次引发了行业对于“纯大语言模型(LLM)”与“符号推理辅助系统”发展路线的讨论。此前,谷歌 DeepMind 曾宣布利用其 AlphaProof Nexus 系统攻克了9个 Erdős 问题,但因其高度依赖 Lean 形式化证明语言,在纯粹的生成式 AI 领域引发了关于自主推理含金量的争议。

相比之下,Claude Code 作为一种智能体(Agent)框架,正通过多智能体协同攻克人类顶级科学难题。当前 AI 领域正经历剧烈的范式变革,菲尔兹奖得主近日亦证实 ChatGPT5.5Pro 已能在两小时内自主完成博士级数学研究。随着 Claude Mythos 与 GPT-5.5在算法发现和系统漏洞利用等前沿领域展现出自主演进能力,AI 正在从早期的“提示词工程”阶段全面迈向具备深度逻辑推理与科学探索能力的自主智能体时代。

via AI新闻资讯 (author: AI Base)
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
admin@oaibest.com