Google DeepMind 发布 Aletheia：从数学竞赛到专业研究的 AI 智能体

Google DeepMind 团队发布了 Aletheia，这是一个专业研究 AI 智能体，旨在弥合竞赛级数学与专业研究之间的差距。

核心架构：智能体循环

Aletheia 由高级版 Gemini Deep Think 提供支持，采用三部分"智能体框架"来提高可靠性：

在 IMO-Proof Bench Advanced 上达到 95.1% 准确率，相比之前的 65.7% 记录有显著提升。同时在 FutureMath Basic（博士级练习的内部基准）上也展现了最先进的性能。

Aletheia 已为多项同行评审成果做出贡献：

允许模型在推理时使用更多计算资源（"更长时间思考"）可显著提高准确性。2026 年 1 月版的 Deep Think 与 2025 版相比，将奥数级问题所需的计算量减少了 100 倍。

阅读建议

先读完这一篇，再回到工具页按关键词筛选，你会更容易建立自己的试用顺序。

继续阅读

新加坡AI 创业

2026年3月18日

新加坡 AI 公司 Agnes AI 在国家 AI 战略加速推进的背景下，完成最新一轮融资 ARR 接近 2000 万美元，目标在 2026 年底前实现新加坡交易所上市。

AI 雷达编辑部

选型指南对话助手

2026年3月17日

第一次接触 AI 工具时，最容易犯的错不是选错产品，而是选了一个和自己工作方式不匹配的入口。

AI 雷达编辑部

企业级 AIAgent

2026年3月17日

阿里巴巴发布全球首个企业级 AI 原生工作平台"悟空"，让每个团队、每家公司都能拥有一支 24h 工作的"龙虾军团"。

AI 雷达编辑部