MiroMind 团队发布了 MiroThinker-1.7 和 MiroThinker-H1,这是一代以验证为中心的重型研究智能体,在多个基准测试中创下新纪录。
技术突破
MiroThinker 系列在 BrowseComp、BrowseComp-ZH 和 FrontierScience 基准测试中创下最优性能,超越了 GPT 系列模型的表现。
验证中心架构
该系统的核心创新在于"验证中心"理念。传统 AI 系统往往缺乏自我验证能力,而 MiroThinker 内置多层次验证机制,确保研究结果的准确性和可靠性。
应用场景
MiroThinker 适用于需要深度研究、复杂推理和多步骤验证的专业场景,包括学术研究、商业分析和科学发现等领域。
开源计划
MiroMind 表示将逐步开放部分模型权重和研究论文,促进 AI 研究社区的合作与进步。