T
traeai
登录

论文

AIME 2025

别名:AIME 2025 测试、通用推理基准

衡量 AI 模型通用推理能力的关键测试,MAI-Thinking-1 在此测试中达到 97% 的准确率。

已跟踪 1 条高相关材料

TraeAI 观察

最近变化

2026-06-02 · MAI-Thinking-1 是一款拥有 35B 参数的 MoE 模型,在 AIME 2025 上达到 97% 的准确率,优于 Sonnet 4.6。

为什么值得关注

AIME 2025 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

AIFrontier TuningMAISWE Bench Pro微软

相关材料

已收录 1 条与 AIME 2025 相关的内容,按评分排序。

Super excited to announce seven new world-class MAI models today. They represent what we consider a ...

Mustafa Suleyman 宣布推出七款全新 MAI 模型

Mustafa Suleyman(@mustafasuleyman)448 字 (约 2 分钟)
75

Mustafa Suleyman 宣布推出七款全新 MAI 模型,包括 MAI-Thinking-1、MAI-Image-2.5 和 MAI-Code-1-Flash,这些模型在推理、图像编辑和代码生成等领域表现出色。

入选理由:MAI-Thinking-1 是一款拥有 35B 参数的 MoE 模型,在 AIME 2025 上达到 97% 的准确率,优于 Sonnet 4.6。

精选推文#AI#模型#微软#MAI#芯片英文

跨材料问答 · AIME 2025

回答基于:AIME 2025 相关 1 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容