我们在BU Bench上测试了Minimax M3!
Browser Use(@browser_use)71 字 (约 1 分钟)
50
MiniMax M3在BU Bench测试中性能提升26%,达到Claude 4.6-sonnet和Gemini 3.5 Flash水平,但测试细节未公开。
入选理由:MiniMax M3在BU Bench上实现26%的性能提升,具体测试方法未详述。
精选推文#Minimax M3#BU Bench#AI模型测试英文
模型
已跟踪 1 条高相关材料
最近变化
2026-06-01 · MiniMax M3在BU Bench上实现26%的性能提升,具体测试方法未详述。
为什么值得关注
Claude 4.6-sonnet 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
已收录 1 条与 Claude 4.6-sonnet 相关的内容,按评分排序。
MiniMax M3在BU Bench测试中性能提升26%,达到Claude 4.6-sonnet和Gemini 3.5 Flash水平,但测试细节未公开。
入选理由:MiniMax M3在BU Bench上实现26%的性能提升,具体测试方法未详述。