模型

GPT-4.5

Q: GPT-4.5 最近有什么新动态？

traeai 已收录 3 篇与 GPT-4.5 相关的内容。最新一篇是「开源一个我最近 Review AI Code 流程的 skills， review-forge https://t.co/lDHbd5Y9Je 我现在越来越发现 Review 的重要性，因为 AI ...」，由 Viking(@vikingmute) 发布。

别名：gpt4.5

作者使用的闭源大语言模型之一，用于生成 bug 报告（注：截至2024年GPT-4.5未公开，此处应为作者笔误或内部代号，可能指 GPT-4 Turbo 或类似版本）。

已跟踪 3 条高相关材料

TraeAI 观察

如果只读 3 篇

开源一个我最近 Review AI Code 流程的 skills， review-forge https://t.co/lDHbd5Y9Je 我现在越来越发现 Review 的重要性，因为 AI ...

Viking(@vikingmute) · 8.7 分

作者开源了 review-forge 工具链，通过多模型交叉评审（GPT-4.5/Compose2.5/DeepSeek-V4-Pro）、问题合成、人工决策、AI修复与验证闭环，有效控制AI生成代码失控风险；实测中该流程显著提升代码质量与可维护性。

Anthropic just dropped Opus 4.8... (WOAH)

Matthew Berman · 7.8 分

Anthropic发布Claude Opus 4.8，性能显著提升：SWE-bench Pro编码准确率达69.2%（较4.7版+5点），推理速度提升至2.5倍（约250 tokens/sec），并新增动态工作流与长时自主任务能力，价格维持不变。

Claude Opus 4.8 Full Breakdown & Testing (AI News You Can Use)

The AI Advantage · 7.2 分

Claude Opus 4.8是Anthropic对4.7版的快速修正，重点提升对模糊指令的理解能力以回归4.6的“用户友好”风格；虽在官方基准测试中表现优于GPT-4.5，但真实世界工程基准DeepSWE显示GPT-4.5当前更胜一筹，且4.8尚未参与该测试。

开源我最近 Review AI Code 的 skills：review-forge

Viking(@vikingmute)5月31日620 字 (约 3 分钟)

作者开源 review-forge 工具链，通过多模型交叉评审、问题合成、人工决策、AI修复与验证闭环，有效控制AI生成代码失控风险。

入选理由：review-forge 使用 GPT-4.5、Compose2.5 和 DeepSeek-V4-Pro 三模型并行生成 bug 报告，实现盲区互补与交叉验证。

精选推文#AI编程#代码审查#多模型协作#review-forge#DevOps中文

Anthropic just dropped Opus 4.8... (WOAH)

Anthropic刚刚发布了Opus 4.8……（哇！）

Matthew Berman5月29日4141 字 (约 17 分钟)

入选理由：Opus 4.8在SWE-bench Pro测试中达69.2%，比6周前发布的Opus 4.7提升5个百分点

精选视频#Anthropic#Claude#大语言模型#SWE-bench#AI编程英文

Claude Opus 4.8 Full Breakdown & Testing (AI News You Can Use)

Claude Opus 4.8 全面解析与实测（实用AI资讯）

The AI Advantage5月31日3130 字 (约 13 分钟)

入选理由：Opus 4.8通过增强歧义理解能力修正了4.7过度字面化的问题，目标是恢复4.6版本广受好评的‘vibes’体验。

精选视频#Claude#Anthropic#大模型评测#DeepSWE#Agentic AI英文

跨材料问答 · GPT-4.5

回答基于：GPT-4.5 相关 3 条材料