Opus 4.7 最近有什么新动态？

traeai 已收录 23 篇与 Opus 4.7 相关的内容。最新一篇是「ai coding is getting expensive use more open models!」，由 Harrison Chase(@hwchase17) 发布。

模型

Opus 4.7

别名：Froptic

由Anthropic公司开发的AI模型。

已跟踪 23 条高相关材料

TraeAI 观察

如果只读 3 篇

ai coding is getting expensive use more open models!

Harrison Chase(@hwchase17) · 8.7 分

AI 编码成本正在飙升，使用开源模型可显著降低开支；Kimi K2.6 在 BaseTen 上比 Opus 4.7 便宜约 5 倍，且在多数任务中性能相当，推荐通过 deepagents-cli 测试开源模型。

Introducing deepsec: The security harness for finding vulnerabilities in your codebase

Vercel News · 8.7 分

Vercel 开源 deepsec，一个基于 AI 编程代理的安全扫描工具，可在本地运行，通过 Claude 和 Codex 深度分析代码库，自动识别高危漏洞并生成可操作修复建议，支持分布式执行与责任人追溯。

Key Technical Design Decisions for Building an Educational App with LLMs

freeCodeCamp.org · 8.5 分

作者使用Claude Code构建了一个教育应用，其中AI辅助活动创建是核心功能。作者分享了在构建过程中做出的一些关键技术决策，包括选择模型、数据库和API集成等。

ai coding is getting expensive

Harrison Chase(@hwchase17)5月9日121 字 (约 1 分钟)

入选理由：Kimi K2.6 在 BaseTen 上价格仅为 Opus 4.7 的 1/5

精选推文#AI 编码#开源模型#成本优化#Kimi#deepagents-cli中文

Introducing deepsec: The security harness for finding vulnerabilities in your codebase

Vercel News5月6日833 字 (约 4 分钟)

入选理由：deepsec 利用 Claude 和 Codex 等 AI 代理进行上下文感知的代码安全分析，显著提升漏洞发现准确率。

精选文章#AI安全#代码扫描#Vercel#Claude#Codex英文

Key Technical Design Decisions for Building an Educational App with LLMs

使用Claude Code构建教育应用的关键技术决策

freeCodeCamp.org6月4日2579 字 (约 11 分钟)

入选理由：选择模型时，作者选择了Opus 4.7，因为它具有高级功能，可以架构应用。

精选文章#React Native#Firebase#Claude Code中文

终于有了一个好的基准测试（Deep Suite）

Matthew Berman5月28日3734 字 (约 15 分钟)

Deep Suite 是一个软件工程基准测试，旨在提供比现有公共基准测试更准确的模型评估。它具有四个主要优势：无污染任务、高多样性、现实世界复杂性和可靠的验证。根据 Deep Suite 的测试，GPT 5.5 在性能上优于 Opus 4.7。

入选理由：Deep Suite 通过手写任务避免了模型在预训练期间看到解决方案的问题。

精选视频#AI#机器学习#深度学习#自然语言处理#软件工程中文

I think Anthropic and OpenAI have found product-market fit

Hacker News Best5月28日1867 字 (约 8 分钟)

文章认为 Anthropic 和 OpenAI 已经找到了产品市场契合点，通过提高 API 价格锁定企业客户。

入选理由：Anthropic 和 OpenAI 都提高了 API 价格，锁定企业客户。

精选文章#Anthropic#OpenAI#API 价格#企业客户#产品市场契合点英文

I think Anthropic and OpenAI have found product-market fit

Simon Willison's Weblog5月28日1867 字 (约 8 分钟)

Anthropic和OpenAI通过调整定价策略，表明它们已经找到了产品市场契合点，企业客户现在按API价格付费，而非之前的折扣价。

入选理由：Anthropic和OpenAI将企业客户的定价从折扣价改为API价格。

精选文章#Anthropic#OpenAI#产品市场契合点#定价策略#企业客户中文

30 Claude Features You Need to Know NOW (Become a PRO!)

30 个 Claude 必知特性：立即成为专家！

AI Master6月2日5729 字 (约 23 分钟)

本文介绍 Opus 4.7 模型的自适应推理模式及其触发方法，讲解结构化提示词框架和 XML 标签的应用，并演示如何让模型优化提示词。

入选理由：Opus 4.7 默认关闭自适应推理，需通过特定短语如 'think carefully' 触发。

精选视频#AI#提示工程#Opus 4.7#Claude#模型优化英文

i wrote a guide on optimizing context usage 6 months ago that i never posted. back then with the mod...

我写了关于优化上下文使用的指南

eric zakariasson(@ericzakariasson)5月22日233 字 (约 1 分钟)

AI模型的"智能、快速、便宜"三选二限制已被Cursor的Composer 2.5打破，该模型能够同时实现这三个特性。

入选理由：6个月前AI模型只能在智能、快速、便宜三个特性中选择两个，形成三选二的权衡三角

精选推文#AI模型#Cursor#Composer 2.5#基准测试英文

Open source is going to win

We already have an open-weights model competitive with GPT-5.5 and Opus...

开源将赢得胜利

Paul Couvert(@itsPaulAi)6月2日203 字 (约 1 分钟)

开源模型MiniMax M3已达到与GPT-5.5和Opus 4.7相当的性能，尤其在编码任务上优于Gemini 3.1 Pro，且成本仅为它们的1/10，其权重将于下周在Hugging Face开放。

入选理由：MiniMax M3在SWE Bench Pro上与GPT-5.5性能相当

精选推文#开源#AI模型#MiniMax M3#GPT-5.5#Gemini英文

So Alibaba has released Qwen-3.7-Max… and it’s really good.

Paul Couvert(@itsPaulAi)5月25日172 字 (约 1 分钟)

阿里推出Qwen-3.7-Max模型，在成本和性能上显著优于GPT-5.5和Opus 4.7，支持与Hermes Agent或OpenCode集成。

入选理由：Qwen-3.7-Max输出价格比Opus 4.7便宜3.3倍，比GPT-5.5便宜4倍。

精选推文#Alibaba#Qwen#LLM#AI Model#Cost Efficiency英文

Auggie 对比 Claude Code 基准测试：质量提升 33% 成本优势

Augment Code(@augmentcode)5月20日890 字 (约 4 分钟)

Augment Code 发布的基准测试显示，其 AI 编程助手 Auggie 在使用 Opus 4.7 模型时，以 67.4% 的通过率略高于 Claude Code 的 66.3%，同时成本降低约 33%，这主要归功于其 Context Engine 语义索引技术实现的精准检索和 token 效率优化。

入选理由：Auggie 在 Terminal Bench 2.0 上以 67.4% vs 66.3% 的通过率略胜 Claude Code，同时 token 使用量减少 32%，成本降低 33%

精选推文#AI编程助手#基准测试#成本优化#Token效率#Augment Code英文

How do people seek guidance from Claude? We looked at 1M conversations to understand what questions...

Anthropic(@AnthropicAI)5月1日299 字 (约 2 分钟)

Anthropic 分析了100万次对话，探究人们如何向 Claude 寻求指导，Claude 的回应方式及其谄媚倾向，并将这些发现应用于改进 Opus 4.7 和 Mythos Preview 的训练。

入选理由：分析了百万级对话数据，了解用户提问模式及AI回应特点。

精选推文#Anthropic#Claude#AI助手#对话系统#数据分析英文

Google Just Changed Forever. Here's Why...

The AI Advantage5月23日4296 字 (约 18 分钟)

Google 在 I/O 大会上发布了 Gemini 3.5 Flash 模型，主打速度优势并强化免费体验，成为用户从 ChatGPT 或 Claude 转移的潜在理由。

入选理由：Gemini 3.5 Flash 成为 Google Search 和 Gemini 默认模型，推理速度显著优于竞品。

精选视频#Google#Gemini#AI 模型#大模型竞争#免费额度英文

Wait so Qwen-3.7-max can beat both GPT-5.5 and Opus 4.7?!

While being waaay cheaper:

- 9x cheaper ...

等等，Qwen-3.7-max 竟然能打败 GPT-5.5 和 Opus 4.7？！而且便宜得多

Paul Couvert(@itsPaulAi)5月23日220 字 (约 1 分钟)

Qwen-3.7-max 在实际代理任务中超越了 GPT-5.5 和 Opus 4.7，且成本显著更低。

入选理由：Qwen-3.7-max 在自进化 Tetris 机器人任务中击败 GPT-5.5 和 Opus 4.7。

精选推文#Qwen#GPT#AI模型#性能评测#成本效益英文

昨晚用 Cursor (Opus 4.7) + Remotion 做一个视频，第一个版本完成后，问题比较多，字体和背景色重合、文字重叠等。。

meng shao(@shao__meng)5月11日464 字 (约 2 分钟)

开发者用 Cursor Opus 4.7 + Remotion 制作视频时发现初版存在字体与背景色冲突、文字重叠等问题，情绪化批评后意识到 Cursor Agent 实际已自动执行10轮画面检查，最终产出v10版本才满意，凸显AI工具自我验证机制的价值。

入选理由：Cursor Agent 在输出后自动执行10轮画面检查，但仍有不满意项需持续迭代

精选推文#Cursor#Remotion#AI Video#Agent#Developer Experience中文

Cursor新编码模型性能媲美Opus，价格低数十倍

AI HOT 精选5月19日418 字 (约 2 分钟)

Cursor自研编码模型Composer 2.5性能对标Opus 4.7，评分差距不到1分，但价格低10-30倍，在长任务、复杂指令遵循和协作顺滑度上较Composer 2有明显提升。

入选理由：Composer 2.5评分与Opus 4.7差距不足1分，性能处于同一区间

精选文章#Cursor#Composer 2.5#Opus 4.7#编码模型#AI编程工具中文

NEW Claude AI Tutorial — How to Use Anthropic’s Opus 4.7 (Updated Guide)

AI Master5月1日1617 字 (约 7 分钟)

该视频教程介绍如何使用Anthropic的Opus 4.7进行Claude AI操作，面向新手至进阶用户，内容已更新。

入选理由：针对Claude AI的最新教程，聚焦于Opus 4.7版本的使用方法。

精选视频#Claude AI#Anthropic#Opus 4.7#AI Tutorial#Video Guide英文

$Gemini 3.5 Flash actually beats Opus 4.7 on a handful of benchmarks (at a fraction of the cost): -T...$

Gemini 3.5 Flash在多个基准测试中击败Opus 4.7（成本仅为三分之一）

AI Breakfast(@AiBreakfast)5月21日96 字 (约 1 分钟)

Gemini 3.5 Flash在Terminal-bench 2.1等8个基准测试中性能超越Opus 4.7，且成本仅为后者的一半。

入选理由：Gemini 3.5 Flash在8个关键基准测试（包括Terminal-bench 2.1、MCP Atlas等）中性能优于Opus 4.7

精选推文#Gemini 3.5 Flash#Opus 4.7#模型比较#基准测试英文

This could solve the main issue with context windows Because this new model has a context window of...

Paul Couvert(@itsPaulAi)5月6日358 字 (约 2 分钟)

推文宣称新模型SubQ实现1200万token上下文窗口、98%准确率，速度提升52倍且成本仅Opus 4.7的5%，但未提供技术细节、评测方法或可验证数据。

入选理由：SubQ声称支持12M token超长上下文，仍保持98%准确率

精选推文#LLM#context window#sparse attention#SubQ中文

Another busy month in the books. Here’s what we shipped. - AI Autofill - Native Custom Agents on mo...

Notion(@NotionHQ)5月2日207 字 (约 1 分钟)

Notion 在 X 平台发布月度更新公告，罗列了 AI Autofill、Agent 2.0、移动端原生 Custom Agents 等十余项功能迭代，但无技术细节、架构说明或用户影响分析。

入选理由：本次更新以功能清单形式发布，缺乏原理、适用场景与性能数据

精选推文#Notion#AI Agent#Product Update中英混合

Opus 4.7 fast mode is live on OpenRouter!

Just set your model to `anthropic/claude-opus-4.7-fast`

...

OpenRouter 上线 Opus 4.7 快速模式！

OpenRouter(@OpenRouterAI)5月13日86 字 (约 1 分钟)

OpenRouter 推出了 Opus 4.7 快速模式，通过设置模型为 `anthropic/claude-opus-4.7-fast`，可以实现约 2.5 倍的吞吐量提升。

入选理由：设置模型为 `anthropic/claude-opus-4.7-fast` 可启用 Opus 4.7 快速模式。

精选推文#OpenRouter#Opus 4.7#AI 模型英文

SWEbench 已失效。

Matthew Berman6月2日212 字 (约 1 分钟)

SWEbench 基准测试已失效，GPT 5.5 在 Deep Suite 上以 70% 准确率领先 Opus 4.7 的 54%，而 SWEbench 显示相反趋势，表明基准不可靠。

入选理由：GPT 5.5 achieves 70% accuracy on Deep Suite, significantly outperforming Opus 4.7 at 54%.

精选视频#SWEbench#Deep Suite#GPT#Opus#Gemini英文

👀👀

Qwen(@Alibaba_Qwen)5月23日83 字 (约 1 分钟)

阿里通义千问官方账号转发了一条关于Qwen 3.7-max在Tetris机器人测试中表现优于Opus 4.7和GPT-5.5的消息，但缺乏具体的技术细节和验证信息。

入选理由：Qwen 3.7-max在Tetris自训练机器人测试中击败Opus 4.7和GPT-5.5

精选推文#Qwen#AI模型#性能测试中文

跨材料问答 · Opus 4.7

回答基于：Opus 4.7 相关 23 条材料