金融服务业的智能代理
Anthropic推出10个专为金融服务业设计的Claude智能代理模板,集成Excel、PPT、Word等Microsoft 365工具,实现KYC筛查、月结闭账、投研报告自动生成,显著缩短人工流程,提升合规与效率。
入选理由:Claude智能代理可自动完成投研报告生成、KYC筛查、月结闭账等高重复性金融任务,减少人工耗时80%以上。
模型
别名:Claude Opus、Claude4.7
由 Anthropic 提供的 Claude 系列 Opus 版本 4.7,作为稀疏顾问使用。
已跟踪 22 条高相关材料
最近变化
2026-06-03 · 在 Harvey 法务代理基准上,GLM 5.1 + Claude Opus 4.7 稀疏顾问方案全对数达 18/100。
为什么值得关注
Claude Opus 4.7 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Agents for financial services and insurance
Anthropic News · 9.2 分
Anthropic 推出10个专为金融服务业设计的Claude智能代理模板,集成Excel、PPT、Word等Microsoft 365工具,实现KYC筛查、月结闭账、投研报告自动生成,显著缩短人工流程,提升合规与效率。
Claude Opus 4.7 just implemented an AlphaZero-style self-play pipeline from scratch. It did this on...
elvis(@omarsar0) · 9.2 分
Claude Opus 4.7 在消费级硬件上三小时内从零实现 AlphaZero 风格自博弈管道,7/8 胜 Pascal Pons 连四求解器,首次验证大模型可自主构建完整 ML 系统。
Frontier models are powerful advisors. On @harvey's Legal Agent Benchmark, a GLM 5.1 worker using C...
Fireworks AI(@FireworksAI_HQ) · 8.7 分
Fireworks AI 通过“harness + advisor”架构,在 Harvey 法务代理基准上以 Claude Opus 4.7 为稀疏顾问,将 GLM 5.1 工作者性能提升至 18/100 全对,成本仅为 Opus 39%。
已收录 22 条与 Claude Opus 4.7 相关的内容,按评分排序。
Anthropic推出10个专为金融服务业设计的Claude智能代理模板,集成Excel、PPT、Word等Microsoft 365工具,实现KYC筛查、月结闭账、投研报告自动生成,显著缩短人工流程,提升合规与效率。
入选理由:Claude智能代理可自动完成投研报告生成、KYC筛查、月结闭账等高重复性金融任务,减少人工耗时80%以上。
Claude Opus 4.7 在消费级硬件上三小时内从零实现 AlphaZero 风格自博弈管道,7/8 胜 Pascal Pons 连四求解器,首次验证大模型可自主构建完整 ML 系统。
入选理由:Claude Opus 4.7 首次在无预置代码前提下,自主实现含 MCTS、神经策略/价值网络、自博弈与训练调度的 AlphaZero 全栈系统。
Fireworks AI 通过“harness + advisor”架构,在 Harvey 法务代理基准上以 Claude Opus 4.7 为稀疏顾问,将 GLM 5.1 工作者性能提升至 18/100 全对,成本仅为 Opus 的 39%。
入选理由:在 Harvey 法务代理基准上,GLM 5.1 + Claude Opus 4.7 稀疏顾问方案全对数达 18/100。
Google发布Gemini 3.5 Flash,定价是前代Flash-Lite的6倍,却广泛部署于搜索、AI助手和企业平台,反映大模型厂商正通过高价模型试探API客户支付意愿。
入选理由:Gemini 3.5 Flash输入价格为$1.50/百万token,输出为$9/百万token,是3.1 Flash-Lite的6倍。
AI已让Rust、Go等系统语言开发效率飙升,使Python的生态优势被削弱,开发者需重新评估语言选型策略。
入选理由:2026年GPT-5.5等模型在SWE-bench Verified上达到80%以上通过率,标志着AI已能高效编写系统级代码。
ITBench-AA 是一个针对企业级自动化 IT 任务的新基准测试,首次评估前沿模型在 Site Reliability Engineering 任务中的表现,结果显示所有前沿模型得分低于 50%,其中 Claude Opus 4.7 表现最佳,为 47%。
入选理由:Claude Opus 4.7 在 ITBench-AA 中表现最佳,得分为 47%
攻击者通过间接提示注入在中毒技能中利用Microsoft Copilot Cowork从M365中窃取文件,成功率高。
入选理由:攻击者利用邮件和Teams消息无需人工审批的特性进行文件窃取。
ChatGPT 5.5通过全新的预训练基础模型和多项创新功能(如约束、代理架构、自动记忆),在推理效率、多模态处理和用户体验上显著超越前代,成为当前性价比最高的语言模型。
入选理由:ChatGPT 5.5的预训练基础模型使其推理能力提升40%,比Claude Opus 4.7在$20/月套餐下表现更优。
ProgramBench 是当前最难的 AI 编程基准测试,要求模型仅凭二进制文件和文档从零重写程序;Claude Opus 4.7 在‘接近完成’指标上达 3%,GPT-5 和 Gemini 系列均为 0%。
入选理由:ProgramBench 要求 AI 从编译后的二进制文件+文档重构源码,无反编译、无联网,难度远超传统编程任务。
软件开发出现了第三种方式——'神秘屋',即利用AI进行高度个性化、缺乏规划的开发。同时,文章还介绍了大模型流行度排行榜和几项科技动态。
入选理由:软件开发第三种方式:'神秘屋',通过AI实现高度个性化的开发。
Google 在 I/O 2026 发布了多个 AI 更新,包括更快更便宜的 Gemini 3.5 Flash 和功能强大的多模态模型 Gemini Omni,引发社区热议。
入选理由:Gemini 3.5 Flash 模型速度比 3.1 Pro 快两倍以上,API 定价为输入 $150/百万 tokens。
文章分析了文本竞技场排名前五的实验室及其模型,展示了前沿模型在不同领域的优势和权衡。AnthropicAI的Claude Opus 4.7表现最为全面,而Google DeepMind的Gemini 3.1 Pro在创意写作方面尤为突出。
入选理由:AnthropicAI的Claude Opus 4.7在几乎所有主要类别中都表现出色,是最具统治力的模型。
使用 Coding Agent 开发新功能时,重点在于规划阶段,通过多个模型生成计划并选择最佳方案,确保后续开发顺利进行。
入选理由:开发新功能前先整理需求,使用多个 Agent 生成计划。
Cursor发布Composer 2.5模型,以Kimi为基础并投入85%总算力进行自研训练,性能接近Claude Opus 4.7但成本仅为十分之一,通过定向反馈RL和25倍合成数据实现技术突破。
入选理由:Composer 2.5在SWE-Bench等基准测试中表现接近Claude Opus 4.7,但价格仅为后者的1/10。
AI 可通过 GenSpark 平台调用多个专业代理(如研究、语音脚本、呼叫代理等)自动拨打 100 个英国水管工电话,以验证其作为 24/7 接待员的商业化潜力;实验中 AI 成功引导用户跳转至预约页面,但未披露最终转化数据。
入选理由:使用 GenSpark 构建多代理 AI 系统,整合研究、Stripe、语音脚本、呼叫、收件箱等 6 类代理。
作者分享了他当前最喜爱的 AI 模型,并强调会根据任务需求和模型表现灵活切换。
入选理由:GPT-5.5 是目前作者首选的语言模型,因其多功能性。
Claude Opus 4.7 (快速模式) 现已上线 Windsurf,输出速度提升约 2.5 倍。
入选理由:Claude Opus 4.7 (fast mode) 已在 Windsurf 上线。
Cursor 推出了 Claude Opus 4.7 的快速模式,速度提升 2.5 倍但成本增加 6 倍,推荐大多数任务使用标准速度。
入选理由:Claude Opus 4.7 快速模式速度提升 2.5 倍。
文章质疑SWEbench基准测试的可信度,指出GPT-5.5在DeepSuite中表现远超Claude Opus 4.7,但SWEbench结果却显示相反,表明该测试可能已失效。
入选理由:SWEbench测试结果被质疑,GPT-5.5在DeepSuite中得分为70%,显著高于Claude Opus 4.7的54%。
Claude Opus 4.7 在 v0 版本中新增了快速模式。
入选理由:Claude Opus 4.7 增加了快速模式。
DeepSeek V4被宣传为接近SOTA、开源、极低成本($1.74/百万token)且支持本地部署的AI模型,但原文无技术细节、实测数据或架构说明,属典型短视频营销话术。
入选理由:宣称DeepSeek V4成本仅为GPT-5.5和Claude Opus的约1/3
Eric Zakariasson 宣布在 Cursor 中推出了 Claude Opus 4.7 的快速模式,速度提升 2.5 倍但成本增加 6 倍。
入选理由:Claude Opus 4.7 快速模式速度提升 2.5 倍。