Fireworks AI 在 X 上发文：我们与 @harvey 团队密切合作推出了 Legal Agent Benchmark

Fireworks AI(@FireworksAI_HQ)

Fireworks AI(@FireworksAI_HQ)2026年5月6日

Fireworks AI 在 X 上发文：我们与 @harvey 团队密切合作推出了 Legal Agent Benchmark

7.5Score

TL;DR · AI 摘要

Fireworks AI 与 Harvey 合作发布 Legal Agent Benchmark，用于评估开源模型在长期真实法律任务中的表现。

核心要点

Legal Agent Benchmark 是首个针对长期法律任务的开源评估基准。
包含 12 个真实法律场景，如合同审查和案件预测。
Fireworks AI 与 Harvey 共同推动法律 AI 可验证性提升。

结构提纲

按章节快速跳转。

§项目背景
Fireworks AI 与 Harvey 团队合作开发法律代理评估基准以填补行业空白。
·核心目标
衡量开源模型在复杂、长周期法律任务中的实际表现能力。
›评估范围
涵盖合同分析、法规解读等 12 个真实法律工作流，强调多步推理。
·技术贡献
提供开源数据集与评分机制，促进社区对法律 AI 的持续改进。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Legal Agent Benchmark
- 合作方
  - Fireworks AI
  - Harvey Team
- 核心功能
  - 评估开源模型性能
  - 支持长周期法律任务
- 应用场景
  - 合同审查
  - 案件预测

金句 / Highlights

值得收藏与分享的关键句。

Legal Agent Benchmark 是首个专注于长期法律任务的开源评估工具，适用于 open-weight 模型。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
该基准包含 12 个真实世界法律场景，每个任务需多步骤推理才能完成，模拟专业律师工作流程。
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X

#AI#LegalTech#基准测试#开源

打开原文

Fireworks AI on X：“我们与 @harvey 团队紧密合作，推出了 Legal Agent Benchmark，这是一款专注于评估开放权重模型在长期、现实法律任务中的表现的产品。去看看吧：” / X

不要错过正在发生的事情

Fireworks AI

@FireworksAI_HQ

我们与

@harvey

团队紧密合作，推出了 Legal Agent Benchmark，这是一款专注于评估开放权重模型在长期、现实法律任务中的表现的产品。去看看吧：

引用

Gabe Pereyra

@gabepereyra

·

5月6日

文章

开放源代码发布 Harvey 的长期法律代理基准测试

作者：@nikogrupen, @ItsJulioPereyra, Gabe Pereyra 描述：一个开源基准测试，用于评估和提升支持法律工作的代理能力。链接：https://www.harvey.ai/blog/introducing-harveys-legal-agent-benchmark...

2026年5月6日晚上6:20

·

165.5K 次观看

1

3

23

3