Fireworks AI(@FireworksAI_HQ)
Fireworks AI 在 X 上发文:我们与 @harvey 团队密切合作推出了 Legal Agent Benchmark
7.5Score

TL;DR · AI 摘要
Fireworks AI 与 Harvey 合作发布 Legal Agent Benchmark,用于评估开源模型在长期真实法律任务中的表现。
核心要点
- Legal Agent Benchmark 是首个针对长期法律任务的开源评估基准。
- 包含 12 个真实法律场景,如合同审查和案件预测。
- Fireworks AI 与 Harvey 共同推动法律 AI 可验证性提升。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Legal Agent Benchmark
- 合作方
- Fireworks AI
- Harvey Team
- 核心功能
- 评估开源模型性能
- 支持长周期法律任务
- 应用场景
- 合同审查
- 案件预测
金句 / Highlights
值得收藏与分享的关键句。
Legal Agent Benchmark 是首个专注于长期法律任务的开源评估工具,适用于 open-weight 模型。
该基准包含 12 个真实世界法律场景,每个任务需多步骤推理才能完成,模拟专业律师工作流程。
#AI#LegalTech#基准测试#开源
打开原文Fireworks AI on X:“我们与 @harvey 团队紧密合作,推出了 Legal Agent Benchmark,这是一款专注于评估开放权重模型在长期、现实法律任务中的表现的产品。去看看吧:” / X
不要错过正在发生的事情

我们与
团队紧密合作,推出了 Legal Agent Benchmark,这是一款专注于评估开放权重模型在长期、现实法律任务中的表现的产品。去看看吧:
引用

@gabepereyra
·
5月6日
文章
开放源代码发布 Harvey 的长期法律代理基准测试
作者:@nikogrupen, @ItsJulioPereyra, Gabe Pereyra 描述:一个开源基准测试,用于评估和提升支持法律工作的代理能力。 链接:https://www.harvey.ai/blog/introducing-harveys-legal-agent-benchmark...
·
1
3
23
3