如何构建你自己的 Agent Harness?

TL;DR · AI 摘要
生产级 Agent Harness 不能仅靠框架选型解决,必须系统性承担15项核心职责(如策略、审批、预算、trace等),且每项需设计为可安装、可版本化、可换语言的 worker 组件。
核心要点
- 生产级 Harness 需明确承担15项真实职责,远超框架封装能力
- 每项职责应实现为独立 worker:支持安装、版本管理与多语言运行
- 单次 turn 的完整执行流需整合策略、审批、预算与 trace 四大关键机制
结构提纲
按章节快速跳转。
生产级 Agent Harness 无法通过简单选用 LangChain 或 CrewAI 等框架解决,需自主构建底层能力。
包括策略控制、人工审批、预算限制、执行 trace、错误重试、安全沙箱等15项必须由 Harness 显式承担的功能。
每个职责模块应被封装为可独立安装、版本化管理、支持 Python/JS/Rust 等多语言运行的 worker 组件。
一次 agent 调用需串联策略决策、审批网关、预算校验与全链路 trace,形成闭环可审计的执行单元。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Agent Harness 设计核心
- 15项职责
- 策略控制
- 人工审批
- 预算限制
- Trace追踪
- 错误重试
- 安全沙箱
- Worker 架构
- 可安装(pip/npm)
- 可版本化(SemVer)
- 多语言支持(Py/JS/Rust)
- Turn 执行流
- 输入校验
- 策略决策
- 审批网关
- 执行引擎
- 结果归档+trace
金句 / Highlights
值得收藏与分享的关键句。
大多数 Agent 团队不构建 Harness,而是直接采用现成框架——但采用 ≠ 生产就绪。
每项职责必须实现为 worker:可安装、可版本化、语言无关(支持 Python/JS/Rust)。
单次 turn 必须整合策略执行、人工审批、预算防护与端到端 traceability,构成可审计闭环。
先看几个问题: · 生产级 Harness 是“选一个框架”就能搞定的吗? · 生产级 Harness 必须承担的 15 项真实职责是什么? · 每项职责如何做成可安装、可版本化、可换语言的 worker? · 单次 turn 如何跑通? · 策略、审批、预算、trace 在生产级 Harness https://t.co/lzfJn8WywX" / X
meng shao on X: "如何构建你自己的 Agent Harness? 先看几个问题: · 生产级 Harness 是“选一个框架”就能搞定的吗? · 生产级 Harness 必须承担的 15 项真实职责是什么? · 每项职责如何做成可安装、可版本化、可换语言的 worker? · 单次 turn 如何跑通? · 策略、审批、预算、trace 在生产级 Harness https://t.co/lzfJn8WywX" / X
Don’t miss what’s happening

Show translation
如何构建你自己的 Agent Harness?先看几个问题: · 生产级 Harness 是“选一个框架”就能搞定的吗? · 生产级 Harness 必须承担的 15 项真实职责是什么? · 每项职责如何做成可安装、可版本化、可换语言的 worker? · 单次 turn 如何跑通? · 策略、审批、预算、trace 在生产级 Harness 里为什么重要?
在他的「How to Build Your Own Agent Harness」中给出了完整答案,强烈建议阅读原文: https://iii.dev/blog/how-to-bu ild-your-own-agent-harness/…
Quote

@mfpiccolo
·
May 28
Article
How to build your own agent harness???
Most agent teams don't build a harness. They adopt one. LangChain, LangGraph, OpenAI Agents SDK, Anthropic SDK, CrewAI, AutoGen, the loop, the tools, the memory, and the orchestration are picked off...
·
21
44
197
292
Read 21 replies