T
traeai
登录

产品

Codex CLI

别名:Codex

OpenAI开源的代码代理评估harness,用于标准化编程任务评估环境。

已跟踪 7 条高相关材料

TraeAI 观察

相关材料

已收录 7 条与 Codex CLI 相关的内容,按评分排序。

A shared playbook for trustworthy third party evaluations

可信第三方评估的通用指南

OpenAI Blog2741 字 (约 11 分钟)
92

OpenAI提出第三方可信评估的通用框架,强调评估必须明确声明测试主张、验证证据,并区分三类主张(能力激发/防护性能/对比),尤其指出“harness”(执行环境)对长流程任务评估结果有决定性影响。

入选理由:评估报告必须明确说明所测试的主张类型:能力激发、防护性能或系统对比,三者需匹配不同harness设计。

精选文章#AI安全#模型评估#OpenAI#harness#第三方评测英文
https://t.co/ffV4apO5je

mem0 on X: “如何在Codex CLI中处理记忆” / X

mem0(@mem0ai)1519 字 (约 7 分钟)
85

文章详细介绍了Codex CLI中的记忆机制及其工作流程。

入选理由:Codex CLI 使用固定markdown文件存储记忆,不使用SQLite或索引。

精选推文#React#前端中文
Simon Willison's Weblog 图标

Codex CLI 0.128.0 adds /goal

Simon Willison's Weblog258 字 (约 2 分钟)
80

OpenAI的Codex CLI 0.128.0版本引入了/goal功能,允许用户设置目标,Codex将持续循环执行直至达成目标或令牌预算耗尽,类似于Ralph loop。

入选理由:新版本Codex CLI增加了/goal命令,实现持续任务执行至目标完成。

精选文章#OpenAI#Codex CLI#prompt engineering#coding agents中文
Simon Willison's Weblog 图标

datasette 1.0a29 发布

Simon Willison's Weblog166 字 (约 1 分钟)
75

datasette 1.0a29 发布,新增实用方法和修复多个 Bug。

入选理由:新增 TokenRestrictions.abbreviated 方法创建 '_r' 字典。

精选文章#datasette#开源#数据探索英文
Codex CLI 设置 Chatgpt 远程控制

Codex CLI 设置 Chatgpt 远程控制

歸藏(guizang.ai)(@op7418)116 字 (约 1 分钟)
55

文章介绍了如何通过修改配置文件和运行命令实现Codex CLI对Chatgpt的远程控制。

入选理由:通过修改~/.codex/config.toml添加[features]remote-control = true

精选推文#CLI#远程控制中文

跨材料问答 · Codex CLI

回答基于:Codex CLI 相关 7 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容