4作者: nahimn2 个月前原帖
我最初只是随便玩弄 pi-autoresearch。给它设定了一个样本任务,构建一个最便携的编码代理。 第一次尝试是 6 KB 的 shell。对于一次性任务来说很不错,但交互使用时就没法用了。我很震惊它居然真的能工作。 开始逐步构建——添加功能——但我给自己设定了一个规则:不引入新的依赖,代码行数不超过 500。这东西必须真正便携。只使用 sh、curl 和 awk。仅限系统原语。 这意味着我在 awk 中做了一些非常恶心的事情,包括 JSON 解析和 OpenAI 响应工具循环,推理项在回合之间传递。 现在大约有 400 行代码。在这个框架中:Anthropic + OpenAI,7 个工具(bash、read、write、edit、grep、find、ls),REPL、自动压缩、检查点/恢复、管道模式,90 个无 API 测试。不在框架中的有:TUI、流式处理、图像、OAuth、Windows、尊严。 两个诚实的事实: 1. 我窃取/修改了系统提示和架构。Pi/Claude/Codex 写了 awk。我无法阅读大部分代码。一年前我是做不到的。 2. 深受 Pi(pi.dev)的启发——相同的 7 个工具界面,完全相同的文本编辑模型。应当给予应有的认可。Pi 非常棒——你可能应该使用他们的工具。 代理循环本身很小。几乎所有其他“真实”代理 CLI 的内容都是开发体验和加固。你可能可以完全按照自己的喜好构建自己的工具框架。Mario Zechner 的 AI 工程师演讲让我在这方面有所启发。 这个名字是因为它是一个 .sh 文件。另一个听起来像的东西,遗憾的是,也同样准确。