返回首页
最新
我最初只是随便玩弄 pi-autoresearch。给它设定了一个样本任务,构建一个最便携的编码代理。
第一次尝试是 6 KB 的 shell。对于一次性任务来说很不错,但交互使用时就没法用了。我很震惊它居然真的能工作。
开始逐步构建——添加功能——但我给自己设定了一个规则:不引入新的依赖,代码行数不超过 500。这东西必须真正便携。只使用 sh、curl 和 awk。仅限系统原语。
这意味着我在 awk 中做了一些非常恶心的事情,包括 JSON 解析和 OpenAI 响应工具循环,推理项在回合之间传递。
现在大约有 400 行代码。在这个框架中:Anthropic + OpenAI,7 个工具(bash、read、write、edit、grep、find、ls),REPL、自动压缩、检查点/恢复、管道模式,90 个无 API 测试。不在框架中的有:TUI、流式处理、图像、OAuth、Windows、尊严。
两个诚实的事实:
1. 我窃取/修改了系统提示和架构。Pi/Claude/Codex 写了 awk。我无法阅读大部分代码。一年前我是做不到的。
2. 深受 Pi(pi.dev)的启发——相同的 7 个工具界面,完全相同的文本编辑模型。应当给予应有的认可。Pi 非常棒——你可能应该使用他们的工具。
代理循环本身很小。几乎所有其他“真实”代理 CLI 的内容都是开发体验和加固。你可能可以完全按照自己的喜好构建自己的工具框架。Mario Zechner 的 AI 工程师演讲让我在这方面有所启发。
这个名字是因为它是一个 .sh 文件。另一个听起来像的东西,遗憾的是,也同样准确。
嗨,HN,我是Pratik Garg。我的背景故事是,我创建了OneRequest,因为我在工作中以及个人生活中经常遇到同样的问题。每当我需要从某人那里获取专业文件、签署表格或某种证明时,这总是变成一连串的电子邮件、遗漏的附件和手动追踪;而当有人想要从我这里获取信息时,情况也是如此。随着时间的推移,事情变得杂乱无章,最终消失不见。
我寻找了一款能够妥善处理这些问题的工具,但没有找到合适的。DocuSign仅用于签名,并假设双方都有账户。Google表单无法追踪谁回应了,也无法进行追踪。电子邮件完全没有可见性,随后又出现了WhatsApp的麻烦(所有信息都在一个聊天线程中,没有追踪、没有审计记录,六个月后根本无法找到)。
因此,我创建了OneRequest。你可以创建一个请求,添加所需的字段,并为接收者附上相关背景信息。你会得到一个链接。接收者打开链接,提交所有信息,无需在他们那边注册账户。你可以看到谁打开了链接,谁提交了,谁在拖延,并且只需一键就能提醒某人。
这个系统是双向的。同一个收件箱显示你发送的请求和发送给你的请求。如果你在追踪候选人提供文件,而你的会计师在追踪你提供税务文件,所有内容都在一个统一的收件箱中,所有请求都集中在一个地方。
一些可能会引起读者兴趣的技术细节(也是我感兴趣的):
- 基于Next.js 14、Supabase、Prisma和Clerk构建
- 双向线程模型,允许请求者在初始提交后请求额外信息,因此一个链接可以保留所有正在进行的对话。
- 字段类型包括文件上传、签名、预订、支付、可用性调查、通过Claude API提取文档
- 我从一开始就内置了分析功能,因为我真心想了解信息在不同人之间是如何流动的。哪些字段类型被放弃了,接收者在哪里掉队,提交之前需要多少次提醒。我还不知道我将如何利用这些数据,但我感觉这些模式会很有趣。
有趣的是:昨天上线后,网站一直崩溃。我发现生产环境中有一个setInterval延迟为25 * 24 * 60 * 60 * 1000毫秒。这是2,160,000,000毫秒,超过了int32的最大值。浏览器将其限制为1毫秒。每秒发出数百个请求,导致网站崩溃。我花了5个小时找到这个问题,显然只需要一行代码就能修复。
现在还很早,仍有一些粗糙的地方。希望能得到反馈,看看这个概念是否清晰,以及体验在哪些地方出现了问题。你可以在onerequest.app上创建请求,而无需注册。