2作者: amit_paz5 天前原帖
我开始时提出了一个问题:现有的基础设施是为人类构建的,但现在需要为人工智能代理工作的是哪些?表单似乎是一个显而易见的答案。 问题在于,人工智能代理可以填写大部分表单,但某些字段仍然需要人类来完成,比如签名、文件上传以及任何主观内容。而现有的表单工具要么是完全自动化的,要么是完全手动的,没有什么能够很好地处理这种交接。 因此,FormBridge 基本上是为代理与人类之间的交接提供的表单基础设施。代理通过 API 创建提交,填写它所知道的内容,然后返回一个 URL。人类打开链接,查看已经填写的内容(并带有小徽章显示是谁填写的),完成剩余部分后提交。然后,它会经过验证、可选的审批、Webhook 等等。 我对几个决策感到满意: - 字段级归属:每个字段都知道是哪个参与者(代理、人类、系统)在何时进行了操作。 - 旋转简历令牌:每次状态变化时,URL 令牌都会旋转,因此过期的链接会停止工作。 - 内置 MCP 服务器:它会根据你的表单定义自动生成 MCP 工具,因此代理可以在无需额外设置的情况下发现和使用表单。 - 模式灵活性:你可以将 Zod、JSON Schema 或 OpenAPI 规范应用于它,它会在内部进行规范化。 技术栈包括 TypeScript、Hono 用于 HTTP、React 用于表单 UI,存储可替换(开发时使用内存,生产时使用 SQLite,文件存储使用 S3)。共有 1,339 个测试,覆盖率为 85.9%。 我在大约一周内独立完成了这个项目。如果有人感兴趣,我很乐意讨论架构或交接模型。
1作者: sankar_builds5 天前原帖
嗨,HN, 我创建了 Jetcaller([https://jetcaller.com](https://jetcaller.com)),这是一个简单的网页应用,可以直接从浏览器拨打国际电话——无需安装或使用SIM卡。 我是在远程工作时厌倦了繁琐的国际电话设置后开发这个应用的。我故意保持其简洁,并选择尽早发布,而不是过度开发。 现在它已经上线,仍处于早期阶段。希望能得到大家对其实用性或任何觉得不必要的功能的反馈。 欢迎提问。 — Sankar
2作者: soyadiaoune5 天前原帖
我开发了 claw-daw:一个可以通过终端驱动的小型 MIDI 数字音频工作站(TUI + 无头脚本)。<p>动机:我希望实现“像编码一样的音乐创作”——可复现、可比较和便于自动化。相同的脚本 + 相同的种子 → 相同的节拍。<p>功能:<p>• 离线使用(FluidSynth + SoundFont) + ffmpeg 导出 • 确定性渲染,便于迭代/代理管道 • WAV/MP3/MIDI 导出 • 项目以 JSON 格式存储(适合 Git) 非常希望能得到关于工作流程的反馈,以及哪些功能会让这个工具对你更有用。
1作者: chbkall5 天前原帖
如果一棵树在森林中倒下,而周围没有人看到或听到它的声音,许多人依然能感受到它的存在。当砍伐树木、河流和森林的机器庞大而强劲,似乎无法阻挡时,我们这些地球人如何承受这种损失,承受这种悲伤与痛苦,将其转化为韧性,并为地球、水和生命而努力?作为一个同样的地球人和人类,我在内心深处听到了大地的召唤。而这个空间就是我回应的方式,帮助他人聆听这种召唤,穿透内外的噪音。
1作者: bkls5 天前原帖
尽力而为。你接近了吗?<p>1. 2024年格林兰的居民人数是多少?<p>2. 迈克尔·乔丹在NBA的职业生涯总得分是多少?<p>3. 原版《哈利·波特》系列(共7本书)中有多少个单词?