1作者: akadeb8 天前原帖
Cloudflare 最近发布的语音代理提供了 Deepgram 语音转文本(STT)和文本转语音(TTS)服务的免费每日使用额度。<p>因此,我创建了一个在 Cloudflare Workers 上运行的语音 AI 代理管道,使用了持久对象,并与 Arduino ESP32 进行接口。这使得您可以将任何大型语言模型(LLM)用于驱动您的语音 AI 玩具和桌面助手,同时原生支持语音转文本和文本转语音功能。
1作者: paperlantern8 天前原帖
Paper Lantern 是一个多通道处理(MCP)服务器,允许编码代理从超过 200 万篇计算机科学研究论文中请求个性化的技术和创意。您的编码代理会告诉 Paper Lantern 它正在解决什么问题——> Paper Lantern 会从 100 多篇研究论文中找到最相关的创意——> 并将这些创意连同权衡和实施说明提供给您的编码代理。 我们之前已经展示了这对研究工作有帮助,现在想了解它是否对日常软件工程任务也有帮助。我们设计了 9 个任务来进行测量,并比较了仅使用编码代理(Opus 4.6,作为基线)与编码代理 + Paper Lantern 访问的效果。 (完整分析的博客文章:<a href="https://www.paperlantern.ai/blog/coding-agent-benchmarks" rel="nofollow">https://www.paperlantern.ai/blog/coding-agent-benchmarks</a>) 一些有趣的结果: 1. 我们要求代理编写能够最大化突变得分(捕获的注入错误的比例)的测试。基线捕获了 63% 的注入错误。基线 + Paper Lantern 从最近的研究中发现了突变感知提示(MuTAP,2023 年 8 月;MUTGEN,2025 年 6 月),建议通过抽象语法树(AST)分析枚举每个可能的突变,然后编写测试以针对每个突变。这使得捕获率提高到了 87%。 2. 从 50 份合同中提取法律条款。基线将完整文档发送给大型语言模型(LLM),正确提取了 44% 的条款。基线 + Paper Lantern 找到了两篇来自 2026 年 3 月的论文(BEAVER 用于章节级相关性评分,PAVE 用于提取后的验证)。准确率跃升至 76%。 在九个任务中,有五个任务的表现提高了 30% 到 80%。差异在于技术选择。在所有实验中,15 篇被引用最多的论文中有 10 篇是在 2025 年或之后发表的。 所有内容都是开源的:<a href="https://github.com/paper-lantern-ai/paper-lantern-challenges" rel="nofollow">https://github.com/paper-lantern-ai/paper-lantern-challenges</a> 每个实验都有自己的 README,详细结果和 approach.md 显示了 Paper Lantern 提供了什么,以及代理是如何使用这些信息的。 快速设置:`npx paperlantern@latest`