2作者: sexy_seedbox23 天前原帖
我在2022年问过这个问题:<p>https://news.ycombinator.com/item?id=32723101<p>今年有什么最新进展?<p>我并不是在寻找由SUNO生成的AI音乐,那种类型的AI作品廉价且简单。我想要的是与人类创意相结合的惊人声音和乐器克隆。
8作者: randall23 天前原帖
嘿,HN!<p>我们想向大家展示我们的开源代理框架,名为Gambit。<p>如果你不太了解,代理框架就像是代理的操作系统……它们负责工具调用、规划、上下文窗口管理,并且不需要太多的开发者协调。<p>通常你可能会看到一个代理协调框架的管道,如下所示:<p>计算 -> 计算 -> 计算 -> LLM -> 计算 -> 计算 -> LLM<p>而我们将其反转,因此在代理框架中,更像是:<p>LLM -> LLM -> LLM -> 计算 -> LLM -> LLM -> 计算 -> LLM<p>本质上,你可以在一个独立的Markdown文件中,或者作为一个TypeScript程序描述每个代理。你的根代理可以根据需要引入其他代理,我们为你定义这些代理之间的接口提供了一种类型安全的方式。我们称这些为“牌组”。<p>代理可以调用其他代理,每个代理可以根据你的任务设计适合的模型参数。<p>此外,链中的每一步都会自动进行评估,我们称之为“评分器”。评分器是另一种牌组类型……但它旨在评估和打分对话(或单个对话轮次)。<p>我们还可以在每个牌组的基础上定义测试代理,旨在模拟你的代理可能面临的场景,并生成合成数据供人类或评分器进行评分。<p>在Gambit之前,我们曾构建了一个基于LLM的视频编辑器,但对结果不满意,这促使我们走上了改善推理时间和LLM质量的道路。<p>我们知道它缺少一些显而易见的部分,但我们希望将其发布出来,看看它能如何帮助人们或引发讨论。我们对它在一些早期设计合作伙伴中的表现感到非常满意,我们认为这是一种实现许多有趣应用的方式:<p>- 真正的开源代理和助手,逻辑、代码和提示可以轻松与社区共享。 - 基于评分标准的评估,确保你(例如)不会意外泄露个人身份信息(PII)。 - 在几分钟内启动一个可用的机器人,并利用Codex或Claude Code使用我们的命令行运行器/评分器构建一个相当不错的初始版本,几乎不需要人工干预。<p>如果大家有任何问题或想法,我们会在这里。感谢你们关注我们!<p>演示视频:<a href="https://youtu.be/J_hQ2L_yy60" rel="nofollow">https://youtu.be/J_hQ2L_yy60</a>