8作者: randall22 天前原帖
嘿,HN!<p>我们想向大家展示我们的开源代理框架,名为Gambit。<p>如果你不太了解,代理框架就像是代理的操作系统……它们负责工具调用、规划、上下文窗口管理,并且不需要太多的开发者协调。<p>通常你可能会看到一个代理协调框架的管道,如下所示:<p>计算 -> 计算 -> 计算 -> LLM -> 计算 -> 计算 -> LLM<p>而我们将其反转,因此在代理框架中,更像是:<p>LLM -> LLM -> LLM -> 计算 -> LLM -> LLM -> 计算 -> LLM<p>本质上,你可以在一个独立的Markdown文件中,或者作为一个TypeScript程序描述每个代理。你的根代理可以根据需要引入其他代理,我们为你定义这些代理之间的接口提供了一种类型安全的方式。我们称这些为“牌组”。<p>代理可以调用其他代理,每个代理可以根据你的任务设计适合的模型参数。<p>此外,链中的每一步都会自动进行评估,我们称之为“评分器”。评分器是另一种牌组类型……但它旨在评估和打分对话(或单个对话轮次)。<p>我们还可以在每个牌组的基础上定义测试代理,旨在模拟你的代理可能面临的场景,并生成合成数据供人类或评分器进行评分。<p>在Gambit之前,我们曾构建了一个基于LLM的视频编辑器,但对结果不满意,这促使我们走上了改善推理时间和LLM质量的道路。<p>我们知道它缺少一些显而易见的部分,但我们希望将其发布出来,看看它能如何帮助人们或引发讨论。我们对它在一些早期设计合作伙伴中的表现感到非常满意,我们认为这是一种实现许多有趣应用的方式:<p>- 真正的开源代理和助手,逻辑、代码和提示可以轻松与社区共享。 - 基于评分标准的评估,确保你(例如)不会意外泄露个人身份信息(PII)。 - 在几分钟内启动一个可用的机器人,并利用Codex或Claude Code使用我们的命令行运行器/评分器构建一个相当不错的初始版本,几乎不需要人工干预。<p>如果大家有任何问题或想法,我们会在这里。感谢你们关注我们!<p>演示视频:<a href="https://youtu.be/J_hQ2L_yy60" rel="nofollow">https://youtu.be/J_hQ2L_yy60</a>
1作者: amluto22 天前原帖
OpenAI推出了一个全新的Codex版本(命令行界面),终于支持设备代码认证,因此在无头环境中使用它不再尴尬。同时,他们似乎在此期间禁用了旧的非无头版本。 但是,在工作区中尝试使用时却显示“请联系您的工作区管理员以启用设备代码认证”。这个设置并不明显,而OpenAI的聊天支持表示,我引用一下:“最新的更新需要设备代码认证,这适用于个人ChatGPT账户,但不适用于工作区(商业/企业/教育)用户。” OpenAI的一位实际工作人员将相关问题关闭,标记为“未计划”:https://github.com/openai/codex/issues/9253 难道OpenAI真的决定不再支持在付费工作区计划中使用Codex命令行界面吗?