1作者: jpwahle7 个月前原帖
我们创建MALLM是因为现有的多智能体辩论(MAD)工具包通常无法完全控制多智能体讨论的各个部分。MALLM允许您自由组合每个可变部分: 1. 人物角色(专家 / 个性 / …) 2. 反应生成器(批判性 / 推理风格 / …) 3. 讨论范式(记忆 / 中继 / …) 4. 决策协议(投票 / 共识 / …) 我们提供了144种以上的开箱即用配置,所有配置都在一个YAML文件中定义。需要更多配置?可以子类化并添加您自己的组件。 您可能关心的其他功能: 1. 可以与任何基于文本的HuggingFace数据集连接(我们已经在MMLU-Pro、WinoGrande等上进行了测试)。 2. 自带评估管道,您可以在不编写额外脚本的情况下进行A/B辩论策略测试。 3. 纯Python,Apache 2.0许可证。 仓库: [https://github.com/Multi-Agent-LLMs/mallm](https://github.com/Multi-Agent-LLMs/mallm) 欢迎反馈和PR,特别是我们尚未尝试的任务基准! 演示: [https://mallm.gipplab.org/](https://mallm.gipplab.org/)
1作者: felipap7 个月前原帖
嘿,HN!<p>Nudge 每分钟捕捉一次你的屏幕,并利用 GPT-4o 检测你何时分心。你可以描述你想要专注的工作内容(例如:“在 GitHub 上审查 PR 20 分钟”),当 Nudge 发现你在做其他事情时会发出警报。<p>我之所以开发 Nudge,是因为我在工作中容易分心。我使用它已经几个星期了,我可以说我的拖延减少了 20-30%。 (这部分是因为 Nudge 迫使我将一天的工作分解成小而具体的活动。)<p>AI 检测的效果可以非常好,但这取决于你描述目标的清晰程度。例如,“我想回复我的老板”就不好,而“我想在 Gmail 上写回复”就好。了解大型语言模型(LLM)的行为会有很大帮助。(可以在这里查看系统提示:<a href="https://github.com/felipap/nudge/blob/main/src/lib/ai/assess-flow.ts">https://github.com/felipap/nudge/blob/main/src/lib/ai/assess...</a>)<p>截图是非常敏感的数据,所以我决定将其开源,并采用 BYOM(“自带模型”)的方式。目前你需要提供自己的 OpenAI API 密钥。我意识到并不是每个人都有密钥,因此很希望能尽快支持其他 AI 后端。<p>我很高兴能分享这个项目,并希望能收到关于其工作效果的反馈(包括 AI 准确性和用户体验)。感谢阅读!
1作者: whitefang7 个月前原帖
在Formester,我们面临一个问题。我们超过50%的时间都花在了客户支持上。<p>客户的问题主要是关于如何在应用程序中执行某些操作,而这些内容我们已经通过视频、博客和文档进行了很好的记录。<p>为此,我创建了Chakam。我们开始在内部使用它,并且也在寻找其他中型到大型组织,以便他们能够从中受益。<p>主要特点:<p>- 在您自己的/专用基础设施上运行<p>- 使用流行的LLM或自托管的LLM<p>- 与流行的聊天应用程序集成,以便您可以直接在Intercom等平台上使用<p>- 每月提供关于知识库中存在的知识空白的报告<p>我希望向您展示我所构建的内容,并了解它是否能为您的业务带来帮助。