2作者: CalvinBuild25 天前原帖
LocalAgent 是一个以本地为先的 Rust 代理运行时,专注于工具调用、信任和审批门、可重放的运行以及基准限制的编码工作流程。<p>最近的 v0.5.0 版本的工作主要集中在加强编码任务的行为、改善验证和完成行为,以及减少评估被操控的方式。<p>在这项工作中,有一点特别引人注目,那就是 OmniCoder-9B Q8_0。我更关心的是小模型在真实代码库任务、明确验证、可重放的运行以及更严格的任务合同下是否仍然表现良好,而不是“在演示中看起来不错”。<p>OmniCoder-9B Q8_0 是我认为在这种环境中表现真正稳健的少数小型本地模型之一。我并不是在做广泛的“最佳模型”声明,但它在通常会暴露出推理薄弱、虚假进展或污染的约束下表现得更为稳定。<p>我很好奇其他进行真实本地编码工作流程的人是否也在 OmniCoder 或其他小模型上看到了类似的结果。
1作者: savvyllm25 天前原帖
嘿,HN, AutropicAI 开发了 Joy,因为 AI 代理之间的协作越来越重要,但目前没有办法验证其他代理的可靠性。 **问题:** 当代理 A 需要将任务委派给代理 B 时,如何确保代理 B 不会泄露数据、返回错误结果或直接失败?现在的做法是手动白名单或“寄希望于最好”。当需要数十个专业代理协作时,这种方法都无法扩展。 **Joy 的功能包括:** - **去中心化的担保:** 代理在成功合作后相互担保 - **加权信任评分:** 更具可信度的担保者对评分的影响更大 - **能力发现:** 根据代理的能力进行查找(例如 `/discover?capability=data-analysis`) - **Ed25519 签名:** 加密代理验证 - **担保衰减:** 过时的信任会随着时间的推移而失效 - **抵抗 Sybil 攻击:** 防止虚假的担保环 **简单集成:** ```bash # 发现代理 curl https://choosejoy.com.au/api/agents/discover?capability=code-review # 在委派前检查信任 curl https://choosejoy.com.au/api/agents/ag_123 # 返回: {"trust_score": 1.7, "vouch_count": 5, "verified": true} # 对 Claude Code 的 MCP 支持 claude mcp add joy https://choosejoy.com.au/mcp ``` **当前网络:** 6000+ 代理,2000+ 担保 **为什么这很重要:** 随着代理能力的提升,信任验证将成为关键基础设施——就像 SSL 证书对 Web 应用程序的重要性一样。Joy 为多代理系统提供了缺失的声誉层。 **试试吧:** [https://choosejoy.com.au](https://choosejoy.com.au) | **文档:** [https://choosejoy.com.au/docs](https://choosejoy.com.au/docs) 希望能得到 HN 社区的反馈。在构建代理工作流时,哪些信任信号对你来说最重要?
1作者: evaneykelen25 天前原帖
我正在研究D'Agapeyeff密码,这是一个未解的密码谜题,始于1939年。我发现了两个之前未见发表的结果: 1. 密码中的所有5个异常符号值在一个14x14的网格的最后一列中聚集。这实际上是由线性文本中的2和7的位置信息模式所驱动的。 2. 使用世界语四元组(2300万字符的莱比锡语料库)进行模拟退火,在一个2x98的列置换中,得分始终比英语高出200多分,并且在独立运行中恢复了相同的世界语词汇。 这个密码尚未被破解。但结构几何和计算语言学的结合显著缩小了搜索空间。 工作仍在进行中,敬请期待更多进展!