返回首页
最新
一些有用的链接:
- https://mhclgdigital.blog.gov.uk/2025/06/12/extract-using-ai-to-unlock-historic-planning-data/
- https://github.com/digital-land/digital-land/issues/360
- https://ai.gov.uk/evaluations/extract-evaluation/
我在模型上下文管理方面遇到了瓶颈。在免费或低级别的API计划中,当你在传递来回的对话历史时,令牌限制消失得非常快。
显然,人工智能公司正在逐渐转向关注这一点。<p>在90年代,在泡沫破裂之前,有没有任何努力去实现这一目标?<p>我那时还是个孩子,记得像是为杂货店提供价格比较的Priceline这样的构想和一些疯狂的首次公开募股,但其他的记得不多。<p>我一直对这种相似性和可以学到的东西感兴趣。
我正在维护一个开源项目(确定性开源重复代码检测器),有用户请求一个我不太清楚如何实现的功能。
这似乎是一个很难解决的问题:
- 测试重复相同的场景。对于结构性检测器来说,这被标记为重复(重复代码)。然而,测试并不是人们希望从代码库中删除的内容。
- 测试中的重复(故意的)最终看起来像是不必要的代码重复,而工具无法区分哪一个是哪个。
- 解决这个问题的一种方法可能是引入“人类在环”的机制(类似于代码检查工具允许用户在第一次运行时接受某些内容,同时保持默认的零配置)。
我想知道你们是如何处理这个问题的,以及是否有人有任何想法。
这是项目的仓库链接:https://github.com/Rafaelpta/dupehound
这是更详细的问题链接:https://github.com/Rafaelpta/dupehound/issues/23
嘿,HN,
最近对元控制器、循环和多智能体编排的关注度很高。显然,已经有很多优秀的工具,比如 Conductor、cmux、原生的 Codex / Claude 代码应用等。
就我个人的使用案例而言,我觉得编排层往往显得过于复杂。我主要想要一个简单的本地控制器(即 Pi),用于运行和跟踪 CLI 代理,并能够通过 tmux 进行切换。Relaymux 是我对此的有针对性的尝试。
以下是一些设计原则:
- 前端仅限于 Telegram / iMessage / CLI。如果我想要更多的可视化,我会切换到 tmux。
- 子代理是正常的交互式 CLI 代理,运行在 tmux 窗口中,通常有自己的工作树。
- 控制器拥有 tmux 会话,因此每个较长的任务都会变成一个命名的标签/窗口。子代理在被阻塞或完成时通过 CLI 向编排者报告。然后,编排者会通过 Telegram / iMessage 给我发消息。
- 它可以与任何具有交互式终端模式的 CLI 代理配合使用,因此我不需要特殊的打印模式/非交互式支持。这意味着我不需要担心 Agent SDK / claude -p 的计费限制。