1作者: kimjune0125 天前原帖
每个聊天机器人处理上下文溢出的方法都是一样的——将所有内容总结成一个块,并丢弃来源。我用一个并查集森林替代了这种方法:消息合并成簇,每个簇都有自己的摘要,你可以追溯任何摘要到产生它的消息。 我进行了七次与传统扁平摘要的对比试验。在每次试验中,并查集在事实回忆上领先15-18个百分点。其中一次达到了显著性(p=0.039),其余的结果则呈现出方向性。一个有趣的发现是:扁平摘要会遗漏“脚注”事实(如cron调度、webhook路径),因为这些信息在空间上与主要事实竞争。而每个簇的摘要则没有这种压力。 代码和试验日志请见: [https://github.com/kimjune01/union-find-compaction](https://github.com/kimjune01/union-find-compaction)
2作者: salvozappa25 天前原帖
大家好,大约两个月前我开始了一个关于“异步编码”的副项目,我可以在火车上通过手机提示Claude Code,完成后会收到通知,然后可以直接在应用中查看和提交代码。 从那时起,我时不时地使用它。最终我决定对其进行完善并发布,以便有需要的人能找到它。 这是一个自托管的渐进式网络应用(PWA),包含四个面板:代理(运行Claude Code的终端)、浏览(带语法高亮的文件浏览器)、终端(标准bash shell)和Git(带有暂存/提交的差异查看器)。它可以在廉价的VPS上运行,并提供了一个完整的功能设置(使用cloud-init和简单的bash脚本)。 这符合我喜欢的工作流程,我可以保持信息同步:我会查看每个差异,手动控制git,并在更改提交之前批准或拒绝它们。 技术栈:Go WebSocket桥接,xterm.js前端,Ubuntu沙箱容器。所有内容都在Docker中运行。可以与任何CLI AI助手配合使用,尽管我只用过Claude Code。 这是一个副项目,按原样提供,遵循MIT许可证。使用风险自负。欢迎反馈和合并请求。 编辑:已删除冗余文本。