2作者: xinghaohuang大约 2 个月前原帖
嗨,HN, 在构建RAG代理时,我注意到大量的令牌预算被格式化开销(HTML标签、JSON结构、空格)浪费掉了。现有的解决方案感觉太笨重(通常需要torch/transformers),因此我编写了这个轻量级、零依赖的库来解决这个问题。 它包括上下文打包、个人身份信息(PII)去标识化和工具输出压缩的策略。基准测试显示,它可以节省约15%的令牌,同时延迟开销微乎其微(<0.5毫秒)。 很高兴回答任何问题!
1作者: mobrienv大约 2 个月前原帖
我在随意浏览Claude代码的Ralph Wiggum插件时,惊讶地发现我的玩具项目被提及。由于似乎有人从中获得了一些价值,我想在这里分享一下……<p>完全坦白,这个仓库本身是用一个原始的Ralph Wiggum循环构建的,所以请期待一些AI生成的杂乱内容。不过它确实可以工作。¯\_(ツ)_/¯<p><a href="https://mikeyobrien.github.io/ralph-orchestrator/" rel="nofollow">https://mikeyobrien.github.io/ralph-orchestrator/</a><p>[1] <a href="https://github.com/anthropics/claude-code/tree/main/plugins/ralph-wiggum" rel="nofollow">https://github.com/anthropics/claude-code/tree/main/plugins/...</a>