返回首页
最新
在Anthropic和Copilot将GitHub上的每一行代码都吸干后,Claude的估值达到了3800亿美元,你有什么收获吗?没有。
建筑材料是免费的么?
食物是免费的么?
电呢?
你想让你的管道被全部偷走吗?
如果没有你的代码,这些公司一文不值。
Codeberg声称为你的代码提供“一个安全友好的家”。更像是一个无限代码的免费渠道,用于训练AI模型。
Codeberg甚至在其政策中声明,私有仓库只允许暂时存在。一切最终都被期望公开。
你的代码是你的血、你的汗水和你的泪水。你应该决定谁能看到它,谁能访问它。这是你的知识产权。
因此...
不要使用GitHub。
不要使用Codeberg。
不要使用GitLab。
搭建自己的VPS,使用Gitea或Forgejo,拥有你所创造的东西。这是你的,绝不应该免费赠送。
如果你需要分享,使用 https://sharemygit.com
自托管你的仓库。
按你的条件分享。
停止免费赠送你的作品。
据我所知,这篇论文(爱因斯坦解决了一个关于克鲁克斯辐射计的几十年老问题)从未以英文形式公开过!爱因斯坦的作品在2026年1月1日进入公有领域,这意味着我终于可以发布我在2019年博士期间完成的翻译!<p>我有一篇博客文章提供了更多背景信息:<a href="https://adaptive-machine-patterns.com/blog.html#einstein" rel="nofollow">https://adaptive-machine-patterns.com/blog.html#einstein</a> [备用链接:<a href="http://archive.today/381Pl" rel="nofollow">http://archive.today/381Pl</a>] 我是新手博客作者,欢迎提供建议。<p>该预印本托管在CULA存储库(非常感谢)<a href="https://www.repository.cam.ac.uk/handle/1810/398349" rel="nofollow">https://www.repository.cam.ac.uk/handle/1810/398349</a>,并且有一个DOI:<a href="https://doi.org/10.17863/CAM.127224" rel="nofollow">https://doi.org/10.17863/CAM.127224</a>
嗨,HN,我创建了 Jsiphon 来解决 LLM 流式输出中的一个常见问题:你请求结构化的 JSON 输出,但在整个流结束之前无法使用其中的任何内容。
如果你使用过 JSON 模式(如 OpenAI、Anthropic 等),你一定遇到过这个问题——你想要的是 {“answer”: “...”, “sources”: [...]}, 但 JSON.parse() 在每个不完整的块上都会失败。
LLM 的响应本质上是追加式的(令牌从左到右到达,永远不会回退),因此 Jsiphon 在此基础上提出了三个想法:
1) 追加式解析 — 输入 {“msg”: “Hel”},立即得到 {msg: “Hel”}。值只会被扩展,永远不会被删除或改变。
2) 差异跟踪 — 每个快照只包含新的内容。对于聊天气泡,只需将 delta.content 附加到 DOM 中——当 LLM 产生下一个块 “lo, World!” 时,我们立即得到 {msg: “lo, World!”}。无需重复部分 JSON 解析或完整树重新渲染。
3) 模糊树 — 一棵反映数据结构的树,跟踪每个深度上哪些子树已完成。例如,如果你正在流式传输 {“header”: {“title”: “...”, “date”: “...”}, “body”: “...”},你可以检查 isAmbiguous(ambiguous.header.title) 来在标题完成的瞬间使用它,即使 header.date 和 body 仍在流式传输。这不是一个简单的“整个内容完成了吗?”标志——而是每个节点的稳定性跟踪,向上传播,因此 isAmbiguous(ambiguous.header) 仅在 header 的所有子节点都完成时才变为 false。
现有的部分 JSON 解析器如 partial-json 和 gjp-4-gpt 在核心解析问题上做得很好——将损坏的 JSON 转换为可用对象。Jsiphon 在此基础上更进一步:它不仅仅是解析,而是为你提供一个流式数据管道,其中追加式快照、每个字段的差异和多层深度的模糊跟踪都来自单次异步迭代。如果你一直在使用 partial-json,并希望知道哪些字段已完成,哪些仍在流式传输,而无需轮询整个对象,这正是它所填补的空白。
零依赖,永远不会因无效输入而抛出错误,处理 JSON 根节点前后的垃圾文本(LLM 有时会产生这些)。
GitHub: [https://github.com/webtoon-today/jsiphon](https://github.com/webtoon-today/jsiphon)
npm install jsiphon
非常希望能收到关于 API 设计的反馈——尤其是模糊树。跟踪任意嵌套深度的每个节点的稳定性是最棘手的部分。想知道是否有人看到更简洁的方法。
披露:我是一名母语为韩语的说话者。我使用 Claude 来帮助构建和翻译这篇文章。想法和代码都是我的。
查询<p>https://www.google.com/search?q=polymarket<p>在澳大利亚直接指向一个加密骗局。这个骗局网站(polymarkets.*)似乎“自然地”排在了最上面。也许这是因为polymarket在澳大利亚被禁?