1作者: onesandofgrain大约 1 个月前原帖
在Anthropic和Copilot将GitHub上的每一行代码都吸干后,Claude的估值达到了3800亿美元,你有什么收获吗?没有。 建筑材料是免费的么? 食物是免费的么? 电呢? 你想让你的管道被全部偷走吗? 如果没有你的代码,这些公司一文不值。 Codeberg声称为你的代码提供“一个安全友好的家”。更像是一个无限代码的免费渠道,用于训练AI模型。 Codeberg甚至在其政策中声明,私有仓库只允许暂时存在。一切最终都被期望公开。 你的代码是你的血、你的汗水和你的泪水。你应该决定谁能看到它,谁能访问它。这是你的知识产权。 因此... 不要使用GitHub。 不要使用Codeberg。 不要使用GitLab。 搭建自己的VPS,使用Gitea或Forgejo,拥有你所创造的东西。这是你的,绝不应该免费赠送。 如果你需要分享,使用 https://sharemygit.com 自托管你的仓库。 按你的条件分享。 停止免费赠送你的作品。
2作者: ajw287大约 1 个月前原帖
据我所知,这篇论文(爱因斯坦解决了一个关于克鲁克斯辐射计的几十年老问题)从未以英文形式公开过!爱因斯坦的作品在2026年1月1日进入公有领域,这意味着我终于可以发布我在2019年博士期间完成的翻译!<p>我有一篇博客文章提供了更多背景信息:<a href="https:&#x2F;&#x2F;adaptive-machine-patterns.com&#x2F;blog.html#einstein" rel="nofollow">https:&#x2F;&#x2F;adaptive-machine-patterns.com&#x2F;blog.html#einstein</a> [备用链接:<a href="http:&#x2F;&#x2F;archive.today&#x2F;381Pl" rel="nofollow">http:&#x2F;&#x2F;archive.today&#x2F;381Pl</a>] 我是新手博客作者,欢迎提供建议。<p>该预印本托管在CULA存储库(非常感谢)<a href="https:&#x2F;&#x2F;www.repository.cam.ac.uk&#x2F;handle&#x2F;1810&#x2F;398349" rel="nofollow">https:&#x2F;&#x2F;www.repository.cam.ac.uk&#x2F;handle&#x2F;1810&#x2F;398349</a>,并且有一个DOI:<a href="https:&#x2F;&#x2F;doi.org&#x2F;10.17863&#x2F;CAM.127224" rel="nofollow">https:&#x2F;&#x2F;doi.org&#x2F;10.17863&#x2F;CAM.127224</a>
1作者: sugeul大约 1 个月前原帖
嗨,HN,我创建了 Jsiphon 来解决 LLM 流式输出中的一个常见问题:你请求结构化的 JSON 输出,但在整个流结束之前无法使用其中的任何内容。 如果你使用过 JSON 模式(如 OpenAI、Anthropic 等),你一定遇到过这个问题——你想要的是 {“answer”: “...”, “sources”: [...]}, 但 JSON.parse() 在每个不完整的块上都会失败。 LLM 的响应本质上是追加式的(令牌从左到右到达,永远不会回退),因此 Jsiphon 在此基础上提出了三个想法: 1) 追加式解析 — 输入 {“msg”: “Hel”},立即得到 {msg: “Hel”}。值只会被扩展,永远不会被删除或改变。 2) 差异跟踪 — 每个快照只包含新的内容。对于聊天气泡,只需将 delta.content 附加到 DOM 中——当 LLM 产生下一个块 “lo, World!” 时,我们立即得到 {msg: “lo, World!”}。无需重复部分 JSON 解析或完整树重新渲染。 3) 模糊树 — 一棵反映数据结构的树,跟踪每个深度上哪些子树已完成。例如,如果你正在流式传输 {“header”: {“title”: “...”, “date”: “...”}, “body”: “...”},你可以检查 isAmbiguous(ambiguous.header.title) 来在标题完成的瞬间使用它,即使 header.date 和 body 仍在流式传输。这不是一个简单的“整个内容完成了吗?”标志——而是每个节点的稳定性跟踪,向上传播,因此 isAmbiguous(ambiguous.header) 仅在 header 的所有子节点都完成时才变为 false。 现有的部分 JSON 解析器如 partial-json 和 gjp-4-gpt 在核心解析问题上做得很好——将损坏的 JSON 转换为可用对象。Jsiphon 在此基础上更进一步:它不仅仅是解析,而是为你提供一个流式数据管道,其中追加式快照、每个字段的差异和多层深度的模糊跟踪都来自单次异步迭代。如果你一直在使用 partial-json,并希望知道哪些字段已完成,哪些仍在流式传输,而无需轮询整个对象,这正是它所填补的空白。 零依赖,永远不会因无效输入而抛出错误,处理 JSON 根节点前后的垃圾文本(LLM 有时会产生这些)。 GitHub: [https://github.com/webtoon-today/jsiphon](https://github.com/webtoon-today/jsiphon) npm install jsiphon 非常希望能收到关于 API 设计的反馈——尤其是模糊树。跟踪任意嵌套深度的每个节点的稳定性是最棘手的部分。想知道是否有人看到更简洁的方法。 披露:我是一名母语为韩语的说话者。我使用 Claude 来帮助构建和翻译这篇文章。想法和代码都是我的。