1作者: parentheses大约 1 个月前原帖
我最近一直在思考一个问题,那就是我对人工智能生成内容的看法。 我发现有很多明显是人工智能辅助创作的文章,但我能感觉到,创作者在写作上投入了一定的时间和精力。我的当前想法是: 如果我觉得内容是经过一定努力塑造的人工智能生成的,我就不介意阅读它。 以我自己为例。我对自己的写作风格很自觉,常常担心听起来很机械,而且使用了很多相似的表达方式。因此,我会先用自己的声音写一篇文章,然后让人工智能帮我润色一下。让文本更有趣一些,在我难以表达的地方加入一些讽刺,使节奏和韵律更好,缩短我常常冗长的表达方式。 我觉得我努力让它成为我自己的作品,因为我不喜欢在没有投入适当努力的作品上打上我的品牌。 我很想听听大家的看法,作为作者和读者,你们对此有什么想法?
1作者: jgrahamc大约 1 个月前原帖
3作者: Bibabomas大约 1 个月前原帖
嗨,HN!我们(Stephan 和 Thomas)最近开源了 Semble。我们在使用 Claude Code 处理大型代码库时,遇到了同样的问题:当代理无法直接找到某些内容时,它会退回到使用 grep,读取完整文件或启动子代理。这会消耗大量的 tokens,并且通常仍然无法找到相关代码。虽然已有一些工具可以解决这个问题,但要么速度太慢,无法按需索引,要么需要 API 密钥,或者检索质量较差。 Semble 是我们对此问题的解决方案。它结合了静态的 Model2Vec 嵌入(使用我们最新的静态模型:potion-code-16M)与 BM25,通过 RRF 融合并使用代码感知信号进行重新排序。由于不涉及变换器,所有操作均在 CPU 上运行。在我们对 63 个代码库和 19 种语言进行的约 1250 个查询/文档对的基准测试中,它比 grep+read 使用了 98% 更少的 tokens,并且达到了 137M 参数的代码训练变换器的 99% 检索质量,同时速度快了约 200 倍。 主要特点: - 高效的 token 使用:比 grep+read 少 98% 的 tokens - 快速:在我们的基准测试中,索引一个典型代码库约需 250 毫秒,每个查询在 CPU 上约需 1.5 毫秒(非常大的代码库可能需要更长时间) - 准确:0.854 NDCG@10,达到我们测试的最佳变换器设置的 99% - MCP 服务器:可直接替代 Claude Code、Cursor、Codex、OpenCode - 零配置:无需 API 密钥,无需 GPU,无需外部服务 在 Claude Code 中安装: ``` claude mcp add semble -s user -- uvx --from "semble[mcp]" semble ``` 或者查看我们的 README 获取其他安装说明、基准测试和方法论: Semble: [https://github.com/MinishLab/semble](https://github.com/MinishLab/semble) 基准测试: [https://github.com/MinishLab/semble/tree/main/benchmarks](https://github.com/MinishLab/semble/tree/main/benchmarks) 模型: [https://huggingface.co/minishlab/potion-code-16M](https://huggingface.co/minishlab/potion-code-16M) 如果您有任何反馈或问题,请告诉我们!