1作者: acro-v2 个月前原帖
你好,<p>我正在构建一个终端原生的代码生成工具,最近的一个更新是为那些不想将代码上传到第三方服务器的用户打包了一个本地模型(Qwen 2.5 Coder 7B,首次下载即可使用)。<p>用户对这一新增功能的初步反馈是积极的,但我对此有些怀疑:这个模型相对基础,质量与在线产品相比还有差距。<p>因此,我计划改进RAG(检索增强生成)能力,以便构建包含相关源文件片段的消息,增加规划调用,添加验证循环,可能还会进行多样本重排序等:这些都是常见的技术,如果实施得当,可以提高输出质量。<p>所以,我的问题是:我相信(希望?)通过实施这些改进,7B模型的质量可以大致提升到20B模型的水平,你认为这是可能的,还是觉得这将是徒劳无功,这种改进不会发生?<p>源代码在这里,如果你喜欢,可以给它一个星标: https://github.com/acrotron/aye-chat
3作者: megraf2 个月前原帖
在每个用户的个人资料上显示账户来源国是否有益? 我想了解HN社区对此的看法,特别是从隐私、管理、透明度、防止滥用等角度,以及这是否能有效提升讨论质量。 公开显示这种元数据是否有强有力的支持或反对理由?
2作者: staloriana2 个月前原帖
我为.NET构建了一个小型的、优化缓存的B+树存储引擎,名为BTreePlus。<p>这个项目的目标并不是构建一个通用数据库,而是探索在针对CPU缓存行为、小固定大小页面和可预测的读/写路径进行调优时,现代B+树设计能够达到的极限。<p>在我的基准测试中(链接在代码库中),BTreePlus在特定的键值风格工作负载下显示出比SQLite和Postgres更好的吞吐量,主要包括:<p>- 单键点查找<p>- 小页面的顺序插入<p>- 以读取为主的场景,没有复杂的SQL层<p>我非常希望能得到数据库和系统工程师的反馈,具体包括:<p>- 页面布局/分裂合并逻辑<p>- 锁定模型<p>- 设计是否避免了经典B树的陷阱<p>- 基准测试方法(乐意进行调整或重新测试)<p>NuGet: <a href="https://www.nuget.org/packages/BTreePlus" rel="nofollow">https://www.nuget.org/packages/BTreePlus</a>
1作者: leo_e2 个月前原帖
我们是一家小型初创公司,正在构建一个专门的搜索引擎。刚开始时,逻辑很简单:“性能是我们的主要特点,所以我们需要使用C++。” 六个月过去了,运行时性能确实很出色,但我们的迭代速度却急剧下降。 感觉我们在每一个功能上都付出了巨大的代价。就在昨天,我花了整个下午与CMake斗争,只是为了链接一个库,而在其他生态系统中,这本可以通过一行命令(go get或npm install)轻松完成。我们还不断遇到一些虚幻的bug,结果发现是我们M1 Mac与Linux CI运行器之间的ABI微妙不匹配——这些问题在现代工具链中根本不存在。 这让人感到沮丧,因为我们的“慢”竞争对手每周都在推出新功能,而我们却被困在调试链接器错误或等待20分钟的清理构建中。 我开始怀疑“性能护城河”是否是一种陷阱。对于那些最近开始基础设施项目的人:你们还在坚持使用C++吗?还是转向了Rust或Go?或者你们只是接受了为了原始速度而牺牲迭代速度的现实?