返回首页
最新
真是糟糕的一周。我们已经投入了心血和精力,花了几个月时间来构建一个带有流媒体桌面的代理编排层,而在星期三,Cursor推出了完全相同的功能——就在我们成功推出之前的三天!而Claude Code在同一天推出了远程控制功能——你能想象接下来会发生什么。在这个竞争激烈的市场中保持优势几乎是不可能的。
不过,尽管如此,还是来看看我们构建的东西吧,你至少可以在自己的基础设施上运行它,在你的企业中使用: https://helix.ml/
我开发了一个工具,用于记录结构化的认知工作,包括从基本原理重建的证明、起草的研究笔记以及掌握的概念,因为我注意到严肃的技术工作很少以任何结构化的方式记录。<p>想听听HN的看法。
我一直在探索推荐系统在实际生产中的实现方式,不仅仅是训练模型。<p>我发现一个常见的模式是将问题分为两个阶段:<p>1. 检索一小部分相关候选项<p>2. 使用模型对它们进行重新排序<p>与其对所有项目进行暴力推理,我围绕这个想法构建了一个小原型。<p>流程如下:<p>- 在向量数据库(ChromaDB)中存储嵌入<p>- 根据向量相似性检索最相似的前K个项目/用户<p>- 运行TensorFlow.js模型对候选项进行重新排序<p>目标是在应用推理之前减少搜索空间,这在延迟和规模重要时似乎是必要的。<p>我发现有趣的是,一旦你采用这种方法,很多复杂性就从模型本身转移到了检索层:<p>- 选择K值<p>- 过滤候选项<p>- 嵌入质量<p>- 延迟与召回的权衡<p>我很好奇其他人在实际系统中是如何处理这些问题的:<p>- 你是如何决定K值的?<p>- 你是完全依赖向量相似性,还是添加启发式方法?<p>- 你是如何在大规模下处理重新排序的?<p>项目:
<a href="https://github.com/ftonato/recommendation-system-chromadb-tfjs" rel="nofollow">https://github.com/ftonato/recommendation-system-chromadb-tf...</a>