8作者: alexmrv9 天前原帖
嘿,HN!我构建了一个基于Git的AI记忆概念验证,而不是使用向量数据库。 <p>这个想法是:Git已经解决了版本化文档管理的问题。为什么我们要构建复杂的向量存储,而不直接使用带有Git内置的diff/blame/history的markdown文件呢? <p>它是如何工作的: <p>记忆以markdown文件的形式存储在Git仓库中 每次对话 = 一次提交 git diff显示理解如何随着时间演变 使用BM25进行搜索(不需要嵌入) 大型语言模型(LLMs)根据对话上下文生成搜索查询 示例:询问“我的项目是如何演变的?”它使用git diff来展示理解的实际变化,而不仅仅是相似性分数。 <p>这确实是一个概念验证——到处都是粗糙的边缘,尚未准备好投入生产。但它在个人使用中表现得相当不错。一年对话的整个索引大约占用100MB的内存,检索时间在毫秒级。 <p>有趣的部分是:你可以git checkout到任何时间点,准确查看当时AI所知道的内容。完美的可重复性,人类可读的存储,并且如果需要,你可以手动编辑记忆。 <p>GitHub: <a href="https://github.com/Growth-Kinetics/DiffMem" rel="nofollow">https://github.com/Growth-Kinetics/DiffMem</a> <p>技术栈:Python, GitPython, rank-bm25, OpenRouter用于大型语言模型的编排。采用MIT许可证。 <p>希望能得到对这个方法的反馈。这是疯狂的还是聪明的?我还缺少什么可能会让我后悔的?
1作者: vinserello9 天前原帖
我正在开发一个名为 Datastripes 的工具(最初是我的硕士论文),它完全在浏览器中运行。这是一个拖放式数据引擎,您可以加载数据集(CSV、SQL、API),以可视化的方式进行转换,并构建仪表板,而无需编写代码。 人们似乎最喜欢的一个功能是:您可以在不到 30 秒的时间内将数据转换为有声播客。系统会获取您的数据集或仪表板,生成洞察,并将其转换为音频流,您可以收听或与团队分享。这个想法是,执行人员可以在通勤期间听取业务状况,而不是拉取报告或盯着仪表板。 Datastripes 的其他功能包括预测、"假设" 情景模拟(如危机或市场繁荣),以及与数据对话的 AI 聊天界面。但我特别想听听您对数据转语音方法的看法。 您可以访问 https://datastripes.com,或在 https://app.datastripes.com 上免费注册,直到九月。非常希望能收到反馈,尤其是来自构建或使用分析工具的朋友们。