1作者: afpereira2 个月前原帖
我厌倦了阅读成千上万页关于分布式存储系统的文档。我只想在几台服务器上可靠地存储文件。 于是我构建了 MicroVault——一个你可以真正理解的内容可寻址的二进制大对象存储。 *它的功能:* - 在 N 个卷服务器上存储二进制大对象,并进行复制 - 使用 nginx 进行服务(读取时零开销) - 使用 SQLite 存储元数据 - 使用一致性哈希进行分布 - 提供简单的 HTTP API *它不具备的功能:* - 自定义网络协议 - 分布式共识 - 内置身份验证/加密(使用标准工具) - 任何复杂的功能 *架构:* - 主服务器:协调写入操作,将元数据存储在 SQLite 中 - 卷服务器:nginx + 简单的包装器(约 100 行代码)用于 PUT/DELETE - 存储:磁盘上的常规文件,按哈希前缀组织 - 工具:重建、重新平衡、验证、压缩 *为什么选择 nginx?* 因为它经过数十年的优化,专门用于服务静态文件。对于读取(大多数操作),它是纯粹的 nginx,零开销。 *灵感来源:* George Hotz 的 minikeyvalue——证明分布式存储不需要复杂。 整个代码库小到可以在一个晚上审计完毕。你可以在一个周末分叉它并将其变成你自己的项目。 GitHub: https://github.com/afonp/microvault 使用 Go、SQLite、nginx 构建,并对复杂性保持健康的不屑态度。
1作者: roampal2 个月前原帖
马修·麦康纳在两个月前的乔·罗根节目中描述了他想要的人工智能:一个仅基于他自己写作和经历训练的私人模型。我实现了这个想法,并增加了基于结果的学习。 在130个对抗场景中设计的查询,使得语义上与坏建议的匹配程度优于好建议: → 普通向量搜索:正确率0-3% → Roampal:正确率100% 效率:减少63%的标记 — 检索到1个结果验证的结果,而RAG的前3个语义匹配结果。 核心机制 • 用户/AI标记结果 → 成功 +0.2,失败 -0.3(从对话中显式或自动检测) • 新记忆:70% 嵌入 / 30% 结果分数 ``` 经过验证的记忆(使用5次以上):40% 嵌入 / 60% 结果分数 ``` • 随着时间的推移,“听起来对”的结果会被降级,而“实际上有效”的结果会被升级。 与Mem0/Zep的主要区别 它们根据相关性/一致性进行更新,而Roampal则根据实际结果进行更新。 可重复的结果(存储库中的JSON): ``` 普通向量 Roampal ``` 金融(100) 0% 100% 编码(30) 3.3% 100% ← p=0.001,Cohen’s d=7.49 学习曲线:随着记忆的积累,准确率从58%提升至93%(p=0.005,d=13.4) 我不是程序员 — 拥有心理学学位、MBA,日常工作管理650万美元的合同。经过九个月的夜晚和周末,只使用Cursor、Claude和复制粘贴。 100% 本地 · 离线运行于Ollama、LM Studio或Claude Desktop · MIT许可证 · 无遥测 · 无需注册 GitHub(完整基准 + 所有130个对抗场景): [https://github.com/roampal-ai/roampal](https://github.com/roampal-ai/roampal) 网站 + 演示视频: [https://roampal.ai](https://roampal.ai) 欢迎在评论中提出技术问题或给予严厉反馈。