马修·麦康纳在两个月前的乔·罗根节目中描述了他想要的人工智能:一个仅基于他自己写作和经历训练的私人模型。我实现了这个想法,并增加了基于结果的学习。
在130个对抗场景中设计的查询,使得语义上与坏建议的匹配程度优于好建议:
→ 普通向量搜索:正确率0-3%
→ Roampal:正确率100%
效率:减少63%的标记 — 检索到1个结果验证的结果,而RAG的前3个语义匹配结果。
核心机制
• 用户/AI标记结果 → 成功 +0.2,失败 -0.3(从对话中显式或自动检测)
• 新记忆:70% 嵌入 / 30% 结果分数
```
经过验证的记忆(使用5次以上):40% 嵌入 / 60% 结果分数
```
• 随着时间的推移,“听起来对”的结果会被降级,而“实际上有效”的结果会被升级。
与Mem0/Zep的主要区别
它们根据相关性/一致性进行更新,而Roampal则根据实际结果进行更新。
可重复的结果(存储库中的JSON):
```
普通向量 Roampal
```
金融(100) 0% 100%
编码(30) 3.3% 100% ← p=0.001,Cohen’s d=7.49
学习曲线:随着记忆的积累,准确率从58%提升至93%(p=0.005,d=13.4)
我不是程序员 — 拥有心理学学位、MBA,日常工作管理650万美元的合同。经过九个月的夜晚和周末,只使用Cursor、Claude和复制粘贴。
100% 本地 · 离线运行于Ollama、LM Studio或Claude Desktop · MIT许可证 · 无遥测 · 无需注册
GitHub(完整基准 + 所有130个对抗场景):
[https://github.com/roampal-ai/roampal](https://github.com/roampal-ai/roampal)
网站 + 演示视频:
[https://roampal.ai](https://roampal.ai)
欢迎在评论中提出技术问题或给予严厉反馈。
返回首页
最新
我们现在距离Docker许可风波已经过去几年了。谁成功将他们的公司迁移到了替代方案?哪些方面运作良好,哪些方面则不尽如人意?
大家好,
我制作了这个应用程序。
Demo Scope 让你可以录制或直播任何移动网站,同时屏幕上会显示你的面部和每次点击的触摸指示器。
我之所以开发它,是因为我需要演示自己的副项目,并且厌倦了使用 OBS 和桌面设置。
在应用中加载你的网站,点击录制,完成。或者直接直播到 Twitch 或 YouTube。
免费试用: [https://apps.apple.com/us/app/demo-scope/id6755395174](https://apps.apple.com/us/app/demo-scope/id6755395174)
如果有人尝试过,欢迎反馈。
我制作了一个以移动演示为中心的着陆页,专注于专业项目,但老实说,我主要的使用场景是通过手机在 Twitch 上直播基于浏览器的游戏。