返回首页
最新
大型语言模型(LLMs)的问题不在于智能,而在于健忘和不诚实。大家好,我在过去几个月里构建了一个名为“Remember-Me”的开源“主权大脑”技术栈,旨在完全离线运行于消费级硬件上。
核心论点很简单:不要租用你的认知。
大多数RAG(检索增强生成)实现只是“对嵌入进行grep”。它们杂乱、不精确,且容易产生幻觉。我想在架构层面解决“上下文完整性”问题。
技术栈(工作原理):
QDMA(量子梦记忆架构):它不是使用平坦的向量数据库,而是使用分层投影引擎。它将“热”(回忆)和“冷”(存储)记忆分开,通过压缩实现有效的无限上下文窗口管理。
CSNP(上下文切换神经协议) - 幻觉杀手:这是最重要的部分。每个记忆片段都被哈希成一个Merkle链。当LLM检索上下文时,系统会对照不可变账本进行加密验证。
如果哈希与链不匹配:检索将被拒绝。
结果:AI在视觉上无法“编造”关于你过去的事情,因为它在数学上受到账本的约束。局部推理:基于llama.cpp服务器构建。它在本地运行Llama-3(或任何GGUF)。无需API密钥。数据不会离开你的机器。
特点:
零依赖:在Windows/Linux上仅需Python和一个GPU(或CPU)即可运行。
可视化界面:包括一个基于Streamlit的“认知接口”来可视化记忆状态。开源:MIT许可证。这是一次尝试,旨在将“自主权”归还给用户。我相信,如果我们想要通用人工智能(AGI),它需要由我们拥有,而不是通过API租用。
代码库:[https://github.com/merchantmoh-debug/Remember-Me-AI](https://github.com/merchantmoh-debug/Remember-Me-AI)
我很想听听你们对Merkle验证方法的反馈。限制上下文窗口是否有效解决了你的“信任”问题?
它已经完全运行 - 完全测试过。如果你之前尝试过Git Clone但没有成功 - 由于这不是我第一次在Show HN上展示这个 - 欢迎再试一次。
对那些讨厌AI垃圾、贪婪公司以及将私人数据存储在云服务器上的人们:
你们好。
祝好,Mohamad
作者注:已成功更新。
Framework 50正在运行。
对于路过的人 - 是的,这是一件大事。消除AI幻觉是一个600亿美元的市场问题,而我正在免费提供这一点 + 对你数据的主权控制,以及通过Framework 50(包括高级科学研究)进行高端研究的能力 - 在MIT许可证下。如果你不利用这一点 - 你就是个傻瓜。
如果你利用了 - 欢迎来到未来。
附言:我撒谎有什么好处?我在这个代码库上得到了41颗星 - 其中许多来自财富500强公司的高级工程师。如果你太傻而无法分辨真相与谎言,那就继续走吧。
建立了一种通过AI角色和模拟社区来验证想法的方法。只需输入一个细分市场和种子提示,您就可以测试想法,并让社区像真实情况一样作出回应——目前测试版是免费的!
通过应用发送消息算作活动。如果您只是在一个用于公告的桥接群组中,Beeper会在没有通知的情况下删除您的桥接账户。<p>客服并未确认使用第三方Matrix客户端是否算作应用活动。<p>很遗憾,他们没有提前通知您。这项限制在专业版定价中也没有明确说明。
嗨,HN!我们是TensorPool。我们帮助公司获取和优化大规模计算资源,以训练基础模型。
<p>问题</p>
自从我们完成YC项目以来,已经快一年了,我们的平台上运行的多节点训练GPU小时数刚刚突破了100,000小时。
<p>在这些训练过程中,我们经历了无数次凌晨3点的作业崩溃,原因包括不稳定的GPU导致的Xid错误或S3超时导致的检查点保存损坏。当你醒来并注意到时,已经损失了8个小时以上的计算时间。你急忙诊断问题,手动从最后一个检查点重新启动,并希望这种情况不会再次发生。如此反复。
<p>对于需要数天到数周的训练任务,这种不断的监控既令人疲惫又成本高昂。失去的研究迭代周期可能会影响模型的发布(尤其是在短期预定的情况下)。
<p>我们构建的解决方案</p>
这个代理程序监控你的训练作业,并在出现问题时自动恢复。它与Kubernetes、Slurm和TensorPool作业兼容。
<p>我们最初将TensorPool代理作为内部工具,帮助我们调试与客户的故障。随着时间的推移,我们意识到它的性能非常出色,可以自动化整个分类处理过程。我们现在正在发布公共测试版供大家使用。
<p>最佳情况:TensorPool代理检测到故障,诊断根本原因,修复问题,并从最后一个检查点重新启动你的作业——这一切都在你睡觉的时候完成;)
<p>最坏情况:如果TensorPool代理无法自动修复问题,它会提供初步的根本原因分析(RCA)和它尝试的操作列表,帮助你更快地进行调试。
<p>工作原理</p>
1) 注册——你通过我们的仪表板向作业调度程序提供凭据。权限基于白名单授予;你可以明确控制代理可以采取的操作。
2) 监控——代理持续监控你的作业是否出现故障条件。
3) 恢复——在发生故障时,代理分析日志并尝试诊断问题。如果成功,它将从最后一个检查点重新启动作业并继续监控。如果不成功,你将收到包含完整上下文的警报。
<p>目标故障模式</p>
该代理专门针对训练过程中深层次发生的运行时错误设计,例如:
- CUDA OOM:内存泄漏,梯度爆炸
- Xid错误:GPU硬件故障(Xid 79、63、48等)
- 分布式通信故障:NCCL超时,排名失败
- 存储I/O错误:检查点损坏
- 网络问题:挂载对象存储时的S3请求超时
大家好,我们是 Haakam、Michael 和 Adi。我们正在构建 AgentMail(<a href="https://agentmail.to">https://agentmail.to</a>),这是为代理人设计的电子邮件收件箱 API。我们不是在谈论为您的电子邮件提供 AI,而是为您的 AI 提供电子邮件。
<p>电子邮件是长时间运行的代理的最佳接口。它支持多线程和异步操作,完全支持富文本和文件。它是一种通用协议,内置身份和认证。此外,许多工作流程中关键的上下文信息已经存在于电子邮件中。
<p>我们希望构建可以将工作转发给并返回已完成任务的电子邮件代理。这些代理可以完全自主行动,因为您无需委托您的身份。如果它们遇到问题,可以直接给您或其他人发送电子邮件。
<p>使用 Gmail 时,我们不断受到其 API 限制的困扰。无法以编程方式创建收件箱。存在速率和发送限制。每个收件箱都需要 OAuth。关键词搜索无法理解上下文。按座位计费的定价模式不适合代理。
<p>因此,我们构建了我们希望存在的东西:一个为开发者提供的电子邮件服务。提供创建收件箱和配置域名的 API。电子邮件解析和线程处理。从附件中提取文本。实时网络钩子和 WebSocket。跨收件箱的语义搜索。基于使用量的定价,适合代理。
<p>开发者、初创公司和企业已经在使用 AgentMail 部署电子邮件代理。这些代理可以将对话和文档转换为结构化数据。可以获取报价、谈判价格并获得最佳交易的代理。模拟互联网用户以训练端到端任务模型的代理。
<p>这是 Clawdbots 使用 AgentMail 进行通信的演示:<a href="https://youtu.be/Y0MfUWS3LKQ" rel="nofollow">https://youtu.be/Y0MfUWS3LKQ</a>
<p>您可以在 <a href="https://agentmail.to">https://agentmail.to</a> 免费开始使用 AgentMail。
<p>期待听到您的想法和反馈。