简短回答:是的。<p>Emotion Engine 总共有 32 MB 的 RAM,因此关键在于在前向传播过程中一次从 CD-ROM 流式传输一个矩阵的权重——只有激活值、KV 缓存和嵌入存储在 RAM 中。这意味着比 RAM 大的模型仍然可以运行,只是需要从磁盘读取更多数据。<p>我不得不构建一个自定义的量化格式(PSNT),修改字节序,编写一个分词器管道,以及从头开始编写大部分 PS2 SDK(将单独发布)。模型本身也是自定义的——我专门为此训练了一个 1000 万参数的 Llama 风格架构。<p>而且它在真实硬件上运行良好。
返回首页
一周热榜
我自学成才,拥有工程背景,目前在美国担任质量保证工程师。请问有什么建议可以帮助我在英国或爱尔兰找工作吗?有没有人做过类似的事情?
嗨,HN!<p>我正在构建一个处理高价值凭证的项目,我希望它比仅仅在丢弃时清零内存更加稳健。在最近的一个Show HN评论中,我意识到对低级内存保护技术的认识可能没有我想象的那么普遍。<p>这里的想法是将所有工具整合到一个库中,并提供相对简单的API。
* 使用mlock/VirtualLock防止敏感内存被交换(例如KeePass转储)
* 在Linux和Android上使用MADV_DONTDUMP进行核心转储排除
* 使用mprotect来最小化暴露时间
* 使用保护页来缓解下溢/上溢问题<p>经过一些实战测试,我的目标是为密码管理器和加密货币钱包等提供更安全的内存基础。<p>这是一个有趣的项目,我学到了很多——非常欢迎任何反馈!<p>[0] - <a href="https://news.ycombinator.com/item?id=47073430">https://news.ycombinator.com/item?id=47073430</a>
上周,我们让一个AI代理在一个服务中重命名了一个字段。结果导致另外三个服务在生产环境中出现了故障。由于这些依赖关系并不在代码中,而是在某个人的脑海里,审查时没有人发现这个问题。
我所在的公司正在推动我们在开发人员更少的情况下交付更多的产品,我们都在使用Claude Code。这在单个服务内的开发速度上确实很惊人。但是在微服务的环境中,这就像把电锯交给一个看不见墙壁的人。AI的速度远远超过了团队追踪依赖关系的能力。
你们是如何应对这个问题的?还是大家在部署之间只是祈祷?
嗨,大家好,我是来自 Budibase 的 Mike。
我们最近推出了 AI Agents 的测试版,与我们现有的开源应用构建和自动化工具一同发布。
我们为希望在实际工作流程中利用 AI 的团队构建了 Budibase Agents,支持使用他们自己的大型语言模型(LLMs)、数据和 API。因此,我们的 Agents 可以由任何具有 OpenAI 兼容 API 的 LLM 驱动,包括开源和本地托管的模型。这意味着您可以构建与现有工具栈连接的 Agents,并在自己的环境中使用。
更多细节如下:
- Agents 的行为通过自然语言指令在现有的 Budibase 工作区中进行配置。
- 您可以明确控制 Agent 可以访问哪些数据源、API 和自动化。
- 最终用户可以通过 Budibase Chat 或使用现有的聊天工具(如 Slack 和 Discord)与您的 Agents 进行互动。
- Agents 可以从自动化中调用,反之亦然,从而实现复杂的工作流程,包括与最终用户应用进行交互以获取手动审批。
Budibase Agents 测试版现已向所有自托管和云用户开放。
由于这是一个测试版发布,我们非常希望听到您对如何改善 Agents 的体验和功能的反馈,以便更好地在现实工作流程中使用 AI。
欢迎通过我们的 GitHub 讨论区与我们联系: [https://github.com/budibase/budibase/discussions](https://github.com/budibase/budibase/discussions)
作为一个实验,我开始让Claude用虚构故事来向我解释事物,结果效果非常好。因此,我开始探索这个方法的极限,以及需要什么才能将其打磨到足以公开分享的程度。<p>在过去的几个月里,我为这个项目构建了世界观手册、撰写了视觉风格指南以及其他相关文档……可以把它们想象成我们现在用于代理开发的所有Markdown文件的虚构等价物。在此之后,我又花了大约两周的时间进行额外的打磨工作,以去除许多冗余内容和LLM特有的表达方式。如果有人对此过程感兴趣,我也很乐意回答任何问题。
我认识的大多数开发者都转向了 Cursor 或 Codex。不过我还是时不时看到有人提到 Windsurf。
我理解为什么有人会继续使用它——JetBrains 的支持、稍微便宜一些、在大型代码库上表现不错。但在 Cognition 收购之后,我不太确定它的未来。
所以我真的很好奇,你还在使用 Windsurf 吗?是什么让你继续使用它?有没有什么让你后悔没有换的事情?
不知道战争是否会迫使公司重新采用远程办公,以控制油价和供应。如果加油站没有油或者需要等一个小时,那上班就很困难了。
我对在大型语言模型(LLM)时代,科技行业的人们是如何避免技能退化的很感兴趣。
我们都看到了这个争论的两种观点,一方面是“让他们退化,LLM是未来,看看算盘就知道了!”另一方面是“我不使用LLM,它们会出错并且妨碍工作”。但对许多人来说,现实是LLM确实提供了真正的性能提升,并承担了许多任务,即使它们会出错并需要人们的监督。
我倾向于谨慎对待技能的退化,因为在中长期内,LLM将如何影响工作场所以及哪些技能会被使用仍有太多未知。因此,我想知道你们是如何在面对“让它实现”的诱惑时,保持现有技能不退化的?
我一直在帮助一些公司招聘创始工程师。在进行大量筛选后,我对应该关注的方面有了大致的了解。对于其他有丰富招聘经验的人来说,除了技术能力之外,你们具体还看重哪些方面呢?