返回首页

一周热榜

2作者: wkyleg6 天前原帖
我在使用大型语言模型(LLMs)时遇到的主要问题,以及最阻碍我进一步采用它们的原因,是代理无法记住相关上下文。<p>几年前,大家都在使用RAG、嵌入、数据库等技术来增强模型的能力。而现在,能够访问本地Markdown和记忆文件的模型(如OpenClaw)似乎在性能上明显优于这些依赖grep和简单UNIX工具的数据库。<p>这是LLMs在扩展时固有的问题吗?对于大多数人来说,Obsidian的效果真的好得多吗?有没有人发现有什么东西实际上能超越Markdown?<p>目前,我在采用这些技术时的主要瓶颈似乎是记忆和持久的长期上下文,而不是模型的质量或可靠性。<p>我很好奇是否有任何技术或扩展指标可以用来预测这一领域的未来发展方向。
2作者: BohdanPetryshyn3 天前原帖
我们从2006年10月以来每天收集了前三条HN(Hacker News)故事(总计约21,000条),对这些故事进行了主题聚类,并可视化了主题随时间的变化情况。<p>您可以放大查看任何时间段——一些模式出人意料地清晰(例如,人工智能超越创业文化成为HN的热门话题,加密货币的兴起与衰落,以及因COVID疫情导致的远程工作的激增)。<p>欢迎随时询问有关方法论的问题。
2作者: kulesh3 天前原帖
Tril将代码库中的每个函数转换为简单的英文描述,然后运行并测试它们——使用大型语言模型(LLM)作为解释器,而不是运行时环境。 这个概念是:编程语言的存在是因为机器无法理解人类的意图。而大型语言模型可以理解。那么,如果完全去掉代码,仅仅描述每个函数应该做什么,会发生什么呢? 这个工具逐个替换函数,在每次替换后运行测试套件以确认没有出现错误,并输出一个.md文件。然后,`tril run`会启动一个HTTP服务器,将每个函数的英文描述发送给Claude,并返回结果。 在一个单位转换器(JavaScript)和一个625行的Python命令行工具上进行了测试——测试通过,结果精确到小数点后六位(幸运的是)。 这主要是一个思想实验:任何代码都能变成简单的自然语言吗?它仍然能正常工作吗?让我们来看看吧! npm: npx @sliday/tril convert URL GitHub: [https://github.com/sliday/tril](https://github.com/sliday/tril)
2作者: Bleiglanz3 天前原帖
我对这种炒作曾经翻了个白眼,但实际上,<i>阅读</i>这方面的内容和<i>体验</i>它是完全不同的。如果你有任何旧的代码库,试试看,你可能会感到惊讶。 我不确定对于复杂的遗留企业系统,长期的“*90% 生产力*”的说法是否可信,但对于模板、库、构建工具和重构来说,收益是巨大的。那些耗时且令人紧张的工作大部分都得到了处理。 一开始你会像鹰一样仔细检查每一个差异,期待它会破坏东西,但老实说,很快你会发现大多数情况下这并不是必要的。你只需保持IDE开启,将“分析代码”的输出反馈给它。在Java中,告诉它“<i>添加checkstyle,运行mvn verify并修复</i>”的效果很好,你甚至可以去喝杯咖啡,而不是与linter警告作斗争。 理论上,剩下的只是<i>逻辑</i>和<i>想法</i>。当架构真正变得复杂时,我们将看看这一点是否成立。但目前,让它分支、创建模板并编写简单的测试,同时你只需在规格上进行迭代,效果出奇地好。只有在写下规格用普通英语太麻烦时,你才会编写源代码。 这提出了一个真正的问题:如果你的竞争对手Y刚刚解雇了90%的开发人员以节省成本,你会盲目跟随吗?还是会保留你的团队,利用这个巨大的杠杆,以一个远远更好的产品将Y彻底超越?
2作者: killme20084 天前原帖
嗨,HN 我创建TMA1是因为我想更好地理解编码代理实际上在做什么——包括令牌/成本使用、工具调用、延迟、失败、完整会话重放等。最重要的是,我不想注册或向任何云服务发送数据。 当然,它是开源的: [https://github.com/tma1-ai/tma1](https://github.com/tma1-ai/tma1)
2作者: davidstarkjava4 天前原帖
大家好,给任何独立创始人或开发者设置电子邮件基础设施的朋友们一个重要提醒。昨晚我差点被微软的结账界面彻底坑了。 我在使用 Microsoft 365 Business Basic 的 30 天免费试用,目的是测试我创业公司的电子邮件路由。我决定提前转为付费订阅,点击了“转换为付费订阅”按钮。价格清楚地标示为每月 3.68 美元。我确认了。 他们发了一封 0.00 美元的确认邮件(通常是预授权的内容),我就放心地去睡觉了。 今天早上醒来,收到银行的交易失败警报,金额为 99.00 美元。 我心里一沉。幸好我用的卡因为汇率原因少了几块钱,所以交易未能成功。如果我用的是我的主信用卡,我就会无缘无故损失一百美元。 我重新登录到管理中心(那简直是个迷宫)想弄清楚发生了什么。结果发现,当你点击“转换为付费”时,微软默认会默默地将数量填充为 25 个许可证。25 个用户 x 3.68 美元 = 92 美元 + 税费 = 99 美元。 没有明确的弹窗提示,也没有“你确定要为一个人公司购买 25 个席位吗?”这样的提示。只是一个隐藏在复杂界面中的默认值,旨在从那些不仔细检查每个下拉菜单的人身上榨取最大化的每用户平均收入。 最糟糕的部分?联系支持。找到实际的支持工单页面就像大海捞针。我甚至问了 Copilot 和 Gemini 找到这个问题的直接微软支持链接,但两个 AI 给我的都是无用的过时链接。我不得不翻阅一些冷门的论坛帖子,才找到隐藏的支持门户来申诉这个问题。 总结一下:1. 在处理大型科技公司的 SaaS 时,始终使用虚拟卡或限额卡。 2. 升级 MS365 时,仔细检查“数量”字段。他们会试图偷偷将 25 个许可证放入你的购物车。 有没有其他人也掉进这个陷阱?如果有人目前被困在微软的支持循环中,需要打开账单工单的直接链接,请告诉我,我会在评论中分享。
2作者: megamike4 天前原帖
美国以外的世界氦气短缺将对以技术为导向的生产造成严重影响。由于美国生产了全球大部分的氦气,这实际上成为了我们对稀土依赖的一个对策。全球范围内,氦气短缺已经持续了十多年。切断卡塔尔的供应将迅速扰乱芯片组的生产。有人知道重新启动卡塔尔的氦气工厂需要多长时间吗?