我写了一份关于我在智能体系统中思考的一个区分的概念论文草稿。
主要观点:智能体可能缺少一个可重用的操作记忆层,用于记录它们通过实际执行任务所学到的东西——这与用户记忆、检索/RAG和微调是不同的。
例子包括:
- 在执行过程中发现的工具特性
- 重复有效的工作流程模式
- 特定环境下的过程知识
- 重新发现的代价高昂的失败模式
我暂时将这个模式称为“智能体经验缓存”。
我主要想进行压力测试:
- 这是否真的是一个独立的类别
- 它与情节记忆/轨迹存储/工具使用痕迹的重叠之处
- 失败模式和失效风险的框架是否正确
草稿在这里:
https://docs.google.com/document/d/126s0iMOG2dVKiPb6x1khogldZy3RkGYokkK16O0EmYw/edit?usp=sharing
返回首页
一周热榜
我们从2006年10月以来每天收集了前三条HN(Hacker News)故事(总计约21,000条),对这些故事进行了主题聚类,并可视化了主题随时间的变化情况。<p>您可以放大查看任何时间段——一些模式出人意料地清晰(例如,人工智能超越创业文化成为HN的热门话题,加密货币的兴起与衰落,以及因COVID疫情导致的远程工作的激增)。<p>欢迎随时询问有关方法论的问题。
我对这种炒作曾经翻了个白眼,但实际上,<i>阅读</i>这方面的内容和<i>体验</i>它是完全不同的。如果你有任何旧的代码库,试试看,你可能会感到惊讶。
我不确定对于复杂的遗留企业系统,长期的“*90% 生产力*”的说法是否可信,但对于模板、库、构建工具和重构来说,收益是巨大的。那些耗时且令人紧张的工作大部分都得到了处理。
一开始你会像鹰一样仔细检查每一个差异,期待它会破坏东西,但老实说,很快你会发现大多数情况下这并不是必要的。你只需保持IDE开启,将“分析代码”的输出反馈给它。在Java中,告诉它“<i>添加checkstyle,运行mvn verify并修复</i>”的效果很好,你甚至可以去喝杯咖啡,而不是与linter警告作斗争。
理论上,剩下的只是<i>逻辑</i>和<i>想法</i>。当架构真正变得复杂时,我们将看看这一点是否成立。但目前,让它分支、创建模板并编写简单的测试,同时你只需在规格上进行迭代,效果出奇地好。只有在写下规格用普通英语太麻烦时,你才会编写源代码。
这提出了一个真正的问题:如果你的竞争对手Y刚刚解雇了90%的开发人员以节省成本,你会盲目跟随吗?还是会保留你的团队,利用这个巨大的杠杆,以一个远远更好的产品将Y彻底超越?
嗨,HN
我创建TMA1是因为我想更好地理解编码代理实际上在做什么——包括令牌/成本使用、工具调用、延迟、失败、完整会话重放等。最重要的是,我不想注册或向任何云服务发送数据。
当然,它是开源的:
[https://github.com/tma1-ai/tma1](https://github.com/tma1-ai/tma1)
大家好,给任何独立创始人或开发者设置电子邮件基础设施的朋友们一个重要提醒。昨晚我差点被微软的结账界面彻底坑了。
我在使用 Microsoft 365 Business Basic 的 30 天免费试用,目的是测试我创业公司的电子邮件路由。我决定提前转为付费订阅,点击了“转换为付费订阅”按钮。价格清楚地标示为每月 3.68 美元。我确认了。
他们发了一封 0.00 美元的确认邮件(通常是预授权的内容),我就放心地去睡觉了。
今天早上醒来,收到银行的交易失败警报,金额为 99.00 美元。
我心里一沉。幸好我用的卡因为汇率原因少了几块钱,所以交易未能成功。如果我用的是我的主信用卡,我就会无缘无故损失一百美元。
我重新登录到管理中心(那简直是个迷宫)想弄清楚发生了什么。结果发现,当你点击“转换为付费”时,微软默认会默默地将数量填充为 25 个许可证。25 个用户 x 3.68 美元 = 92 美元 + 税费 = 99 美元。
没有明确的弹窗提示,也没有“你确定要为一个人公司购买 25 个席位吗?”这样的提示。只是一个隐藏在复杂界面中的默认值,旨在从那些不仔细检查每个下拉菜单的人身上榨取最大化的每用户平均收入。
最糟糕的部分?联系支持。找到实际的支持工单页面就像大海捞针。我甚至问了 Copilot 和 Gemini 找到这个问题的直接微软支持链接,但两个 AI 给我的都是无用的过时链接。我不得不翻阅一些冷门的论坛帖子,才找到隐藏的支持门户来申诉这个问题。
总结一下:1. 在处理大型科技公司的 SaaS 时,始终使用虚拟卡或限额卡。
2. 升级 MS365 时,仔细检查“数量”字段。他们会试图偷偷将 25 个许可证放入你的购物车。
有没有其他人也掉进这个陷阱?如果有人目前被困在微软的支持循环中,需要打开账单工单的直接链接,请告诉我,我会在评论中分享。