想象一下,雇佣10位专家,给他们1000行的指令,结果却是混乱而非协调的工作。这就是我一个月来构建AI代理框架的经历。
我的目标非常雄心勃勃:建立一个完全自主的系统,让一群AI代理——包括研究员、架构师、TDD测试员等——能够接手任务,并处理从规划到部署的所有工作。我设计了一个复杂的多阶段工作流程,包含像“升级(ESCALATION)”这样的协议和详细的“任务简报”。在纸面上,这是一台完美的自我管理机器。
然而,现实却是一场昂贵的噩梦。系统频繁出现文件编辑错误,无限循环消耗了数万个令牌,还有“幽灵执行”,即协调者在没有写一行代码的情况下就将任务标记为完成。我的工作从开发者转变为全职的提示调试员。
在绝望中,我在Reddit上发帖,得到的解决方案并不是更好的提示,而是一个评论让我去禁用工具设置中的两个“实验性”复选框。奇迹般地,90%的文件编辑问题消失了。
这引发了一个痛苦但至关重要的实验:如果我去掉所有精心设计的、超详细的提示,回归默认设置,会发生什么?结果令人沮丧:系统的表现几乎没有变化。
阅读完整故事,查看详细的架构图和我最终简化的工作流程:https://xor01.substack.com/p/my-war-with-ai-agents
返回首页
最新
大家好!我在过去的几年里独自构建了一系列API,以帮助查询电商网站的搜索引擎结果页面(SERP)、产品详情页面(PDP)和评论数据。我已经拥有了数百个客户和稳定的收入。最近,ScrapingBee(一个流行的爬虫API服务)开始模仿我,所以我想终于做一次Show HN。请对我的产品提出批评意见。我非常感谢你的反馈。如果你想要免费积分,请通过电子邮件与我联系,如果你的邮件看起来不是垃圾邮件,我会发送给你。谢谢!
嗨,HN,
在构建了 kexa.io 这个开源解决方案,用于扫描云环境中的错误配置后,我们很高兴地宣布推出由 AI 驱动的高级版本,提供修复建议。
当我们首次推出 Kexa 时,我们的目标是为开发者和安全团队提供一个简单、统一、原生支持基础设施即代码(Infrastructure-as-Code)的工具,以自动化 AWS、GCP、Azure 等平台的合规性和安全检查。
感谢大家在我们上一个 HN 文章中提供的反馈!
其中一条反馈特别引人注目:虽然开发者们喜欢 IaC 方法,但许多团队希望能够可视化他们的安全态势,管理规则,并在不深入配置文件的情况下跟踪修复进度。
这就是我们构建高级版本的原因。
我们添加了一个网页界面,可以:
- 从单一网页界面可视化您整个多云的安全态势。
- 通过用户界面管理您的规则,并使用我们的无代码规则构建器进行编辑。
- 提供基于 CIS 基准和 Kexa 规则的清晰见解的 AI 修复建议。
我们希望您能访问 <a href="https://www.4urcloud.eu/" rel="nofollow">https://www.4urcloud.eu/</a> 来了解更多信息。
请通过在 GitHub 上给 kexa.io 开源项目点赞来支持我们!
欢迎提出任何问题。大家觉得怎么样?您目前是如何处理大规模的多云合规性和错误配置扫描的?
联系邮箱:contact@kexa.io
嘿,HN,
我开发了SnapSort,这是一款跨平台应用,利用谷歌的Gemini自动整理和分类你的照片。
为什么我开发它:
你是否曾经截了屏想发给朋友,却忘记了?或者下载了一张照片,却从未将其移出下载文件夹?你的照片、桌面和下载文件夹慢慢变得一团糟。
我厌倦了充满过去三年截图的杂乱文件夹。我想要一个利用人工智能自动整理照片的工具。
它的功能:
- 利用Gemini将照片分类,如人像、食物、自然或文档
- 自动将整理好的图片复制或移动到文件夹中
- 适用于macOS(Intel和ARM)、Windows和Linux
- 专业版增加了后台监控、自定义分类和移动操作
- 一次性许可证,终身更新,无需订阅
你可以使用自己的API密钥;SnapSort不会存储或发送你的图片到其他地方。分析通过你的密钥进行,所有结果都保留在你的设备上。
如果你的图片文件夹杂乱无章,SnapSort可以帮助你在几分钟内恢复秩序。
在这里下载: [https://snapsort.dev](https://snapsort.dev)
希望能收到关于以下方面的反馈:
- 设置的简易性(特别是Gemini API密钥)
- 分类的准确性
- 你希望下一个版本增加的功能(例如,本地嵌入、自动标记、重复项处理)
感谢你的关注!
— Sumit