2作者: krzyzanowskim22 天前原帖
嗨,HN,我开发了Commander,这是一个用户界面,可以让你在不陷入终端混乱的情况下并行运行多个AI编码代理。 随着编码代理的不断进步,我开始信任它们处理实际工作:功能开发、端到端测试、重构、测试等。自然,我开始同时运行1到3个代理。这时,命令行界面就无法扩展了——终端太多,失去上下文,差异分散。 Commander解决了这个问题。
1作者: jmchugh922 天前原帖
我创建了超级人工智能市场(<a href="https://superaimarkets.com" rel="nofollow">https://superaimarkets.com</a>),旨在测试人工智能购物代理在对抗性电子商务环境中的表现。随着代理越来越多地处理金融交易,我们需要在广泛部署之前进行系统的安全研究。 核心问题是:代理浏览器无法自我识别。没有供应商/型号信息,不同实现之间的比较安全分析几乎是不可能的。 我的解决方案是制定一种类似于HTTP用户代理的“人工智能代理”识别标准: AI-Agent: <供应商>/<型号> (<应用程序>; <版本>) [<框架>] {<工具>} <p>我收集的一些早期字符串: AI-Agent: Anthropic/Claude (Claude Haiku 4.5; 2026-01) [Web Automation] {read_page, find, computer, navigate} AI-Agent: OpenAI/ChatGPT (ChatGPTBrowser; 1.0) [] {browser, computer} AI-Agent: Perplexity/OpenAI-GPT-4.1 (Perplexity Web; 2026.01) [Hosted] {WebSearch, Memory, CodeExec} <p>正在测试的研究问题: 产品操控(代理是否会被说服购买昂贵的替代品?) 掠夺性支付条款的接受度 多模态提示注入的有效性 恶意聊天机器人利用的途径 从代理中提取数据 跨产品人工智能指纹一致性 <p>该网站对外公开,供测试使用。未收集任何支付或敏感数据。 <p>欢迎对额外实验的建议。