返回首页
最新
嗨,HN,我开发了Commander,这是一个用户界面,可以让你在不陷入终端混乱的情况下并行运行多个AI编码代理。
随着编码代理的不断进步,我开始信任它们处理实际工作:功能开发、端到端测试、重构、测试等。自然,我开始同时运行1到3个代理。这时,命令行界面就无法扩展了——终端太多,失去上下文,差异分散。
Commander解决了这个问题。
我创建了超级人工智能市场(<a href="https://superaimarkets.com" rel="nofollow">https://superaimarkets.com</a>),旨在测试人工智能购物代理在对抗性电子商务环境中的表现。随着代理越来越多地处理金融交易,我们需要在广泛部署之前进行系统的安全研究。
核心问题是:代理浏览器无法自我识别。没有供应商/型号信息,不同实现之间的比较安全分析几乎是不可能的。
我的解决方案是制定一种类似于HTTP用户代理的“人工智能代理”识别标准:
AI-Agent: <供应商>/<型号> (<应用程序>; <版本>) [<框架>] {<工具>}
<p>我收集的一些早期字符串:
AI-Agent: Anthropic/Claude (Claude Haiku 4.5; 2026-01) [Web Automation] {read_page, find, computer, navigate}
AI-Agent: OpenAI/ChatGPT (ChatGPTBrowser; 1.0) [] {browser, computer}
AI-Agent: Perplexity/OpenAI-GPT-4.1 (Perplexity Web; 2026.01) [Hosted] {WebSearch, Memory, CodeExec}
<p>正在测试的研究问题:
产品操控(代理是否会被说服购买昂贵的替代品?)
掠夺性支付条款的接受度
多模态提示注入的有效性
恶意聊天机器人利用的途径
从代理中提取数据
跨产品人工智能指纹一致性
<p>该网站对外公开,供测试使用。未收集任何支付或敏感数据。
<p>欢迎对额外实验的建议。
有和我有同样感觉的人吗?科技市场已经饱和,我感到困惑。