返回首页

一周热榜

2作者: jberthom4 天前原帖
我每天使用AI代理来构建用户界面功能。让我感到烦恼的一点是:代理编写代码,但从未看到它在浏览器中的实际效果。它无法判断布局是否破损,或者控制台是否抛出错误。 因此,我构建了一个命令行工具(CLI),让代理可以打开浏览器、与页面互动、记录发生的事情,并收集任何错误。然后,它将所有内容——视频、截图、日志——打包成一个自包含的HTML文件,我可以在几秒钟内查看。 ```bash proofshot start --run "npm run dev" --port 3000 # 代理导航、点击、截图 proofshot stop ``` 它可以与您使用的任何代理(Claude Code、Cursor、Codex等)配合使用——这只是一些命令行指令。它被打包为一个技能,因此您的AI编码代理确切知道它是如何工作的。它基于Vercel Labs的agent-browser构建,比Playwright MCP更好、更快。 这不是一个测试框架。代理不会决定通过或失败。它只是给我提供证据,这样我就不必每次都自己打开浏览器。 开源且完全免费。 [https://github.com/AmElmo/proofshot](https://github.com/AmElmo/proofshot)
2作者: sayYayToLife5 天前原帖
由于我使用的是开放式爪子(open claw),我对提示注入(prompt injection)的担忧超过了对糟糕代码的担忧。然而,我觉得我这种想法有些不理性地偏执。我只是个小角色,单独一个人,真正想要攻击我的人需要利用一个价值数百万美元的零日漏洞,而他们并不会选择我作为目标。 如果我们考虑通过终端命令意外删除所有内容的情况,我还没有见到这种情况真正发生过。 从演绎的角度来看,我能想象出开放式爪子的所有最坏情况,但从归纳的角度来看,我从未见过它真正发生。 我觉得假装开放式爪子是一个真正的安全风险有点不理性。 一旦我在黑客新闻(Hacker News)上看到有人遭遇了提示注入,我想我会开始担心。直到那时,我几乎需要像中彩票一样的机会,才能成为第一个通过提示注入被黑客攻击的人。