7作者: gregpr078 天前原帖
嘿,HN – Gregor 和 Magnus 又来了。 几个月前,我们推出了 Browser Use(<a href="https://news.ycombinator.com/item?id=43173378">https://news.ycombinator.com/item?id=43173378</a>),它允许大型语言模型(LLM)使用自然语言提示在浏览器中执行任务。这对于像预订航班或查找产品这样的单次任务非常有效,但我们很快意识到企业的需求有所不同: 他们通常有一个包含动态变量的工作流程(例如,填写表单和下载 PDF),希望能够可靠地运行一百万次而不出错。纯 LLM 代理在这些高频任务中表现得既慢又昂贵,而且不可预测。 因此,我们开始着手开发 Workflow Use: - 你可以通过手动录制步骤向浏览器展示要做什么(展示而非描述)。 - LLM 将这些录制转化为带变量的确定性脚本(脚本中也包含 AI 步骤,完全由代理执行)。 - 脚本运行可靠,速度比 Browser Use 快 10 倍,成本约便宜 90%。 - 如果某个步骤出错,工作流程将回退到 Browser Use,并由代理执行该步骤。(这个自愈功能仍处于早期阶段。) 这个项目刚刚启动,所以很多功能可能会出现问题,绝对还没有准备好投入生产,许多东西仍然缺失(比如一个稳定的编辑器和完善的自愈功能)。但我们希望尽早分享,获取反馈,并了解你们希望以这种方式自动化哪些工作流程。 试试看,告诉我们你的想法!