返回首页
最新
我经常使用大型语言模型(LLMs)来自动化不同的工作流程,其中一些包括浏览网页和收集数据。某个时候,我开始注意到一些让我困扰的事情:浏览器的交互非常笨拙,仿佛代理在“看”和理解页面时遇到了困难,因此浪费了很多令牌。对于页面是否真正准备好也是如此。
我开始深入研究,最终在Cursor聊天中直接问了一个问题:“作为一个使用无头浏览器的LLM,我想问你,希望人们构建什么来让你的工作更轻松?”
这个问题取得了效果,因为我扩展了“思考”部分,看到:“用户在问我一个非常有趣的元问题……”之后,它列出了与代理和浏览器交互相关的十大最痛苦的问题。
于是,我开始构建一个浏览器API,返回LLMs实际需要的内容,而不是浏览器返回的内容。
几周后,我们终于完成了一个专门帮助LLMs与真实浏览器交互的REST API。
与其读取原始HTML,你将获得Markdown、页面地图、短引用(e1,e2)用于点击而不是CSS选择器、页面准备好的稳定标志、每一步之后的差异、所有交互元素(链接、按钮、输入)的列表、自动阻止器解除,以及一个小的提取步骤,返回你描述的结构化JSON。
官方SDK支持Python、TypeScript和Ruby。为Cursor和Claude Desktop提供MCP服务器。
非常欢迎任何反馈,尤其是关于API设计的意见。
手动制作流程图太耗时间了,因此我创建了一个网站,通过人工智能聊天生成流程图,试试吧: https://chatflowchart.com/
我没有想到浏览器技术会如此迅速地创新。但这款无缓存浏览器确实是一个定义新类别的产品。你可以自己看看: https://youtu.be/v1EnCo6dodk?si=kXZx2vs6GYPelAGn
你怎么看?
大家好,我收到了来自Brex的请求,要求更新居住地址证明。我们在特拉华州注册了公司(使用Stripe Atlas),我们是非美国创始人,不住在美国,因此无法满足这个要求。我想很多创始人也不在美国,所以我很好奇你们是如何处理这个问题的。
另外,如果你们有关于使用其他银行服务的建议,那将非常有帮助。谢谢!
今天早上收到了以下电子邮件。
嗨,
我们将在下周的稳定版本中停止支持文本线程,特此通知您,作为曾使用该功能的用户。
文本线程是Zed最初的AI界面,在代理面板出现之前就已构建。随着代理面板在工具使用和其他代理能力方面的成熟,文本线程的开发已停止。为了避免维护一个我们不再积极改进的功能,我们决定移除它们,以便专注于构建一个更好的与代理互动的界面。
我们正在积极努力使代理面板更像一个编辑器,因此文本线程背后的理念将以更强大的形式继续发展。
感谢您使用Zed。
– Zed团队