1作者: nyku大约 1 个月前原帖
我经常使用大型语言模型(LLMs)来自动化不同的工作流程,其中一些包括浏览网页和收集数据。某个时候,我开始注意到一些让我困扰的事情:浏览器的交互非常笨拙,仿佛代理在“看”和理解页面时遇到了困难,因此浪费了很多令牌。对于页面是否真正准备好也是如此。 我开始深入研究,最终在Cursor聊天中直接问了一个问题:“作为一个使用无头浏览器的LLM,我想问你,希望人们构建什么来让你的工作更轻松?” 这个问题取得了效果,因为我扩展了“思考”部分,看到:“用户在问我一个非常有趣的元问题……”之后,它列出了与代理和浏览器交互相关的十大最痛苦的问题。 于是,我开始构建一个浏览器API,返回LLMs实际需要的内容,而不是浏览器返回的内容。 几周后,我们终于完成了一个专门帮助LLMs与真实浏览器交互的REST API。 与其读取原始HTML,你将获得Markdown、页面地图、短引用(e1,e2)用于点击而不是CSS选择器、页面准备好的稳定标志、每一步之后的差异、所有交互元素(链接、按钮、输入)的列表、自动阻止器解除,以及一个小的提取步骤,返回你描述的结构化JSON。 官方SDK支持Python、TypeScript和Ruby。为Cursor和Claude Desktop提供MCP服务器。 非常欢迎任何反馈,尤其是关于API设计的意见。
1作者: lukasfischer大约 1 个月前原帖
我没有想到浏览器技术会如此迅速地创新。但这款无缓存浏览器确实是一个定义新类别的产品。你可以自己看看: https://youtu.be/v1EnCo6dodk?si=kXZx2vs6GYPelAGn 你怎么看?
3作者: Barazutti629大约 1 个月前原帖
大家好,我收到了来自Brex的请求,要求更新居住地址证明。我们在特拉华州注册了公司(使用Stripe Atlas),我们是非美国创始人,不住在美国,因此无法满足这个要求。我想很多创始人也不在美国,所以我很好奇你们是如何处理这个问题的。 另外,如果你们有关于使用其他银行服务的建议,那将非常有帮助。谢谢!
1作者: koito17大约 1 个月前原帖
今天早上收到了以下电子邮件。 嗨, 我们将在下周的稳定版本中停止支持文本线程,特此通知您,作为曾使用该功能的用户。 文本线程是Zed最初的AI界面,在代理面板出现之前就已构建。随着代理面板在工具使用和其他代理能力方面的成熟,文本线程的开发已停止。为了避免维护一个我们不再积极改进的功能,我们决定移除它们,以便专注于构建一个更好的与代理互动的界面。 我们正在积极努力使代理面板更像一个编辑器,因此文本线程背后的理念将以更强大的形式继续发展。 感谢您使用Zed。 – Zed团队