返回首页
最新
嗨,HN——我们是Nithin和Nikhil,双胞胎兄弟,也是nxtscape.ai(YC S24)的创始人。我们正在构建Nxtscape(“下一个景观”)——一个为AI时代设计的开源智能浏览器。
——为什么要费心构建一个新的浏览器?
自1994年Netscape发布以来,我们第一次感到可以从头开始重新构想浏览器,以适应AI代理的时代。未来的网页浏览器可能与我们今天所拥有的完全不同。
我们看到像Cursor这样的工具为开发者带来了10倍的生产力提升,但浏览器——每个人都在这里度过整个工作日——却没有发生根本性的变化。
老实说,我们觉得自己每天都在与使用的浏览器作斗争。这不是一件大事,而是一系列小而持续的挫败感。我会打开70多个标签,来自三个不同的项目,完全失去思路。而像从亚马逊重新订购洗衣胶囊或填写表格这样简单的事情,不应该再需要我们全神贯注。AI可以处理这一切,这正是我们正在构建的。
这是我们早期版本的演示 <a href="https://dub.sh/nxtscape-demo" rel="nofollow">https://dub.sh/nxtscape-demo</a>
——我们与众不同之处
我们知道还有其他团队在探索这个领域(如Perplexity、Dia),但我们希望构建一个开源且以社区为驱动的项目。我们不是搜索或广告公司,因此可以专注于隐私优先——Ollama集成、BYOK(自带密钥)、广告拦截器。
顺便说一下,我们喜欢Brave的初衷和理念,但他们现在在加密、搜索等领域分散了太多精力。我们专注于一件事:让浏览器通过AI为您服务。与我们也很喜欢但被遗弃的Arc不同,我们是100%开源的。如果您不喜欢我们的方向,可以随意分叉我们的项目。
——我们构建新浏览器的旅程
为了实现这一目标,我们不得不对Chromium进行分叉。老实说,这似乎是今天唯一可行的路径——我们看到像Brave(最初使用Electron)和Microsoft Edge的团队都是通过艰难的方式学习到这一点的。
我们也曾考虑过为什么不只是构建一个扩展。但意识到我们需要更多的控制权。这与Cursor分叉VSCode的原因类似。例如,Chrome有一个叫做可访问性树的东西——基本上是屏幕阅读器使用的更清晰、语义化的DOM版本。对于AI代理理解网页非常完美,但您无法通过扩展API使用它。
话虽如此,处理这1500万行C++的Chromium代码库是一场冒险。我们都曾在Google和Meta工作过基础设施,但Chromium是一个不同的挑战。像Cursor的索引工具在这个规模下完全崩溃,因此我们不得不非常熟练地使用grep和vim。而且构建时间非常漫长——即使在我们性能最强的M4 Max MacBook上,完整构建也需要大约3小时。
完全透明:我们仍处于非常早期的阶段,但我们在GitHub上有一个可工作的原型。它包括一个“本地Manus”风格的早期代理,可以自动化简单的网页任务,还有一个用于提问的AI侧边栏,以及其他生产力功能(分组标签、保存/恢复会话等)。
期待任何和所有的评论!
您可以从我们的GitHub页面下载浏览器:<a href="https://github.com/nxtscape/nxtscape">https://github.com/nxtscape/nxtscape</a>
大家好,我们是来自Hatchet的Gabe和Alexander。今天我们发布了Pickaxe,这是一个用于构建可扩展且容错的AI代理的TypeScript库。
这里有一个演示: [演示链接](https://github.com/user-attachments/assets/b28fc406-f501-4427-9574-e4c756b29dd4)
Pickaxe提供了一组简单的原语,用于构建能够自动检查点其状态并在等待外部事件(如人类参与)时暂停或恢复处理的代理(也称为持久执行)。该库基于我们在帮助Hatchet用户每天运行数百万次代理执行时观察到的常见模式。
与其他工具不同,Pickaxe并不是一个框架。它没有关于实现代理内存、提示、上下文或直接调用大型语言模型(LLM)的任何意见或抽象。它唯一的关注点是使AI代理更加可观察和可靠。
随着代理的规模扩大,通常会出现三个主要问题:
1. 与应用程序的其他部分相比,代理的运行时间较长。极长的运行过程很棘手,因为在无服务器运行时部署新基础设施或遇到请求超时会中断其执行。
2. 它们是有状态的:通常存储内部状态以控制执行路径中的下一步。
3. 它们需要访问大量新鲜数据,这些数据可以在代理执行期间查询,或者需要从数据源持续刷新。
(这些问题更具体地与远程执行的代理相关——本地运行的代理通常没有这些问题。)
Pickaxe旨在通过提供一个简单的API来解决这些问题,该API封装了代理的持久执行基础设施。持久执行是一种自动检查点进程状态的方法,这样如果进程失败,可以从检查点自动重放,而不是从头开始。这个模型在代理需要等待外部事件或人类审核以继续执行时特别有用。为了支持这种模式,Pickaxe使用了Hatchet的一个功能,称为`waitFor`,它持久注册了一个事件监听器,这意味着即使代理没有主动监听该事件,Hatchet也会保证处理该事件并将其存储在执行历史中以恢复处理。该基础设施由本质上是线性事件日志的内容提供支持,该日志在Hatchet管理的Postgres数据库中存储代理的整个执行历史。
完整文档在这里:[文档链接](https://pickaxe.hatchet.run)
我们非常感谢您的反馈,并希望您能有机会尝试Pickaxe。
我很好奇现在人们对使用平台原生UI工具包的应用程序和使用平台中立技术(如浏览器技术)的应用程序的看法。我并不是在询问开发者的观点,因为那是另一个话题,而是更关注用户的体验。
在过去的十年里,我对这个问题的看法发生了变化。以前,我非常偏爱使用平台原生UI控件的应用程序,但最近我意识到,我对这个问题已经不再那么在意了,我认为这不再影响我的购买或使用决策。当我意识到这一点时,我感到非常惊讶。
我很想听听其他人的看法或观点。
我给记者发了关于我的最小可行产品(MVP)的邮件,但大部分邮件没有送达,如果有些邮件送达了,他们却要求付费才能写相关内容。我该怎么办?
这与金融科技有关,所以我需要赢得人们的信任。