返回首页
最新
我们刚刚在Halluminate (YC S25) Web Bench上对我们的代理rtrvr.ai进行了基准测试,rtrvr.ai取得了81%的成功率,达到了新的最先进性能。为了提供一些背景,这一成绩不仅超过了所有其他自主代理,还超越了OpenAI的操作员(Operator)在人工干预下的基线(76.5%)。
此外,rtrvr.ai完成任务的速度比下一个领先的替代方案快了惊人的7倍。
这不仅仅是一个渐进的改进;它验证了我们核心架构哲学的有效性。我们的性能源于两个关键的差异化因素:
- 本地优先操作:作为一个Chrome扩展,rtrvr.ai直接在用户的浏览器中运行。这消除了云浏览器代理所面临的延迟、机器人检测和访问问题。
- 基于DOM的交互:我们的代理不依赖脆弱的视觉解析(CUA),而是直接与页面的HTML结构进行交互,从而能够跳过点击,并对弹出窗口和覆盖层具有更强的抗干扰能力。我们还可以使用最新和最快的模型,如Gemini Flash,以获得更优的性能。
这导致了一个关键的行业洞察:云浏览器代理并不是可靠的网络自动化的长期解决方案。
我们的基准分析显示,rtrvr.ai的失败中有超过94%是“代理错误”(可修复的AI逻辑),而只有5%是“基础设施错误”。对于云代理而言,这一比例通常是相反的。如果无法保证对环境的访问,就无法构建一个可靠的代理。
网络自动化的未来不会在远程数据中心进行竞争,而是将从您的浏览器中以共生的方式运行。我们的结果是证明这一论点的第一个重要数据点,并为云浏览器代理的终结敲下了第一根钉子。
完整报告:<a href="https://www.rtrvr.ai/blog/web-bench-results" rel="nofollow">https://www.rtrvr.ai/blog/web-bench-results</a>
或者如果您只是想观看一个网络代理在线执行任务的Agentic-SMR,可以收听这个播放列表:<a href="https://www.youtube.com/watch?v=HWPZI8PjuLY&list=PL5rk1YARPB-e9h9YXbQA9EOBtb9Yp4-sW&index=9" rel="nofollow">https://www.youtube.com/watch?v=HWPZI8PjuLY&list=PL5rk1YARPB...</a>
亲自体验一下工作网络代理的魔力,安装地址:<a href="https://chromewebstore.google.com/detail/rtrvrai-ai-web-agent/jldogdgepmcedfdhgnmclgemehfhpomg" rel="nofollow">https://chromewebstore.google.com/detail/rtrvrai-ai-web-agent...</a>
我喜欢在音乐中跑步,但大多数歌曲的节奏总是稍微快了一点或慢了一点。找到一首与自己步频完全匹配的歌曲总是让人感觉很棒,因此我想——应该有一个应用程序可以做到这一点。所以这是一个尝试,旨在让你可以为任何歌曲找到合适的节奏。现在还有一些小问题需要解决,但整体效果似乎不错。如果你想试试,可以下载 TestFlight 版本。
用Rust语言开发的AI深度学习框架,专注于简化模型构建。目前版本为0.0.2,因此功能尚不完善,容易出现bug,但已经可以创建简单的模型。
我们打造了YourTaste——一个基于人工智能的电影推荐系统,它分析您的Letterboxd个人资料(喜好、评分、评论),并为您提供量身定制的建议。您还可以根据氛围进行搜索(例如:“节奏缓慢但情感强烈”),或者使用类似“与《Aftersun》相似但结局充满希望的电影”的提示。
这是一个非商业的最小可行产品(MVP)——我们希望看看能否构建一个真正理解电影品味的系统,利用大型语言模型(LLMs)和用户数据。
我们非常希望听到社区的反馈——无论是对产品想法还是技术方向。