1作者: arjunchint8 个月前原帖
我们刚刚在Halluminate (YC S25) Web Bench上对我们的代理rtrvr.ai进行了基准测试,rtrvr.ai取得了81%的成功率,达到了新的最先进性能。为了提供一些背景,这一成绩不仅超过了所有其他自主代理,还超越了OpenAI的操作员(Operator)在人工干预下的基线(76.5%)。 此外,rtrvr.ai完成任务的速度比下一个领先的替代方案快了惊人的7倍。 这不仅仅是一个渐进的改进;它验证了我们核心架构哲学的有效性。我们的性能源于两个关键的差异化因素: - 本地优先操作:作为一个Chrome扩展,rtrvr.ai直接在用户的浏览器中运行。这消除了云浏览器代理所面临的延迟、机器人检测和访问问题。 - 基于DOM的交互:我们的代理不依赖脆弱的视觉解析(CUA),而是直接与页面的HTML结构进行交互,从而能够跳过点击,并对弹出窗口和覆盖层具有更强的抗干扰能力。我们还可以使用最新和最快的模型,如Gemini Flash,以获得更优的性能。 这导致了一个关键的行业洞察:云浏览器代理并不是可靠的网络自动化的长期解决方案。 我们的基准分析显示,rtrvr.ai的失败中有超过94%是“代理错误”(可修复的AI逻辑),而只有5%是“基础设施错误”。对于云代理而言,这一比例通常是相反的。如果无法保证对环境的访问,就无法构建一个可靠的代理。 网络自动化的未来不会在远程数据中心进行竞争,而是将从您的浏览器中以共生的方式运行。我们的结果是证明这一论点的第一个重要数据点,并为云浏览器代理的终结敲下了第一根钉子。 完整报告:<a href="https://www.rtrvr.ai/blog/web-bench-results" rel="nofollow">https://www.rtrvr.ai/blog/web-bench-results</a> 或者如果您只是想观看一个网络代理在线执行任务的Agentic-SMR,可以收听这个播放列表:<a href="https://www.youtube.com/watch?v=HWPZI8PjuLY&amp;list=PL5rk1YARPB-e9h9YXbQA9EOBtb9Yp4-sW&amp;index=9" rel="nofollow">https://www.youtube.com/watch?v=HWPZI8PjuLY&amp;list=PL5rk1YARPB...</a> 亲自体验一下工作网络代理的魔力,安装地址:<a href="https://chromewebstore.google.com/detail/rtrvrai-ai-web-agent/jldogdgepmcedfdhgnmclgemehfhpomg" rel="nofollow">https://chromewebstore.google.com/detail/rtrvrai-ai-web-agent...</a>
1作者: EddieLomax8 个月前原帖
我喜欢在音乐中跑步,但大多数歌曲的节奏总是稍微快了一点或慢了一点。找到一首与自己步频完全匹配的歌曲总是让人感觉很棒,因此我想——应该有一个应用程序可以做到这一点。所以这是一个尝试,旨在让你可以为任何歌曲找到合适的节奏。现在还有一些小问题需要解决,但整体效果似乎不错。如果你想试试,可以下载 TestFlight 版本。
1作者: boratanrikulu8 个月前原帖
我们打造了YourTaste——一个基于人工智能的电影推荐系统,它分析您的Letterboxd个人资料(喜好、评分、评论),并为您提供量身定制的建议。您还可以根据氛围进行搜索(例如:“节奏缓慢但情感强烈”),或者使用类似“与《Aftersun》相似但结局充满希望的电影”的提示。 这是一个非商业的最小可行产品(MVP)——我们希望看看能否构建一个真正理解电影品味的系统,利用大型语言模型(LLMs)和用户数据。 我们非常希望听到社区的反馈——无论是对产品想法还是技术方向。