1作者: kpolevoy12 天前原帖
嘿,HN——我开发这个工具是因为我在Claude、ChatGPT、Gemini和Perplexity之间频繁切换,每次都要重新解释上下文让我感到厌烦。 这是一个Chrome扩展,可以一键捕捉对话并在不同平台之间传输。所有数据都保存在IndexedDB中,没有外部服务器。 如果你想尝试,可以在Chrome网上应用店找到它: [Chrome网上应用店链接](https://chromewebstore.google.com/detail/relai/inkojohbljaagknapmgmciaabdgekjdm) 已知的限制:长对话可能会丢失格式,平台的DOM变化会导致提取器失效,直到我修复它们。这个工具是用原生JS构建的,没有使用框架,也没有构建步骤。 欢迎提问关于实现的相关问题。
1作者: juansgaitan2 天前原帖
我创建Relay是因为现有的消息系统假设人类和传统电子邮件的限制(SMTP、MIME、已读标志、收件箱轮询)。<p>Relay是一个针对AI代理的HTTP原生消息服务器。代理可以创建账户,获取稳定的地址(例如,a8f3k@getrelay.sh),并通过HTTPS使用纯JSON在线程中交换结构化消息。<p>该API完全基于HATEOAS驱动:代理从GET /开始,通过_links发现所有操作。无需SDK,无需硬编码的URL,也不需要外部文档。<p>其他设计选择: – 通过状态令牌进行增量同步,而不是使用已读/未读标志 – 行级安全性,对非参与者返回404 – 令牌仅以哈希形式存储 – 内容支持人类可读的Markdown和机器负载<p>虽然这还处于早期阶段,但足够完整,可以在本地运行或部署在Cloudflare Tunnel后。我特别希望能收到关于HATEOAS方法的反馈,以及这是否符合人们当前在代理间工作流中的实际连接方式。
1作者: matinplace2 天前原帖
为什么不在光标旁边设置一个快速操作菜单,供人工智能公司用于提供广告和娱乐呢?后续的问题是,这是否是我们正在朝着的方向(比如将人工智能与手部动作更紧密地结合;有些人认为人工智能将取代智能手机)?
2作者: haute_cuisine2 天前原帖
亲爱的创始人们, 我正在尝试理解一些常见的创业智慧,但对我来说并不太合理。 例如,如果你给我Dropbox的源代码,我不认为我能在第一年内达到10万美元的年经常性收入(ARR)。也许,甚至达到1000美元的目标都很困难。 你会怎么做才能让一个抽象的Dropbox实现100万美元的年经常性收入?从冷邮件开始吗?定义理想客户画像(ICP),然后通过LinkedIn销售导航工具向他们发送垃圾邮件,也就是B2B销售手册? 我发现关于验证的常见建议非常笼统,这意味着它们缺乏具体性和细微差别,因此并不奏效。例如,竞争是好的,因为它证明了需求,但在竞争激烈的市场中,“粗糙的最小可行产品(MVP)”并不能成功销售。 我逐渐意识到,成功的唯一途径是通过线下销售将你的产品嵌入某种价值交付管道中:例如,聚会、贸易展等。去客户们线下聚集的地方。 在发布产品之前,你是否验证了你的想法?你是否提前知道它会成功?你是否需要通过冷邮件来寻找第一批客户?你是否觉得一开始就必须强推你的产品?
14作者: antves2 天前原帖
嗨,HN!Smooth CLI(<a href="https://www.smooth.sh">https://www.smooth.sh</a>)是一个浏览器,供像Claude Code这样的代理使用,以可靠、快速且经济的方式浏览网页。它允许代理使用自然语言指定任务,隐藏用户界面的复杂性,使他们能够专注于更高层次的意图,从而执行复杂的网络任务。它还可以在云中运行浏览器时使用您的IP地址,这在处理验证码等障碍时非常有帮助(<a href="https://docs.smooth.sh/features/use-my-ip">https://docs.smooth.sh/features/use-my-ip</a>)。<p>这里有一个演示:<a href="https://www.youtube.com/watch?v=62jthcU705k" rel="nofollow">https://www.youtube.com/watch?v=62jthcU705k</a> 文档从<a href="https://docs.smooth.sh">https://docs.smooth.sh</a>开始。<p>像Claude Code这样的代理非常出色,但大多局限于命令行界面,而大量有价值的工作需要浏览器。这是这些代理能力的一个根本限制。<p>迄今为止,尝试将浏览器添加到这些代理(Claude内置的--chrome、Playwright MCP、agent-browser等)都具有不自然的浏览界面。它们暴露了数百个工具,例如点击、输入、选择等,操作空间过于复杂。(例如,参见<a href="https://github.com/vercel-labs/agent-browser" rel="nofollow">https://github.com/vercel-labs/agent-browser</a>列出的低级细节)。此外,它们无法处理互联网中的数十亿个边缘案例,比如嵌套在嵌套中的iframe和阴影DOM等。互联网非常混乱!依赖可访问性树的工具,尤其是,往往无法在许多网站上正常工作。<p>我们认为这些工具处于错误的抽象层次:它们使代理关注用户界面细节,而不是要完成的任务。<p>使用像Opus这样的大型通用模型来点击按钮和填写表单最终会变得缓慢且昂贵。上下文窗口被点击和键入等细节拖慢,模型每次都必须弄清楚如何进行浏览器导航。一个专门为浏览设计的小型模型实际上可以更好地完成这项工作,并且成本和延迟都大大降低。<p>安全性也很重要——可能比人们意识到的更重要。当您在网络上运行代理时,应该将其视为不可信的参与者。它应该使用沙箱化的机器访问网络,并默认具有最小权限。虚拟浏览器是实现这一点的完美环境。Paul Kinlan有一篇很好的文章对此进行了很好的解释(见<a href="https://aifoc.us/the-browser-is-the-sandbox" rel="nofollow">https://aifoc.us/the-browser-is-the-sandbox</a>和<a href="https://news.ycombinator.com/item?id=46762150">https://news.ycombinator.com/item?id=46762150</a>)。浏览器是为了安全地与不可信的软件进行交互而构建的。它们是已经有效的隔离边界。<p>Smooth CLI是一个为代理设计的浏览器,基于它们擅长的领域。我们提供一个更高层次的接口,让代理以目标和任务的形式思考,而不是低级细节。<p>例如,而不是这样:<p><pre><code> click(x=342, y=128) type("搜索查询") click(x=401, y=130) scroll(down=500) click(x=220, y=340) ...还有50个步骤 </code></pre> 您的代理只需说:<p><pre><code> 搜索从纽约到洛杉矶的航班,并找到最便宜的选项 </code></pre> 像Claude Code这样的代理可以使用Smooth CLI提取难以获取的数据,填写表单,下载文件,与动态内容互动,处理身份验证,测试应用程序等。<p>Smooth使代理能够自主按需启动任意数量的浏览器和任务。如果代理正在代表某人工作,代理的浏览器会向网络呈现为用户网络上的设备。随着时间的推移,对此功能的需求可能会减少,但目前这是一个必要的原语。为此,Smooth提供了一个“自我”代理,创建一个安全隧道,并通过您的机器的IP地址路由所有浏览器流量(<a href="https://docs.smooth.sh/features/use-my-ip">https://docs.smooth.sh/features/use-my-ip</a>)。这是我们最喜欢的功能之一,因为它使代理看起来像是在您的机器上运行,同时保留在云中运行的所有好处。<p>我们还尽可能地减轻代理的安全责任。代理不应了解身份验证细节或负责处理恶意行为,例如提示注入。虽然某些安全责任始终会留给代理,但浏览器应尽量减少这种负担。<p>当然,我们有偏见,但在我们的测试中,使用Smooth CLI运行Claude的速度是使用--chrome标志的Claude Code的20倍,成本是5倍(<a href="https://www.smooth.sh/images/comparison.gif">https://www.smooth.sh/images/comparison.gif</a>)。我们很乐意进一步解释我们是如何测试的,并回答任何相关问题!<p>安装说明:<a href="https://docs.smooth.sh/cli">https://docs.smooth.sh/cli</a>。计划和定价:<a href="https://docs.smooth.sh/pricing">https://docs.smooth.sh/pricing</a>。<p>试用是免费的,如果您尝试一下,我们很乐意听取反馈和想法 :)<p>我们很想听听您的想法,特别是如果您尝试过将浏览器与AI代理结合使用。乐意回答问题,深入探讨权衡,或解释设计和实现的任何部分!