返回首页
最新
你好,
我对人工智能代理的崛起既感到兴奋又感到恐惧。我们正在构建令人惊叹的工具,它们可以浏览网络,但我们却强迫它们在一个为人类眼睛设计的世界中导航。它们抓取屏幕并解析脆弱的DOM。
我们试图驯化它们,使其像人类一样行动。我认为这从根本上是错误的。目标不是让人工智能在人的水平上运作,而是释放它超越人类的潜力。
目前的道路是危险的。当来自OpenAI、谷歌等公司的代理开始大规模、高速浏览时,用户界面/用户体验等概念对它们将失去意义。整个网络模型都受到威胁。网站所有者正在失去对其网站使用方式的控制,而没有人提供真正的解决方案。W3C正在考虑这个问题,而我决定去构建它。
这就是我创建AURA(可供代理使用的资源声明)的原因。
这是一种开放协议,核心思想简单而强大:让网站所有者声明人工智能可以做什么和不能做什么。与其让代理猜测,不如网站提供一个简单的aura.json清单。
这将控制权还给网站所有者。这是从让人工智能抓取数据转变为被授予能力的过程。我们可以定义互动的规则。这使我们能够增加人工智能的能力,而不是让它们肆意妄为,而是给它们明确、结构化的路径可供遵循。
坦白说,我并不是一个硬核程序员;我更像是一个系统思考者。实际上,我广泛使用人工智能来帮助我编写AURA的参考实现。用这个工具来构建它自己的保护措施,感觉非常合适。
协议的核心、参考服务器和客户端都在GitHub上开源。你可以在5分钟内看到它的工作:
克隆并安装:git clone [https://github.com/osmandkitay/aura.git](https://github.com/osmandkitay/aura.git) && cd aura && pnpm install
运行服务器:pnpm --filter aura-reference-server dev
运行代理:(在新终端中)pnpm --filter aura-reference-client agent -- http://localhost:3000 "列出所有博客文章"
你会看到代理直接执行任务,没有涉及抓取或DOM解析。
GitHub仓库在这里:[https://github.com/osmandkitay/aura](https://github.com/osmandkitay/aura)
我不知道AURA是否会成为标准,但我相信提出这个问题并开始讨论是我的责任。这是未来网络的基础性问题,需要社区共同努力。
该项目采用MIT许可证。我全天候在这里回答问题并倾听你的反馈——特别是批评性的意见。让我们讨论一下。
GitHub的首席执行官最近告诉开发者,如果他们不接受像Copilot这样的AI工具,他们应该考虑退出这个行业。这听起来像是建议,但老实说,这实际上是一种隐晦的威胁:购买我们的AI,否则我们会用那些愿意使用它的人来取代你。
当掌控计算资源、模型和平台的公司试图主导劳动的未来时,就会发生这样的事情。开发者——那些代码被抓取、创意训练了模型、无偿贡献填充了GitHub的人——现在被告知要么付费,要么消失。
我和我的朋友之所以制作这个,是因为我们想以一种更有趣和互动的方式来学习。我们认为可以围绕这个项目建立一个社区?而且肯定还有很多工作要做。我们非常好奇你们的想法,以及我们可以在哪里改善学习体验。
在使用像 `claude code` 这样的工具时,我发现很难进入流畅的工作状态,因为每次交互后我都需要等待。我很容易分心,思绪游离,常常发现自己在浏览 Hacker News 或上网。<p>在大多数任务中,我的工作效率更高,但在这些分心的过程中,我常常会失去很长时间而没有察觉。我尝试保持控制台打开,查看 AI 代理的处理过程,但经过几次交互后,这让我感到紧张。<p>我也没有那么享受这个过程。完成一个新功能后,我没有成就感,所有的事情都显得支离破碎。<p>即使使用多个会话也没有帮助,因为我每次都需要切换任务上下文。这种情况是否也发生在其他人身上?有什么建议吗?<p>你认为在这个过渡期,我们如何才能在 AI 编程仍然需要不断的指导和审查时实现流畅的工作状态?
我厌倦了一次次发送视频,因此我开发了一个Chrome扩展,可以一键将YouTube上的视频笔记发送到NotebookLM。
以下是使用方法:
1. 打开YouTube上的任何频道、播放列表、搜索结果或视频。
2. 点击NotebookLM按钮,选择一个已有的笔记本或创建一个新的笔记本。
3. 该扩展会将所有可用的视频发送到NotebookLM,直到达到限制。
这个扩展是免费的,并且可以在Chrome上使用。我非常期待听到你的反馈!
嗨,HN!我一直在开发BookWith,这是一款开源电子书阅读器,集成了人工智能作为你的阅读伴侣。
问题:传统的电子阅读器是被动的。当你遇到不清楚的内容时,你必须切换上下文去搜索。你的高亮和笔记相互孤立,难以在不同书籍之间轻松连接思想。
我的解决方案:BookWith嵌入了一个人工智能,能够保持你所阅读内容的完整上下文。它的特点包括:
- 上下文感知的AI聊天:可以询问当前页面/章节的问题,并获得即时回答
- AI播客生成:自动将书籍内容转换为对话式播客,使用Google Cloud TTS
- 多层记忆系统:短期(最近5次对话)、中期(每20次总结一次)和长期(向量搜索)记忆,保持阅读会话之间的连续性
- 智能注释:5种颜色的高亮系统,AI可以引用和分析
技术栈:作为Flow(epub阅读器)的一个分支构建,增加了LLM集成和用于语义搜索的向量数据库。支持多种LLM和语言(英语/日语/中文)。