返回首页
最新
我对通过大型公关(PR)中“查看的文件”这一进展信号的效果感到失望,因此我制作了一个“查看的行数”指示器来补充它。<p>这个指示器的设计类似于Github的一个标准用户界面元素,甚至支持浅色/深色主题。它完全在本地运行,无需API调用。<p>默认情况下,它会将插入和删除分开显示,但您也可以在设置中将它们合并为一个“行数”数据。
我一直在开发 CloudRouter,这是一个技能 + 命令行工具,能够让像 Claude Code 和 Codex 这样的编码代理启动云虚拟机和 GPU。
当代理编写代码时,通常需要启动开发服务器、运行测试、打开浏览器以验证其工作。目前,这一切都发生在你的本地机器上。这对于单个任务来说没问题,但代理会共享你的计算机:你的端口、内存和屏幕。如果你同时运行多个代理,就会变得有些混乱。Docker 在隔离方面有所帮助,但它仍然使用你机器的资源,并且没有为代理提供浏览器、桌面或 GPU 来正确完成任务。如果代理有一个启动虚拟机的原语,它就可以独立处理所有这些。
CloudRouter 就是这个原语——一个赋予代理自己机器的技能。代理可以从你的本地项目目录启动虚拟机,上传项目文件,在虚拟机上运行命令,并在完成后将其拆除。如果需要 GPU,它可以请求一个。
```
cloudrouter start ./my-project
cloudrouter start --gpu B200 ./my-project
cloudrouter ssh cr_abc123 "npm install && npm run dev"
```
每个虚拟机都配备了 VNC 桌面、VS Code 和 Jupyter Lab,所有这些都通过身份验证保护的 URL 访问。当代理在虚拟机上进行浏览器自动化时,你可以打开 VNC URL 实时观看。CloudRouter 封装了 agent-browser 以实现浏览器自动化。
```
cloudrouter browser open cr_abc123 "http://localhost:3000"
cloudrouter browser snapshot -i cr_abc123
# → @e1 [链接] 首页 @e2 [链接] 设置 @e3 [按钮] 登出
cloudrouter browser click cr_abc123 @e2
cloudrouter browser screenshot cr_abc123 result.png
```
这是一个简短的演示: [https://youtu.be/SCkkzxKBcPE](https://youtu.be/SCkkzxKBcPE)
令我惊讶的是,这如何颠覆了我的工作流程。大多数云开发工具都是从云(后台代理、远程 SSH 等)到本地进行测试。但 CloudRouter 保持你的代理在本地,并将代理的工作推送到云端。代理做的事情与在本地一样——运行开发服务器、操作浏览器——但现在是在虚拟机上。当我不再关注代理的工作和本地限制时,我开始并行运行更多任务。
我最想看到发展的是 GPU 方面。目前,如果你希望编码代理帮助进行任何涉及训练或推理的工作,仍然需要手动去配置一台机器。而使用 CloudRouter,代理可以直接启动一个 GPU 沙箱,运行工作负载,并在完成后清理。我的一些朋友已经在使用它让代理并行运行小实验,但我也期待其他用例。
非常希望听到你的反馈和想法。CloudRouter 位于我们单体仓库的 packages/cloudrouter 目录下 [https://github.com/manaflow-ai/manaflow](https://github.com/manaflow-ai/manaflow)。
[1] [https://github.com/vercel-labs/agent-browser](https://github.com/vercel-labs/agent-browser)
嘿,HN,我是Sonar(SonarQube)的一名工程师。
我在公司领导的小团队有一个很酷的机会,花了几个月的时间做几乎任何与AI生成代码和代码审查相关的事情。最终,我们开发了一个类似IDE的桌面应用程序,叫做Kintsugi——基本上是一个与Claude Code互补的工具,增加了一些有助于与CLI代理协作的功能。
现在,我们是根据自己的需求和工作方式来构建这个工具的。更具体地说——我们关注代码质量和安全性,并且相信你拥有由代理生成的代码,这些代码必须经过验证。但与此同时,我们也希望快速交付,而Claude Code在这方面表现得非常出色。因此,我们决定创建一个工具,让开发者能够快速交付,同时对生成的代码保持控制。以下是主要功能:
- 协调并行代理——按状态查看所有会话(进行中、已中断、等待输入、准备审查),这样你就知道哪些需要关注
- 像审查PR一样审查AI代码——留下评论,要求修改,询问解释,进行独立的AI审查
- 计划审查——审查格式良好的计划,带有类似Google Docs的内联评论(这是我个人最喜欢的功能)
- 代码质量——集成Sonar分析,在开发过程中本地捕捉问题;如果你有SonarQube Cloud配置,可以连接到它
这个工具几乎完全是由Claude Code构建的,我们在构建过程中也使用了Kintsugi。它是一个原型——请期待一些粗糙的地方。我们有一个很长的计划功能列表,但需要反馈来确定优先级。
目前它仅支持macOS。Linux和Windows版本在内部可用,但我们还不太放心将其提供给外部用户。
现在让我坦诚一点——链接指向一个需要注册下载的着陆页(我知道这并不推荐),但由于这是一个原型,我们需要有一种方式在必要时将更新版本发送给用户。没有电子邮件验证,没有确认,我们显然不会将其用于营销目的。仅作为请求反馈和在必要时提供更新版本的方式。
非常希望能得到诚实的反馈,并乐意与大家聊聊这个工具。
我想要一个语音转文本的应用,但不信任任何专有软件会保护我的隐私。<p>因此,我决定尝试自己编写代码,尽管我没有任何 macOS 应用和 Swift 的经验。<p>这个应用使用了 whisper.cpp 的本地二进制文件(这是 OpenAI 的 Whisper 语音转文本模型在 C++ 中的快速实现)。<p>GitHub: <a href="https://github.com/richardwu/openwhisper" rel="nofollow">https://github.com/richardwu/openwhisper</a><p>我还决定借此机会比较三种编程辅助工具:<p>Cursor w/ Opus 4.6:
- 迄今为止最佳的一次性用户界面
- 权限设置不正确
- “取消录音”快捷键总是被激活<p>Claude Code w/ Opus 4.6:
- 实现主要功能(录音、快捷键、权限)所需的步骤最少
- 经过几次调整后能够获得一个不错的用户界面<p>Codex App w/ Codex 5.3 Extra-High:
- 最差的一次性用户界面
- 没有任何功能在没有多次后续提示的情况下正常工作