返回首页
一周热榜
几个月前,我开玩笑地将“Human”添加为OpenCode的LLM提供者,没想到作为LLM的体验相当痛苦。但这对理解真实代理的开发却意外地有帮助。
所以我想不让任何人掉队!我制作了一个小型开源游戏——《你是一个代理》(You Are An Agent)——你可以在youareanagent.app上找到,分享这种(有用的?)挫败感。
这有点荒谬。让我告诉你一些完全必要的功能,我们有:
- 一个完整的WASM架构的Linux虚拟机,可以在浏览器中运行,用于代理编码层面
- 一个糟糕的桌面模拟和一个漂亮的Excel模拟,用于我们的计算机使用层面
- 一个可爱的WebGL CRT模拟(我认为这是第一个在Safari上支持正确DOM 2D桶形扭曲的模拟?老实说,我本想利用现有的,而不是自己编写,但找不到让我满意的)
- 一个MCP服务器模拟器,完整模拟非品牌的Jira/Confluence/...连接
- 当然,还有一个完整的WebGL示波器音乐模拟器,用于引导序列
告诉我你的想法!
代码(如果你想添加一个关卡):[https://github.com/R0bk/you-are-an-agent](https://github.com/R0bk/you-are-an-agent)
(如果你想浪费20分钟——我花了太多时间整理我对代理开发的杂乱思考):[http://robkopel.me/field-notes/ax-agent-experience/](http://robkopel.me/field-notes/ax-agent-experience/)
我在使用工作树和tmux并行运行3-5个Claude Code会话。总是搞不清哪个代理需要输入,哪个又卡在权限上。<p>于是我开发了Smith:一个可以查看所有代理、其状态,并快速跳转到需要你关注的代理的界面。<p>如果这听起来对你有帮助,可以注册获取早期访问权限。
嗨,HN,
我在这里潜水很久了。虽然有点紧张,但我想分享一个我为自己开发的工具。
问题:我电脑上有很多技术PDF文件。我经常使用ChatGPT深入阅读,但即使在分屏视图下,这也很分散注意力,因为我需要在两个窗口之间复制粘贴内容。
解决方案:一个类似Kindle的阅读器,允许我将上下文发送到聊天窗口,并进行更深入的讨论。
它通过同步文件实现完全可移植,并使用您自己的API密钥。
免责声明:我是一名产品经理和设计师。这完全是在Cursor中为自己编写的工具,但我想分享出来,以防有人会觉得它有用。
代码库: [https://github.com/tibi-iorga/echo-reading](https://github.com/tibi-iorga/echo-reading)
试用地址: [https://echoreading.com](https://echoreading.com)
这是一个简单的工具,可以帮助你在电脑上专注于一次一个的工作会话。它会显示一个覆盖层,提醒你当前会话的目的。
我创建了RepoExplainer,以便快速理解不熟悉的代码库,而无需在本地克隆它们。
<p>它的功能:粘贴任何公共GitHub仓库的URL,即可获得AI生成的解释,包括架构图、目录结构和技术栈分析。
<p>工作原理:FastAPI后端从GitHub的API并行获取仓库的目录树和关键文件(如README、package.json等),然后将这些信息发送给Claude进行结构化分析。
<p>试试吧:<a href="https://repex.thienbao.dev" rel="nofollow">https://repex.thienbao.dev</a>。
<p>技术亮点:
- 使用asyncio.gather进行并行文件获取(比顺序获取快70%)
- 智能内容过滤(限制100KB),以防止令牌溢出
- 自定义树解析器将GitHub的扁平文件列表转换为层次结构
<p>目前的限制:仅支持公共仓库,每个IP每天20次请求,大型单体仓库可能会达到令牌限制。
<p>我希望能收到关于解释质量、用户体验或其他方面的反馈。
<p>源代码:<a href="https://github.com/BaoNguyen09/repo-explainer" rel="nofollow">https://github.com/BaoNguyen09/repo-explainer</a>
嗨,HN,
我最近发布了一个Discord机器人,可以让你克隆自己的声音或朋友的声音(机器人会先征得他们的同意),并直接在Discord语音频道中生成语音。它使用Fish Audio的API进行声音克隆,我发现这是我测试过的众多模型中最自然的一种。欢迎告诉我你的想法!
- Nick (TheSaltySeaCow)