返回首页
最新
我目前的情况是,我理解单元测试的重要性以及测试驱动开发(TDD)的工作原理,但在实际操作中,我并没有太多机会去实践。我的工作技术并不太适合这种测试方式。
尽管如此,我还是希望找到一些关于这些主题的阅读材料,这些材料不仅仅涵盖基础知识,还能深入探讨,以便我能尽量获取一些如果我定期进行这些实践所能获得的高级经验。
这个项目(Agents Observe)最初是为了探索围绕 Claude 代码构建自动化工具。我需要一种方法来实时查看代理团队的具体操作,并对它们的输出进行过滤和搜索。
从构建和使用这个工具中,我获得了一些有趣的经验:
- Claude 代码的钩子是阻塞的——如果有很多使用钩子的插件,性能会迅速下降。
- 钩子提供的信息比 OTEL 数据要有用得多。
- Claude 的 jsonl 文件提供了完整的视图。
- 插件启动的 MCP 进程的生命周期管理在最佳情况下也有些笨拙。
最大的收获是,当我切换到后台(火并忘记)钩子并移除所有其他插件时,Claude 的性能提升了很多。很容易忘记我安装了多少 Claude 插件,以及它们对性能的影响。
Agents Observe 插件使用 Docker 启动 API 和仪表板服务。这是一个我希望在安全(想想 Axios 黑客事件)方面能更常用的模式。棘手的部分是处理多个 Claude 实例之间的进程管理——解决方案是让服务器跟踪活动连接,然后在不使用时自动关闭自己。当新会话启动时,插件再将其重新启动。
这个工具对我日常工作流程非常有帮助。希望你喜欢!
我有一只叫“蛾”的蜗牛,它说:“一只寡言的普通蜗牛。”我想我很无聊。