返回首页
最新
我已经在这个项目上工作了几个月,自从美国对伊朗采取行动的那天起。最开始它只是一个简单的开放源代码冲突监测工具,当时类似的工具层出不穷,但后来发展成一个完全不受领域限制的管道,能够提取主张和证据,综合事件,并将其映射到时间线上。它还能够归属参与者,关联事件,并提供分析。
在这个系统背后有很多功能,我还不确定该如何使用——各种上下文分析,一个讲故事的模式,可以自动带你飞越一系列事件并进行配音,还有一个系统可以进行预测并随后进行评分。
此外,还有一个完整的“新闻编辑室”层面,负责根据事态发展撰写和发布文章,使用自己的判断。
目前在deepseek-3.2上运行(在这个价格点上表现惊人),但往往会拒绝中国军事新闻。美国的模型通常会拒绝关于伊朗-以色列的内容。
在构建这个系统的过程中,我感到非常有趣,并且对时事有了很好的了解。这种工具对HN用户会有用吗?
我正在使用Conductor,总体来说,它极大地提升了我的工作效率。唯一的问题是他们的“Spotlight”功能,本应将工作树与根目录同步,从而使本地测试成为可能,但它的可靠性不高。即使它能正常工作,也不完全符合我的需求,因为我希望每个工作流能够独立进行测试。
到目前为止,我尝试了三种方法,但都效果不佳:
1. 我使用了一个Conductor设置脚本,在每个工作树中运行我的本地开发环境。这并没有成功,因为Docker容器之间存在端口冲突。
2. 我使用Terraform,因此为每个PR快速启动一个资源较少的临时环境是小事一桩。这使得Conductor中的每个Claude会话都可以使用Playwright来测试代码。但有两个问题:首先,这样的成本相当高(每个PR每天$2-5)。我每天提交20-30个PR,即使有自动清理,这也让我每月花费$XXX。其次,我的部署大约需要10-15分钟,虽然时间不算长,但Claude经常需要重新提示才能检查已部署的更改。
3. 对于新功能,我只是让Claude在功能标志后将代码直接推送到暂存或生产环境。这导致了回归问题,并且需要Claude访问特权数据进行测试,因此这不是一个好的解决方案。
我在考虑是否可以使用与每个工作树关联的本地虚拟机,但在深入研究之前,我想确认一下是否有现成的解决方案我没有意识到。
今天,在使用 fossil 的所有这些年里,我第一次在访问 fossil 网站时遇到了这个错误。<p><pre><code> 服务器负载当前过高。请稍后再试。
当前负载平均值:33.080078
负载平均限制:10.000000
URL: https://fossil-scm.org/home/doc/trunk/www/index.wiki
时间戳:2026-05-01 00:20:36Z
</code></pre>
[0]: https://fossil-scm.org/