返回首页
最新
几周前,我发布了关于 GoodToGo 的帖子 <a href="https://news.ycombinator.com/item?id=46656759">https://news.ycombinator.com/item?id=46656759</a> —— 这是一个为 AI 代理提供确定性回答的工具,能够回答“这个 PR 准备好合并了吗?”许多人询问我提到的更大规模的协调系统。这就是那个系统。
我厌倦了作为 Claude Code 的项目经理。虽然它能很好地写代码,但将生产代码交付出去需要七八个工作——研究、规划、设计审查、实施、代码审查、安全审计、PR 创建、CI 监控。我一直在自己进行所有的协调。代理的打字速度很快,但我仍然是瓶颈。我真正需要的是一个协调者的协调者——成群的代理,配备确定性的质量检查。
于是我构建了 metaswarm。它将工作分解为多个阶段,并将每个阶段分配给一个专业的群体协调者。它管理交接,并使用 BEADS 作为跨 /compact、/clear,甚至跨会话的确定性门控。将其指向一个 GitHub 问题或与其进行头脑风暴(它使用 Superpowers 提出澄清问题),它会创建史诗任务、子任务和依赖关系,然后运行完整的管道直到合并 PR——包括像 CodeRabbit、Greptile 和 Bugbot 这样的外部代码审查。
让我最惊讶的是设计审查门控。五个代理——项目经理、架构师、设计师、安全专家、首席技术官——在每行代码写入之前并行审查每个计划。所有五个都必须批准。最多三轮审查,然后升级到人工。我原以为只是走个过场,但它确实发现了真实的设计问题、依赖关系问题和安全漏洞。
这个周末,我将其指向我的待办事项列表。127 个 PR 被合并。每一个都达到了 100% 的测试覆盖率。没有人编写代码、审查代码或点击合并。好吧,我稍微引导了一下,主要是帮助规划一些史诗任务。
一些经验教训:
代理的检查清单只是表面功夫。代理跳过了覆盖率检查,误读了阈值,或者决定它们不适用。仅仅依靠提示是不够的。解决方案是确定性门控——BEADS、预推送钩子、CI 任务,所有这些都在代理完成检查之上。这些门控能够阻止不良代码,无论代理是否合作。
这些代理仅仅是 markdown 文件。没有自定义运行时,没有服务器,虽然我用 TypeScript 构建了它,但代理是语言无关的。你可以阅读它们,编辑它们,添加你自己的内容。
它也能自我反思。在每次合并 PR 后,系统会提取模式、陷阱和决策到一个 JSONL 知识库中。代理只加载与它们正在处理的文件相关的条目。它交付的越多,犯错的次数就越少。它在不断学习。
metaswarm 基于两个项目:<a href="https://github.com/steveyegge/beads" rel="nofollow">https://github.com/steveyegge/beads</a>(由 Steve Yegge 提供,支持 git 原生任务跟踪和知识准备)和 <a href="https://github.com/obra/superpowers" rel="nofollow">https://github.com/obra/superpowers</a>(由 Jesse Vincent 提供,支持有纪律的代理工作流——TDD、头脑风暴、系统调试)。这两个项目都是必不可少的。
背景:我创办了 Technorati、Linuxcare 和 Warmstart;曾任 Lyft 和 Reddit 的技术高管。我构建 metaswarm 是因为我需要能够以与我对人类团队相同标准交付生产代码的自主代理。
$ cd my-project-name
$ npx metaswarm init
MIT 许可。我不是律师。你的情况可能有所不同。欢迎提出问题或 PR!
我们创建INVENT是因为看到团队在开发开始之前就面临困难——这并不是因为他们缺乏技能,而是因为早期的规划仍然是手动的、零散的,并且充满了未解的问题。
INVENT利用引导式AI访谈将早期的不确定性转化为清晰、可执行的输出。
如果您是感受到这种困扰的创始人、产品经理或工程师,我非常希望听到您的反馈。
嘿,HN(黑客新闻),
在开发了 Box QR(个人库存追踪器)之后,我不断听到“我需要这个来管理我的业务。”因此,我正在探索 ItemGrid——一种轻量级的库存管理工具,简单易用。
问题是:小企业在 Google Sheets(杂乱无章,无法移动扫描)和企业软件(昂贵,过于复杂)之间陷入了困境。
ItemGrid 的功能包括:
- 视觉网格界面
- QR/条形码扫描
- 多地点支持
- 永久免费支持一个地点
- 当你扩展时,每位用户 $8
目前,它只是一个收集验证注册的登录页面。在收到 50-100 个注册以确认真实需求之前,不会构建完整产品。
非常希望能得到反馈,特别是如果你曾经遇到过库存管理的烦恼。
[https://itemgrid.io](https://itemgrid.io)
我是一名从事光影创作的电影制作人,已有十多年经验,同时我也在为自己、朋友和同事开发ArtCraft。
我所有的电影学院朋友都充满了雄心壮志,但制作行业的金字塔结构并不允许个人才能轻易展现。虽然有10,000名学生进入电影学院,但只有少数人能够以完全自主的方式执导自己想要的项目——而且几乎从未能获得足够的预算来实现他们的创意愿景。此外,行业内也存在很多裙带关系。
人工智能是电影行业的个人电脑时代,是数字音频工作站(DAW)。
我的一位朋友曾与真人演员一起进行过逐帧动画:
[链接](https://www.youtube.com/watch?v=Tii9uF0nAx4)
Corridor团队在这项技术上展示了很多创造力:
[链接1](https://www.youtube.com/watch?v=_9LX9HSQkWo)
[链接2](https://www.youtube.com/watch?v=DSRrSO7QhXY)
[链接3](https://www.youtube.com/watch?v=iq5JaG53dho)
我们自己也在制作一些搞笑短片:
[链接1](https://www.youtube.com/watch?v=oqoCWdOwr2U)
[链接2](https://www.youtube.com/watch?v=H4NFXGMuwpY)
秘密在于,许多工作室已经使用人工智能超过一年了。你可能没有注意到,他们也不会告诉你,因为这存在污名化。这就像“坏假发谬论”——只有在它很糟糕时你才会注意到,而他们永远不会告诉你其他情况。
Comfy很不错,但我与一些不擅长节点图的人合作,他们要么没有足够显存的显卡,要么无法管理Python依赖。基础模型都相当有竞争力,并且变得越来越可控——这才是关键——控制。因此,我一直在致力于用户界面/用户体验的控制层。
ArtCraft拥有2D和3D控制界面,其中3D部分可以作为强大且直观的ControlNet,用于“图像到图像”(I2I)和“图像到视频”(I2V)工作流程。这几乎就像所见即所得(WYSIWYG),我相信这就是技术将为创意专业人士发展而非以文本为中心的提示的方向。
我对像Gimp和Blender这样的工具感到沮丧已经有一段时间了。我不是用户体验/用户界面的专家,但我从来不喜欢复杂的工具——尤其是复杂的开源工具。商业级工具更好。Figma非常出色。一个为创意人士设计的集成开发环境(IDE)应该是简单、神奇且强大的。
ArtCraft让你可以轻松地从各种创意画布和资产库中拖放内容。它快速且直观。在文本到图像的快速原型制作、图像编辑、3D生成到3D合成之间的切换非常流畅。它更像是“创作”,而不是提示或节点图的巫术。
作为一款桌面应用,ArtCraft允许我们让你登录第三方计算服务。我非常支持使用和整合你所订阅的模型,无论你在哪里拥有它们。这让我们能够整合WorldLabs的Marble Gaussian Splats,例如,而其他人并没有做到这一点。我的计划是随着时间的推移添加每个提供商,包括像FAL和Replicate这样的通用API密钥计算提供商。我不在乎你是否为ArtCraft付费——我只希望它能对你有用。
两个声明:
ArtCraft是“公平源代码”的——我希望走Cockroach DB的路线,最终获得资金,但保持工具本身100%源代码可用,供人们自行构建和运行。就像Obsidian,但有源代码。如果我们做大了,我会花很多时间制作电影。
目前ArtCraft依赖于一个轻量级的云服务——我对此并不满意。这是一个选择,以便我可以重用一个旧项目并快速推进,但我打算很快让它完全离线工作。所有服务器代码都在单一代码库中,因此你可以自己运行一切。随着时间的推移,我确实设想一个便携的开源云,用于各种AI工具的读写,就像一个资产的Github,但这只是一个遥远的想法。
我在代码库中写了关于路线图的内容:我希望为每个计算提供商开发集成,重写前端用户界面/用户体验,使用Bevy实现完全本地的客户端,并整合本地模型。
Claude 代码当前返回 5XX 错误 :(