返回首页
一周热榜
在工作中,我需要使用 Teams。它支持一些 Markdown 功能,但对于长消息的编辑体验并不顺畅。因此,我经常在 nvim 中写作,然后在浏览器中预览,再复制粘贴到 Teams。这个工具帮助我省去了审查和复制的步骤。
<p>使用 Rust 和 Claude Code 构建。已在 Windows 和 Mac 上测试,应该也能在 Ubuntu 上运行。
<p>注意事项:仍然需要粘贴的应用程序来处理 HTML 剪贴板内容。
我看到一些独立程序员已经完全转向使用人工智能进行编码,但我对大型工程团队的情况很感兴趣。如果你在一个团队(比如说5名以上的工程师)中,已经采用了Claude Code、Cursor、Codex或其他类似工具,能否分享一下你们的情况?你们是否看到更多的代码行数(LOC)被创建?合并请求(PR)的速度或复杂性有变化吗?你发现自己在处理合并请求上花费的时间是相同的、更少还是更多?
介绍 Nia Vault,这是一个命令行工具(CLI),可以让你使用自然语言查询本地的 Markdown/文本文件。
它的功能:
- 对本地文件夹和笔记进行语义搜索
- 支持多个同步目录
- 提供带有引用的 RAG 风格回答,引用自你自己的文件
它的工作原理:
- 调用 `POST /search/query` 并传入 `local_folders`
- 使用 `search_mode: sources` 返回答案及文件引用
示例:
- vault ask “我关于项目规划的笔记有哪些?”
开源项目链接: [https://github.com/chenxin-yan/nia-vault](https://github.com/chenxin-yan/nia-vault)
你好,
我创建了Axiomeer,这是一个开源的AI代理市场协议。这个想法是:与其将工具集成硬编码到每个代理中,不如让代理在运行时浏览目录,市场负责对所有内容进行排名、执行、验证和审计。
它的工作原理如下:
- 提供者通过10行JSON清单发布产品(API、数据集、模型端点)
- 代理用自然语言或结构化标签描述他们的需求
- 路由器根据能力匹配(70%)、延迟(20%)、成本(10%)以及硬性约束过滤器对所有选项进行评分
- 最高得分的选项被执行,输出结果经过验证(需要引用吗?时间戳?),证据质量被确定性地评估
- 如果证据是虚假/伪造/低质量的,代理会选择放弃,而不是产生幻觉
- 每次执行都会记录为不可变的收据
我认为现有方法中缺失的部分是信任层。MCP标准化了你如何连接到工具服务器。Axiomeer在更高的层面上运作:使用哪个工具,来自哪个提供者,你能信任返回的结果吗?
技术栈:Python、FastAPI、SQLAlchemy、Ollama(本地LLM,无需API密钥)。v1版本配备天气提供者(Open-Meteo + 模拟数据)。该架构支持返回结构化JSON的任何HTTP端点。
我们正在寻找贡献者,以便在各个领域(金融、搜索、文档、代码执行)添加真实的提供者。每个提供者大约需要30行代码加一个清单。
几周前,我发布了关于 GoodToGo 的帖子 <a href="https://news.ycombinator.com/item?id=46656759">https://news.ycombinator.com/item?id=46656759</a> —— 这是一个为 AI 代理提供确定性答案的工具,回答“这个 PR 准备好合并了吗?”许多人询问我提到的更大规模的协调系统。这就是那个系统。
我厌倦了作为 Claude Code 的项目经理。它写代码没问题,但将生产代码交付出去需要七八个工作——研究、规划、设计审查、实施、代码审查、安全审计、PR 创建、CI 监控。我一直在自己协调所有工作。虽然代理的输入速度很快,但我仍然是瓶颈。我真正需要的是一个协调者的协调者——成群的代理和具有确定性质量检查的群体。
因此,我构建了 metaswarm。它将工作分解为多个阶段,并将每个阶段分配给一个专业的群体协调者。它管理交接,并使用 BEADS 作为在 /compact、/clear 甚至跨会话的确定性门控。只需将其指向一个 GitHub 问题或进行头脑风暴(它使用 Superpowers 提出澄清问题),它就会创建史诗、任务和依赖关系,然后运行完整的管道,直到合并 PR——包括像 CodeRabbit、Greptile 和 Bugbot 这样的外部代码审查。
让我最惊讶的是设计审查门控。五个代理——项目经理、架构师、设计师、安全专家、CTO——在每行代码写入之前并行审查每个计划。所有五个都必须批准。最多三轮审查,然后升级到人工。我原以为只是走个过场,但它确实捕捉到了真实的设计问题、依赖关系问题和安全漏洞。
这个周末,我将其指向我的待办事项列表。合并了 127 个 PR。每一个都达到了 100% 的测试覆盖率。没有人编写代码、审查代码或点击合并。好吧,我稍微引导了一下,主要是帮助一些史诗的计划。
一些经验教训:
代理的检查清单只是形式。代理跳过了覆盖率检查、误读了阈值,或者决定它们不适用。仅靠提示是不够的。解决方案是确定性门控——BEADS、预推送钩子、CI 任务,所有这些都在代理完成检查之上。无论代理是否合作,这些门控都能阻止不良代码。
这些代理只是 markdown 文件。没有自定义运行时,没有服务器,虽然我是在 TypeScript 上构建的,但代理是语言无关的。你可以阅读它们,编辑它们,添加自己的内容。
它也会自我反思。在每次合并 PR 后,系统会提取模式、注意事项和决策,形成一个 JSONL 知识库。代理只加载与它们正在处理的文件相关的条目。它交付的越多,犯错的机会就越少。它在不断学习中进步。
metaswarm 基于两个项目:<a href="https://github.com/steveyegge/beads" rel="nofollow">https://github.com/steveyegge/beads</a>(由 Steve Yegge 提供,支持 git 原生任务跟踪和知识准备)和 <a href="https://github.com/obra/superpowers" rel="nofollow">https://github.com/obra/superpowers</a>(由 Jesse Vincent 提供,支持有纪律的代理工作流程——TDD、头脑风暴、系统调试)。这两个项目都是必不可少的。
背景:我创办了 Technorati、Linuxcare 和 Warmstart;曾在 Lyft 和 Reddit 担任技术高管。我构建 metaswarm 是因为我需要能够以与我对人类团队相同的标准交付生产代码的自主代理。
$ cd my-project-name
$ npx metaswarm init
MIT 许可证。我不是律师。具体情况可能有所不同。欢迎提出问题/PR!
最近,我对当前加密货币和黄金的状态感到非常不安。加密货币的波动性与传统“避风港”资产如黄金的不确定性结合在一起,让人很难理解现在真正的稳定性在哪里。感觉每个选择都带来了不同类型的风险。我很好奇其他人如何看待这个时刻——你们是继续投资、减少风险敞口,还是完全转向其他投资?我有点害怕可能会爆发战争。
您对使用MCP服务器与Postgres有什么问题?<p>我们还为PostgreSQL创建了一个开源的MCP服务器(适用于任何新开发的应用程序或现有数据库),名为pgedge-postgres-mcp(https://github.com/pgEdge/pgedge-postgres-mcp)——在这里提出问题和反馈都非常欢迎。<p>今年二月,我们将安排一个网络研讨会,届时项目的工程师将会参与。他会回答在这个讨论串中提出的问题以及在会议结束时问答环节中提出的问题。<p>请关注这里的安排:https://www.pgedge.com/webinars<p>让我们为大家创造一个有趣的交流环境——如果您有任何问题或反馈,请回复或联系community@pgedge.com。
与“没有证据表明没有X”不同。<p>这是一个非常重要的区别。