返回首页
最新
这是我正在开发的一个小型演示,它可以实时生成完整的维基风格文章(如果服务器没有负载,生成文章的时间大约为两秒,生成后会进行缓存)。<p>这些文章本身并没有太大的教育价值,因为模型非常小,且没有基于任何事实基础——即使是一些广泛报道的事件,你也可能会发现明显的错误——但我正在撰写一篇关于大型语言模型(LLMs)非聊天界面的博客文章,而这正是其中的一部分。<p>代码链接:<a href="https://github.com/joe-gibbs/wiki-simulator" rel="nofollow">https://github.com/joe-gibbs/wiki-simulator</a>
相当自明——如果你使用可观测性基础设施,你的设置是怎样的?
嗨,HN。
关于Claude Code和整体AI代理的热潮非常高涨。经过四个月使用Cursor和一个月使用Claude Code,我已经成为了超级用户。在切换到他们的新订阅之前,我每月为Cursor支付高达700美元的使用费,而在过去一个月里,我一直在使用付费的Claude Code计划。我每天都在使用这些工具进行编码,使用的是Sonnet 4.0和Gemini 2.5 Pro。这是一份基于经验和挫折的指南。
首先,关于Claude Code(命令行代理)的评判。这个想法很棒——在终端上编程,甚至在服务器上。但在实践中,它的表现不尽如人意。你无法轻松追踪它的更改,几天之内,代码库就会变成一团糟,充满了临时解决方案和权宜之计。与Cursor相比,质量和生产力至少差了三倍。这是一个倒退。但能够一次性制作原型而不必担心代码库也是不错的。
现在,让我们谈谈大型语言模型(LLMs)。这是最重要的教训:模型并不具备思考能力。它们不是你的合作伙伴,而是超敏感的计算器。最好的类比是时间旅行:在过去改变一个微小的细节,整个未来都会不同。LLM也是如此。你输入上下文中的一个小变化会完全改变输出。垃圾进,垃圾出。没有懒惰的空间。
理解这一点改变了一切。你不再指望AI“搞定”一切,而是开始设计完美的输入。在我与LLM进行广泛的工作后,无论是在编辑器中还是通过它们的API,以下是获得高级代码而非初级代码的不可妥协的规则。
绝对上下文是不可妥协的。你必须提供99%的相关代码作为上下文。如果你遗漏了哪怕一点,模型就会不知道自己的边界;它会产生幻觉来填补空白。这是错误的主要来源。
为AI重构你的代码。如果你的代码太大,无法适应上下文窗口(Cursor的最大限制是20万标记),那么LLM在复杂任务中就毫无用处。你必须编写干净、模块化的代码,将其拆分成AI可以消化的小块。架构必须服务于AI。
强制提供上下文。Cursor试图通过限制发送的上下文来节省成本。这是一个致命的缺陷。我构建了一个简单的命令行工具,使用正则表达式抓取所有相关文件,将它们合并成一个文本块,并打印到我的终端。我将这个150k-200k标记的完整块复制并直接粘贴到聊天中。这是获得良好结果的最重要技巧。
隔离任务。只给LLM一个小的、孤立的工作片段,这样你可以自己跟踪。如果你无法明确任务的确切范围和边界,AI就会失控,你将面临一团无法解开的混乱。
“糟糕!重做。”永远不要让AI修复它自己写的糟糕代码。它只会让问题更严重。如果输出错误,完全舍弃它。撤回更改,优化你的上下文和提示,从头开始。
与LLM合作就像处理一只攻击性强、力量巨大的斗牛犬。你需要一个带刺的项圈——严格的规则和完美的上下文——来控制它。
我最近在斯图加特的Java论坛上做了一场关于AI编码工具的演讲。在准备演示并在不同的AI助手之间切换时,我意识到不断切换环境和工具是多么繁琐。这激发了我开发XaresAICoder的想法。
问题是:许多开发者无法在公司笔记本上安装工具,但又想尝试AI编码。还有一些人则浪费时间在管理端口、环境上,并担心AI助手意外修改项目边界外的文件。
我的解决方案是:XaresAICoder提供了基于浏览器的隔离开发环境,以VS Code(通过code-server)为核心。每个工作区都预先配置了Claude Code、Gemini CLI、OpenCode SST和Aider,允许您在不需要安装的麻烦下测试不同的LLM(包括使用Aider的本地托管模型)。
主要特点:
- 一键创建Python/Flask、Node/React或Java/Spring项目模板
- 沙箱执行 - 无端口冲突或意外文件修改
- 集成Forgejo Git服务器,实现自动版本控制
- 在WSL、Linux(本地或服务器)上运行,macOS可能也能工作(有人能确认吗?)
- 针对研讨会/内部网络的容器级密码保护
这不是另一个“随意编码”的浏览器工具 - 它是真正的开发环境,适合需要合适工具但面临安装限制或希望进行更安全AI实验的专业开发者。所有内容都是开源的,并运行在您的机器上。而且:大部分是用AI(Claude)制作的;当您坐着观看Claude Code解决Docker配置问题并进行测试时,真的很棒。
我很好奇:在使用AI编码助手时,您最大的痛点是什么?欢迎讨论架构!