返回首页
最新
在过去的六个月里,我在构建AI开发工具包的过程中不断优化我的AI编码工作流程。<p>最重要的变化不是更好的代码生成,而是从可重用的命令和模板转变为一个能够携带上下文、触发正确行为并自动验证工作的工作流程。<p>最近的一个功能使这一点变得显而易见。我使用Codex为“ai-devkit skill add”构建了一个互动技能选择界面。我只提供了一句指令,工作流程便将任务推进到需求、设计、规划、实施、验证、测试和代码审查等各个阶段。<p>整个过程不到一个小时,实际的功能流程大约花了30分钟。<p>我觉得有趣的不仅仅是AI写了代码,而是这个工作流程留下了需求、设计文档、规划材料、基于需求的测试以及与规范的验证,而不仅仅是一个差异对比。<p>在实践中,我觉得有几个重要的方面:<p>- 内存回忆起我曾经存储的一个旧的命令行规则
- 审查阶段可以向后循环,而不是盲目向前推进
- 验证捕捉到了实施与设计之间的偏差
- 我仍然自己做出产品决策,并修复了最后一个失败的测试<p>我很好奇在座的其他人对此是如何思考的。<p>你们主要是在优化提示,还是现在开始尝试优化围绕模型的工作流程层?
我一直在思考为人工智能时代构建一种语言的想法。<p>以下是我希望包含的一些特性(并不是详尽无遗的列表):
- 将副作用的完整代码与纯逻辑分开
- 将状态与代码分开
- 原生的人工智能调试器
- 原生的确定性模拟测试
- 编码证明
- 明确的类型系统
- 交互式解释器(REPL)
- WebAssembly 目标<p>我没有编译器构建或类似领域的背景。我只是想花几周时间阅读关于这个主题的最佳资源。<p>请分享您推荐的任何阅读资料。
很长一段时间,我以为自己只是还没有找到合适的想法。我会对某个想法感到兴奋,深入思考几层,甚至开始规划……然后一两周后,我就会失去信心。接着又用不同的想法重复同样的过程。虽然当时感觉很有成效,但回头看,这只是一种循环。
在某个时刻,我对这种情况感到厌倦,做了一些稍微不同的事情。我不再专注于一个想法,而是开始收集各种想法。把我遇到的所有有趣的东西都放在一个地方,包括模式、半成品的想法,以及那些我通常在一天后就会忽略的东西。最终,这变成了一个小数据库(我后来称之为StartupIdeasDB,主要是为了我自己),但有用的部分并不是这个工具,而是能够将想法并排放置,而不对其中任何一个产生情感依赖。
这就是事情开始转变的地方。很多在孤立状态下看起来“稳固”的想法,放在20个类似的想法旁边时显得相当薄弱。你开始注意到同样的概念以稍微不同的措辞重复出现的频率。你也开始意识到,仅仅因为你花了几个小时思考某个想法,就很容易说服自己这个想法是好的。
对我来说,更大的领悟是,我一直在问错的问题。我不断问“这是个好主意吗?”这个问题很容易受到偏见的影响。实际上,更有帮助的问题是“这对谁立即有用,如何能让他们接触到它?”大多数想法在这个问题面前都无法存活。
我还注意到,听起来聪明的东西和人们实际会使用的东西之间的差距……是巨大的。远比我之前想象的要大得多。
具有讽刺意味的是,浏览数百个想法并没有让我变得更有创造力或更有灵感。反而让我变得更加怀疑。我认为这是件好事。
现在,当我遇到有趣的东西时,我的默认反应是迅速尝试反驳它,而不是兴奋地围绕它构建。虽然我仍在摸索这个过程,但单单这一转变就可能让我节省了几个月走错方向的时间。
这里的其他人是如何在承诺之前评估想法的呢?