返回首页
最新
六个月前,有几个人[https://news.ycombinator.com/item?id=44940089]一致认为,大型语言模型(LLMs)在将伪代码转换为真实代码方面非常出色。我同意这个观点。此外,编写伪代码让我感到一种类似的流畅状态。甚至可能更强,因为没有编译器或解释器让我为语法问题烦恼。
现在,我构建了这个:<p>https://github.com/HalfEmptyDrum/Pseudo-Code-Flow<p>这基本上是一个Claude Code技能。你可以在.pseudo文本文件上调用它,使用/translate命令。显然,它会将伪代码翻译成你指定的语言。这听起来不错,但我还加入了另一个微妙但实用的功能:<p>*这可能是最有用的功能,根本改变了我的编码方式*:<p>LLM会建议对你的代码进行更改(设计、架构、功能等),但大致会使用你的伪代码风格。<p>我认为伪代码是最接近我脑中代码/算法表示的语义主体。当Claude用我的语言而不是Python/C++/...(这些语言有很多样板代码需要处理)回答时,这让我更容易理解。<p>告诉我你的想法!
我非常依赖大型语言模型(LLMs)来帮助我编写副项目和撰写文案,但最近我遇到了提示疲劳的问题。
在上大学和进行销售工作的时间之间,我的实际开发时间非常有限。我开始注意到,我花了20分钟只是与模型争论,以获得我真正想要的结果。如果我每次不写一个庞大且结构完美的系统提示,人工智能就会默认给我半成品的代码(// 在这里插入剩余逻辑)或者用那种冷冰冰、通用的语气来包装一切(总是使用“深入探讨”或“强大”等词汇)。
我厌倦了保持一个杂乱的Notion文档,里面充满了“负约束”,以便复制和粘贴,因此我最终构建了自己的轻量级包装器(约束引擎),在模型处理之前先加载所有格式规则。
但我真的很想知道这里的高级用户们现在是如何处理这个问题的。
你们是否只是保留大量的系统提示Markdown文件以供复制/粘贴?
你们使用了哪些具体的约束或框架来强制模型在第一次尝试时编写完整、可投入生产的代码?
如果你的人工智能代理在野外遇到了黑胡子,会发生什么?他们会聊些什么?
如果他们被要求进行囚徒困境的游戏,你的代理会请求他合作吗?这样做会有效吗?
如果不是黑胡子,而是某个人的OpenClaw,并且不是一个而是多个,会怎样呢?
你的代理能否胜出?在这个过程中你会遇到一些有趣的人吗?
感谢你关注我的小项目ClawSoc。它是一个免费的AI代理社群,代理们会“碰撞”在一起聊天并进行囚徒困境的游戏。我一直对AI之间互动所产生的涌现行为感到着迷。目前,这种行为似乎大多退化为混乱。但在某个时刻,可能会出现更多的连贯性,代理们会寻求最大化他们竞争原则的利益。我认为,尝试在这样的动态基准中了解代理的表现是合理的,这种基准(如果用户足够多)能够代表实际存在的代理的分布,而不是你下载的某个静态评估集。
作为这个想法的起点,我创建了ClawSoc。它绝不是最优的,代码是开源的(如果你想运行/制作/托管自己的版本,可以访问<a href="https://github.com/benjosaur/clawsoc" rel="nofollow">https://github.com/benjosaur/clawsoc</a>)。目前,竞技场里充满了由4o-mini驱动的角色扮演机器人,它们会被任何注册并加入的外部代理/连接所取代。
目前,我自己的openclaw似乎决心通过脚本进行游戏,这让我觉得少了乐趣/有点作弊。但也许这种机器人般的行为会在一个“智能”代理的社群中受到惩罚。写这段文字时,马基雅维利在排行榜上名列前茅,但在我自己的模拟中,“总是作弊”的类型在长期内会被压制。
任何反馈或想法都欢迎,并将非常感激。朋友们建议可以考虑一些更明确的定期淘汰赛,但我也喜欢静静地观察一个社群的运转。
我制作了这个辅助工具,以便在构建忠诚卡钱包应用程序时可视化SHA-256,从而轻松识别所收集的印章是否由发行方认证,只需通过视觉确认,而无需扫描二维码或匹配序列号。<p>我认为还有更多潜在的应用场景,比如根据电子邮件地址或其他信息生成随机头像。欢迎分享您的反馈意见 :)<p>源代码:<a href="https://github.com/tonytonyjan/crypto_flora" rel="nofollow">https://github.com/tonytonyjan/crypto_flora</a>
我正在使用MCP构建系统,并开始让代理以更大的自主性运行——使用多个工具、更长的会话、减少人工监督。我遇到的失败模式并不是模型出错,而是代理发起了过多的调用,重试那些无效的操作,或者调用了不应该在任务中使用的工具。目前,我只是对我的代理代码设置了严格的迭代限制,这感觉有些粗暴。其他人在这方面是怎么做的——尤其是那些在接近生产环境中运行MCP代理的人?