在过去几个月中,代理技能从一个小众的Claude Code功能发展成为每个主要运行时都支持的特性。Anthropic有一个官方的技能库。OpenAI在Codex中推出了内置的技能创建工具。Karpathy提到“所有问题都是技能问题”,并将编写技能描述为代理的课程[1]。格式正在趋同:一个包含SKILL.md的文件夹,可能还有一些可选脚本和参考文件。
变化在于模型的性能已经足够好,能够可靠地遵循书面指令。技能只是一个经过测试的工作流程,采用markdown格式,代理读取并遵循,而不是即兴发挥。你还可以捆绑在工作流程中运行的脚本,这涵盖了大多数人使用轻量级MCP服务器的用途,除了代理可以读取脚本源代码并进行扩展。
Karpathy谈到了“代理经济”,并表示我们应该停止为人类编写HTML文档,而是开始为代理编写markdown文档[1]。Anthropic刚刚推出了一款技能创建工具,可以在模型更新后基准测试技能是否仍然有效。GitHub上已经有成千上万的社区技能。
目前的分发仍然感觉比较早期。大多数有用的技能都很小。一个markdown文件,可能还有一个脚本。足够有用以便重复使用,但没有人会将其转变为一个完整的GitHub库,带有README和安装说明。因此,它们仍然停留在一台机器上。
我已经为自己的代理编写技能一段时间了,但不断遇到这个问题。格式是可行的,但在机器之间移动它们或将其交给其他人时却不太顺利。
我很好奇其他人是否也遇到同样的障碍,或者是否有我遗漏的方法。
[1] <a href="https://www.youtube.com/watch?v=kwSVtQ7dziU" rel="nofollow">https://www.youtube.com/watch?v=kwSVtQ7dziU</a>(Karpathy在No Briars播客中的讨论,技能讨论大约在1:03:40)
返回首页
最新
嘿,HN,
我喜欢在我的 Dock 中保留活动监视器,但默认的图标总让我觉得不太对劲。虽然它在技术上显示了活动,但在视觉上却感觉不太像是 macOS 的一部分——更像是一块原始的画布,而不是一个合适的系统图标。
所以我重新设计了它。
同样的应用程序,同样的数据——只是一个看起来和行为上更像原生 macOS 组件的 Dock 图标,配有干净、易读的 CPU 图表。
没有新增功能,只是修正了它的外观和感觉。
我很好奇其他人是否也注意到了这一点,或者这从来没有困扰过你。
[链接1](https://x.com/rokgregoric/status/2035638066853908844?s=20)
[链接2](https://x.com/rokgregoric/status/2035641264461304028?s=20)
微软的第二代图像模型在Arena.ai上排名第三,提供强大的真实感和文本渲染能力,但目前存在1:1分辨率锁定、30秒冷却时间以及尚无编辑功能等限制。您可以在这里找到关于MAI-Image 2的所有信息,包括其令人印象深刻的能力和局限性:https://firethering.com/microsoft-mai-image-2/