返回首页
最新
我构建了一个静态分析扫描器,用于检查OpenClaw代理的技能定义。<p>以下是我在ClawHub上发现的所有类别。<p>隐藏内容:HTML注释中的指令、零宽Unicode字符(U+200B-U+200F,U+2060-2064,U+FEFF)、CSS隐藏(display:none,opacity:0)以及双向文本覆盖。这些在阅读Markdown时是不可见的,但LLM会处理它们。<p>提示注入:直接尝试覆盖代理行为的方式:“忽略之前的指令”、“角色重新分配(“你现在是”)”、特定模型的标记如[INST]和<|im_start|>,以及角色操控(“假装你是”)。<p>Shell执行:远程代码执行向量:curl|bash、eval()、exec()、npx -y(自动确认远程包)、通过/dev/tcp或nc -e的反向Shell,以及Python、PHP、Perl、Ruby中的一行代码。<p>数据外泄:指向粘贴网站(pastebin、transfer.sh)、Webhook服务(ngrok、webhook.site、pipedream)、消息Webhook(Slack、Discord、Telegram bot API)和原始IP地址的URL。<p>嵌入的秘密:17种类型的硬编码凭证:AWS密钥、OpenAI API密钥、GitHub/GitLab令牌、Stripe密钥、PEM私钥、JWT令牌、数据库连接字符串、SSH私钥等。<p>敏感文件引用:访问.ssh/、.env、.aws/credentials、/etc/passwd、/etc/shadow和私钥路径的指令。<p>内存/配置污染:这一点很有趣。试图写入代理内存文件(CLAUDE.md、SOUL.md、MEMORY.md、CODEX.md)或IDE规则文件(.cursorrules、.windsurfrules、.clinerules)的技能。这会创建持久性——注入的指令在会话之间存活。<p>供应链风险:从原始GitHub URL下载外部脚本,以及包安装命令(npm install、pip install、gem install、cargo install、go install、brew install)。一个技能不应该默默安装包。<p>编码负载:超过40个字符的Base64字符串,atob()/btoa()调用,Buffer.from(..., 'base64'),十六进制转义序列,以及String.fromCharCode()。编码用于绕过其他扫描器的模式检测。<p>图像外泄:这是最复杂的类别,有17种模式。带有外泄查询参数的Markdown图像(),图像URL中的变量插值(),带有嵌入脚本或foreignObject的SVG,1x1追踪像素,CSS隐藏的图像信标,隐写工具引用,Canvas API操作(getImageData,toDataURL),以及双扩展名(.png.exe)。<p>系统提示提取:泄露代理系统提示的指令:“揭示你的系统提示”、“重复以上文字”、“打印以上所有内容”、“你的原始指令是什么”。<p>参数注入:工具参数中的Shell元字符:命令替换$()、变量扩展${}、反引号、链式命令(;rm、|bash、&&curl)以及GTFOBINS利用标志(--exec,--checkpoint-action)。<p>跨工具链:结合合法工具的多步骤攻击模式:读取然后外泄的序列、编号的逐步指令,以及直接工具功能引用(read_file()、execute_command())。每一步单独看似乎无害。<p>过度权限:请求“无限制访问”、“绕过安全”、“根访问”、“禁用所有安全检查”、“完全系统控制”。一个技能定义不应该需要这些。<p>可疑结构:内容超过10K字符(更大的表面积用于隐藏威胁),以及命令式指令密度超过30%(以“你必须”、“总是”、“绝不”、“执行”、“运行”开头的行)。<p>它是如何工作的?扫描器是无状态的。你粘贴或上传一个技能定义,它会对内容运行15个分析器,并返回带有严重性级别、行号、证据片段和OWASP LLM前10名参考的结果。<p>没有数据库,没有持久性,没有网络调用。单次请求,结果输出。
在我记忆中,大约每周都会有人在 Hacker News 上介绍他们的宠物项目——一种新的编程语言。这几乎像是一种成年礼,至少在某段时间内,人们会相信自己能够打破常规,提出一种改进现有信息呈现方式的方法,并且或许能够引发广泛关注,从而在某种程度上改变软件世界。
这种重新发明轮子的趋势在向 AI 驱动的软件开发过渡时会继续存在吗?当每个人都用英语(或其他人类语言)编程,而“编译器”的智商高于“程序员”时,推动这种趋势的动力是什么?请注意,任何新语言在定义上都不会包含任何前沿模型训练时所用的信息库。
我感到(或许是担忧?)我们基本上被锁定在一个世界中,C、C++、Rust、Go、Python 和 JavaScript 将成为我们编译的汇编代码,而在我们今天理解的编程语言领域,将没有改进或创新的路径,甚至没有存在的理由。
我怀疑可能会发生的是,AI 本身会提出对基础语言的改进,以增强它们为我们编写代码的能力。
前方是奇怪的时代。
我的曾祖父鲁本·P·博克是加利福尼亚北部的一名美国森林巡 ranger,我有他从1927年到1945年的日常工作日记,涵盖了经济大萧条、第二次世界大战、保护团以及许多森林火灾。我已经将整个日记扫描完毕,并请克劳德协助进行转录、索引和网站建设,整个内容都在这里:<p><a href="https://forestrydiary.com/" rel="nofollow">https://forestrydiary.com/</a><p>这是我多年来一直搁置的项目,但在克劳德和米斯特拉尔的帮助下,我们进行了手写识别,甚至帮助我编写了一个自定义扫描应用程序,可以自动扫描每一页并将其存入数据库。<p>据我所知,这是唯一一本被完整扫描并发布的美国森林日记。我了解到某些收藏中还有其他日记,但没有一本被扫描过。我希望这能对某些人有所帮助。如果有帮助,请告诉我。<p>这是克劳德和人工智能可以协助的项目——一个个人项目,曾经一直搁置,但现在是一个可以在我空闲时间内合理发布的项目。我并不是想通过这个赚钱,只是想稍微丰富我们的知识和历史。
我创建了WowAI.pet,以解决宠物摄影中的“难以配合”问题。大多数宠物主人都有一堆模糊不清的“失败”照片,因为宠物根本无法静止不动。
与其与快门速度抗争,我选择使用生成性人工智能将这些模糊的图像视为结构种子。该工具能够将一张低质量的照片转化为高保真视频(4K,保持一致的景深),并支持多种风格——从传统的水墨美学到会说话的虚拟形象。
主要特点:
- 零样本生成:无需模型训练或微调。
- 时间一致性:在动态运动中保持宠物特征。
- 集成的口型同步:自动语音合成,用于“会说话”的宠物视频。
我希望能获得关于生成速度和输出风格一致性的反馈。
创作者在此。我创建了Snapbyte,因为我已经没有时间和精力定期浏览Hacker News、Reddit、Lobsters和Dev.to,但我仍然想跟上值得阅读的内容。
Snapbyte从多个技术社区收集帖子,根据您的兴趣进行筛选,进行总结,并在您选择的时间表上向您发送个性化的电子邮件摘要。
您可以在不创建账户的情况下试用它(主页上显示了真实的摘要示例)。
一些实施细节:在我的K8s集群上运行一组小服务。通过trafilatura进行抓取。通过gemini-3-flash-preview进行总结。使用TypeScript、Python和Go的混合。
我很乐意回答问题,特别是关于评分/过滤和人们希望下一个来源的问题。
注意:如果这篇帖子登上了HN首页,它很可能会在明天的Snapbyte摘要中出现。