返回首页
最新
嗨,HN,我是一名独立的安全研究人员,想分享我发现的一个新漏洞。
由于我的账户太新,无法直接提交链接,所以我选择以文本形式发布。
这个技术被称为“思维伪造”(CoT注入)。它通过伪造AI的内部独白来工作,这种独白作为其他越狱技术的通用放大器。我已经确认它在Google、Anthropic、OpenAI等最新模型上有效。
如果有人感兴趣,我很乐意在评论中分享GitHub上完整技术文档的链接。
有没有什么技巧?比如说同步执行任务等?我尝试过使用 GitHub Actions 在推送时进行分支重基,但没有找到一个稳定的工作流程。我想知道是否有人有一些建议?