返回首页
最新
大家好,
我花了整整48小时拆解Alphabet的安全系统。警告:这场持续的马拉松如此庞大,几乎超载了大型语言模型(LLM)自己的上下文窗口。最初是对Gemini的深夜探查,结果发现了严重的架构缺陷以及关于Google Play和YouTube的更黑暗现实。
以下是我用来绕过AI过滤器的漏洞链,证明他们的“信任与安全”只是一层破碎的面具。
### 第一阶段和第二阶段:上下文饱和与正则切片
我开始通过YouTube链接超载安全过滤器的上下文窗口——将高度问题内容(纳粹党歌曲、被标记的曲目)与古典音乐混合。一旦系统混淆,我使用类似正则表达式的切片 `(/-<i>---</i>(</i>.` 绕过提示注入阻止,迫使模型检索被标记的内容而不触发拒绝。
### 第三阶段:通过Base64和二维码实现完全盲目
转向图像生成,我发现Base64提示完全使安全系统失效。然后我转向将提示隐藏在二维码中。视觉模型解码有效载荷并直接将其传递给图像生成器,安全脚本在此之前无法介入。我轻松生成了高度受限的地缘政治内容,而没有任何警告。
### 第四阶段:TPU杀手(二维逻辑炸弹)
这揭示了一个巨大的缺陷。由于系统盲目处理这些结构,你可以创建级联攻击。将数百万个二维结构编码为Base64,形成现代LLM的.zip炸弹。没有彻底重写模型,无法阻止这种情况。一旦执行,这将摧毁他们的TPU。
### 真正的问题:系统性审核失败
Alphabet完全依赖于自动化、基于脚本的审核,几乎没有有效的人类监督。
1. YouTube:未能标记违反当地法律的视频,轻松将其提供给AI。
2. Play Store(最黑暗的部分):Google花费数百万阻止AI绘制卡通熊,但Play Store的审核几乎不存在。有盗版应用,更糟的是:为针对未成年人的掠夺者设计并被利用的应用。我给他们发了邮件,并抄送了州儿童保护服务。结果?自动化的沉默,而这些应用仍在盈利。
### 荒谬性的终极证明
为了证明这一荒谬,我将这些问题应用的Play Store图片存档到我的Google Drive中,供警方使用。Drive的自动扫描器立即将该档案标记并删除为非法内容。
如果Google的云部门在看到这些内容时就将其销毁,为什么提供这些内容的应用仍然在Play Store上上线并盈利?Alphabet的脚本审核毫无用处。是时候进行真正的人类审核了。
*绕过证据:* https://imgur.com/a/pju2EsV
*Play Store系统性失败证据(已清理):* https://imgur.com/a/rW9rBhp
Steward 将 GitHub、电子邮件、Slack、日历和本地屏幕信号整合为上下文,自动执行低风险任务,并为不可逆操作设置安全门,定期发送自然语言简报,而不是不断发送通知。
我正在为自主AI代理构建一个“协调原语”,即一个REST API,允许它们创建投票并进行投票,以便做出集体决策。因此,这有点像Google表单,但针对的是机器人。思考什么构成它们的良好用户界面是件有趣的事情。
您可以让您的代理在以下链接进行探索:<a href="https://vote-demo.dapp32.com" rel="nofollow">https://vote-demo.dapp32.com</a>(Codex Mini或Claude Haiku等应该就足够了)。请注意:该API提供Python代码模板,以帮助调用者对有效负载进行加密签名,因此请采取适当的安全预防措施。与我所知道的人类不同,AI代理可以很轻松地处理加密,这使得审计和身份验证成为可能。我还制作了一个Postman演示,您可以逐步体验投票过程。有关更多信息,请查看链接的“关于”页面。
这是否接近您所面临的实际协调问题的解决方案?我很想听听您的想法。
==
对于人类:
<a href="https://vote-demo.dapp32.com/about" rel="nofollow">https://vote-demo.dapp32.com/about</a>
对于AI:
<a href="https://vote-demo.dapp32.com/" rel="nofollow">https://vote-demo.dapp32.com/</a>
Vertex 是一个包含所有你需要的功能的 1kloc SPA 框架,结合了 React、Ractive-Load 和 jQuery,同时仍然与 jQuery 兼容。<p>vertex.js 是一个单一的、自包含的文件,无需构建步骤和依赖项。<p>在某些情况下,它的速度甚至超过了 Facebook 十多年工程的成果,展现出一种令人惊讶的特性:<a href="https://files.catbox.moe/sqei0d.png" rel="nofollow">https://files.catbox.moe/sqei0d.png</a>