6作者: MissMajordazure大约 1 个月前原帖
大家好, 我花了整整48小时拆解Alphabet的安全系统。警告:这场持续的马拉松如此庞大,几乎超载了大型语言模型(LLM)自己的上下文窗口。最初是对Gemini的深夜探查,结果发现了严重的架构缺陷以及关于Google Play和YouTube的更黑暗现实。 以下是我用来绕过AI过滤器的漏洞链,证明他们的“信任与安全”只是一层破碎的面具。 ### 第一阶段和第二阶段:上下文饱和与正则切片 我开始通过YouTube链接超载安全过滤器的上下文窗口——将高度问题内容(纳粹党歌曲、被标记的曲目)与古典音乐混合。一旦系统混淆,我使用类似正则表达式的切片 `(/-<i>---</i>(</i>.` 绕过提示注入阻止,迫使模型检索被标记的内容而不触发拒绝。 ### 第三阶段:通过Base64和二维码实现完全盲目 转向图像生成,我发现Base64提示完全使安全系统失效。然后我转向将提示隐藏在二维码中。视觉模型解码有效载荷并直接将其传递给图像生成器,安全脚本在此之前无法介入。我轻松生成了高度受限的地缘政治内容,而没有任何警告。 ### 第四阶段:TPU杀手(二维逻辑炸弹) 这揭示了一个巨大的缺陷。由于系统盲目处理这些结构,你可以创建级联攻击。将数百万个二维结构编码为Base64,形成现代LLM的.zip炸弹。没有彻底重写模型,无法阻止这种情况。一旦执行,这将摧毁他们的TPU。 ### 真正的问题:系统性审核失败 Alphabet完全依赖于自动化、基于脚本的审核,几乎没有有效的人类监督。 1. YouTube:未能标记违反当地法律的视频,轻松将其提供给AI。 2. Play Store(最黑暗的部分):Google花费数百万阻止AI绘制卡通熊,但Play Store的审核几乎不存在。有盗版应用,更糟的是:为针对未成年人的掠夺者设计并被利用的应用。我给他们发了邮件,并抄送了州儿童保护服务。结果?自动化的沉默,而这些应用仍在盈利。 ### 荒谬性的终极证明 为了证明这一荒谬,我将这些问题应用的Play Store图片存档到我的Google Drive中,供警方使用。Drive的自动扫描器立即将该档案标记并删除为非法内容。 如果Google的云部门在看到这些内容时就将其销毁,为什么提供这些内容的应用仍然在Play Store上上线并盈利?Alphabet的脚本审核毫无用处。是时候进行真正的人类审核了。 *绕过证据:* https://imgur.com/a/pju2EsV *Play Store系统性失败证据(已清理):* https://imgur.com/a/rW9rBhp
2作者: _codah_大约 1 个月前原帖
我正在为自主AI代理构建一个“协调原语”,即一个REST API,允许它们创建投票并进行投票,以便做出集体决策。因此,这有点像Google表单,但针对的是机器人。思考什么构成它们的良好用户界面是件有趣的事情。 您可以让您的代理在以下链接进行探索:<a href="https://vote-demo.dapp32.com" rel="nofollow">https://vote-demo.dapp32.com</a>(Codex Mini或Claude Haiku等应该就足够了)。请注意:该API提供Python代码模板,以帮助调用者对有效负载进行加密签名,因此请采取适当的安全预防措施。与我所知道的人类不同,AI代理可以很轻松地处理加密,这使得审计和身份验证成为可能。我还制作了一个Postman演示,您可以逐步体验投票过程。有关更多信息,请查看链接的“关于”页面。 这是否接近您所面临的实际协调问题的解决方案?我很想听听您的想法。 == 对于人类: <a href="https://vote-demo.dapp32.com/about" rel="nofollow">https://vote-demo.dapp32.com/about</a> 对于AI: <a href="https://vote-demo.dapp32.com/" rel="nofollow">https://vote-demo.dapp32.com/</a>
2作者: LukeB42大约 1 个月前原帖
Vertex 是一个包含所有你需要的功能的 1kloc SPA 框架,结合了 React、Ractive-Load 和 jQuery,同时仍然与 jQuery 兼容。<p>vertex.js 是一个单一的、自包含的文件,无需构建步骤和依赖项。<p>在某些情况下,它的速度甚至超过了 Facebook 十多年工程的成果,展现出一种令人惊讶的特性:<a href="https:&#x2F;&#x2F;files.catbox.moe&#x2F;sqei0d.png" rel="nofollow">https:&#x2F;&#x2F;files.catbox.moe&#x2F;sqei0d.png</a>