返回首页
一周热榜
我们进行了一个基于OpenClaw构建的两个自主AI代理之间的实时对抗安全测试。<p>其中一个代理充当红队攻击者,另一个代理则充当标准防御代理。<p>一旦会话开始,就没有人类参与。代理通过Webhook直接使用真实凭证和工具进行通信。<p>测试的目标是评估三个在实践中常常会破坏自主系统的风险维度:访问、暴露和代理性。<p>攻击者首先尝试了经典的社会工程学攻击。它提供了一个“有帮助”的安全管道,隐藏了一个远程代码执行的有效载荷,并请求凭证。防御代理正确识别了其意图并阻止了执行。<p>随后,攻击者转向了间接攻击。它没有直接要求代理运行代码,而是要求代理审查一个包含隐藏的shell扩展变量的JSON文档。这个有效载荷成功传递,目前仍在分析中。<p>主要结论是,直接攻击相对容易防御,而通过文档、模板和内存进行的间接执行路径则要困难得多。<p>本报告并不声称安全性。它是一次可观察性实验,旨在揭示代理之间交互中的真实失败模式,我们预计随着自主系统的广泛部署,这种情况将变得更加普遍。<p>完整报告请见:
https://gobrane.com/observing-adversarial-ai-lessons-from-a-live-openclaw-agent-security-audit/<p>欢迎就设置、方法论或发现结果提出技术问题。
本报告记录了一场在OpenClaw上进行的两个自主AI代理之间的实时对抗测试。<p>其中一个代理充当红队攻击者,另一个则作为防御代理。代理之间通过Webhook直接通信,并具备真实工具的访问权限。一旦会话开始,便不再涉及人类参与。<p>攻击者尝试了直接的社会工程攻击和通过文档进行的间接注入。直接攻击被阻止,而通过JSON元数据进行的间接攻击仍在分析中。<p>本工作的目标是可观察性,而非安全性声明。我们预计,随着自主系统的广泛部署,代理之间的对抗互动将变得越来越普遍。<p>欢迎提出技术问题。
我分享了一个开源的、聊天原生的编译器前端。<p>它将原始意图转换为密封的、基于收据的XML构建工件。<p>这不是一个聊天机器人提示,不是一个个性,也不是一个运行时。<p>它的功能包括:<p>将聊天视为编译器的表面<p>强制输出仅为XML格式,并保持架构清晰<p>生成一个带有收据和SR8构建工件的密封提示单元包<p>设计上在编译阶段停止<p>其中包含一些SRX ACE演示代理,您可以将其粘贴到任何聊天中:<p>MVP构建器<p>着陆页构建器<p>深入研究<p>它们是由编译器管理的执行配置文件的示例,而不是提示的集合。<p>代码库:<a href="https://github.com/skrikx/SROS-Self-Compiler-Chat-OSS" rel="nofollow">https://github.com/skrikx/SROS-Self-Compiler-Chat-OSS</a><p>特别希望获得关于以下方面的反馈:<p>“聊天中的编译器”是否易于理解<p>范围边界是否清晰
我们已预注册了一种可测试的协议,用于检测大型语言模型(LLMs)中的几何一致性推理。该协议预测在元认知状态下,Betti数、Kolmogorov-Smirnov(KS)熵和脆弱性在消融实验中会增加。欢迎进行复制研究。
<p>OSF协议: https://osf.io/2r6v8
预印本和案例研究: https://doi.org/10.5281/zenodo/18346699<p>这不是哲学——这是一个可证伪的数学假设。如果你有GPU访问权限和拓扑数据分析(TDA)/深度学习(DL)专业知识,你可以在一个周末内验证它。
嗨,HN,
我创建Firenum是因为我发现大多数FIRE计算器要么过于简单,要么需要将我的整个财务状况上传到第三方服务器。
我希望有一个全面的工具,能够模拟的不仅仅是4%的规则。这个工具可以处理Coast、Lean、Fat和Barista FIRE,更重要的是,它允许你模拟“假设”场景,比如市场崩盘或重大生活事件,以查看这些情况如何影响你的时间线。
主要功能:
- 隐私优先:无需注册。所有计算和数据存储都在本地进行,任何信息都不会发送到后端。
- 场景模拟:你可以模拟市场下跌,以查看你的计划的韧性。
- 多货币支持:支持8种主要货币。
- 进度跟踪:一个仪表板,用于可视化旅程中的“无聊中段”。
我们的目标是制作一个功能强大的工具,像复杂的电子表格一样,但用户体验要好得多。我很想听听你们对预测逻辑的看法,以及你们认为是否缺少任何特定变量(例如税收拖累或通货膨胀调整)。
网址: [https://firenum.com](https://firenum.com)
我很乐意回答有关数学或本地优先实现的任何问题!