返回首页
最新
大多数人工智能安全工具仅仅停留在标记看起来脆弱的代码上。你最终会得到一堆“潜在”的发现,却无法知道哪些是真实的,除非手动逐一复现。现在,发现和修复的成本都很低;真正证明哪些发现是有效且有影响力的,仍然是最后一个障碍。
RedAI 的设计就是为了填补这个空白。在扫描器代理列出候选项后,验证代理会将每一个候选项带入一个实时环境——目标的运行实例——并尝试证明或反驳该发现。它们会导航用户界面,访问端点,编写概念验证脚本,启动辅助服务器,捕获日志和截图。
最终结果是一个包含真实、可复现漏洞的报告,附有概念验证步骤和截图以证明其有效性。
我正在构建 Univence,这是一个由 GLM-5.1 驱动的定制自主编码代理平台。<p>我们希望将其打造成真正的 Replit/Vercel 竞争对手,但没有任何供应商锁定。您可以在我们的平台上与我们的最先进代理一起完全构建和开发,但您拥有代码,并且可以无缝部署到任何第三方主机,如 DigitalOcean、Netlify、AWS 或您自己的 VPS。<p>为了证明核心代理的能力,我们刚刚在 LiveCodeBench Lite 数据集(Python 分割)上进行了测试。以下是盲测 369 个问题的结果:<p><pre><code> 总计:348/369 通过(94.3%)
简单:138/141 通过(97.9%)
中等:152/156 通过(97.4%)
困难:58/72 通过(80.6%)
</code></pre>
(注意:我们通过对代理的约束进行工程设计,严格优先考虑最佳时间复杂度,如 O(n log n),而非暴力破解的 O(n^2),从而避免了通常会导致标准包装器出现超时错误的情况,成功达到了 80% 的困难题通过率)。<p>但我们不仅仅是为了技术而构建这个平台。我的联合创始人是一位目前居住在加沙地带的巴勒斯坦难民,我们推出这个平台是为了产生即时的人道主义影响。该平台每年 11 个月的利润将100%直接捐赠用于支持巴勒斯坦难民。<p>这个代理已经非常出色,但我有一份架构改进的路线图,可以让它变得更好。目前,我正在寻找快速的天使投资、计算资源赞助或战略合作伙伴,以帮助我们尽快扩展。<p><pre><code> 尝试一下:https://univence.com
原始 JSONL 轨迹日志:https://github.com/UnivenceAI/Univence-benchmarks/tree/main/Z%20AI/GLM-5.1
关注我们的进展和捐赠证明:https://x.com/UnivenceAI
</code></pre>
我非常欢迎您对平台或代理架构的反馈。如果您是投资者或希望支持我们的使命,可以在 X 上私信我,或者通过 univenceai@gmail.com 联系我们。
这是OpenDeck,我自己开发的定制MIDI控制器平台。我已经在这个项目上工作了超过10年,现在我进行了迄今为止最大的改动——重写了整个代码库,以便使用Zephyr实时操作系统(RTOS),我在过去几年中一直在专业领域使用它。这使我能够支持许多更新的电路板、复杂的功能,并且总体上现代化代码库。之前我在各个方面都受到限制。
该平台本身允许简单地构建和配置定制的MIDI控制器——主要原因是它不需要编写代码。只需将固件加载到电路板上,通过网页配置器进行配置,就可以开始使用。可配置的功能数量也非常庞大。我有详尽的文档,涵盖了使用、配置、各种电路板的刷写、自定义电路板等内容,所有文档都可以在GitHub上找到。
该平台支持大量不同的电路板——不仅包括我自己设计并销售的定制电路板,还有像Raspberry Pi Pico 1和2、STM32F4 Discovery、Teensy 4和4.1、nRF52840DK等电路板,选择非常丰富。在使用Zephyr之前,我为各种平台编写了自己的硬件抽象层(HAL)和基于YAML的外设配置,而这些现在都被Zephyr及其各种子系统和工具(主要是设备树)所取代。不过,我必须承认我并不喜欢C语言,因此我使用的大部分内容都封装在一个外部的C++库(zlibs)中,作为OpenDeck所依赖的west模块。该项目本身是用C++20编写的。目前我正在使用Zephyr 4.4及其MIDI 2.0驱动程序,处于MIDI 1兼容模式,同时还使用WebUSB进行固件更新,因此这是一个相当现代的技术栈。
注意:目前仅在桌面端有效。