嘿,HN——经过一年的研究代理人工智能的脆弱性,我构建了QCMP:一个四层架构,旨在防止内存中毒。MCP的服务器数量达到16K,但像MINJA(98.2%的查询成功率)和AgentPoison(从0.1%的毒素中获得80%以上的后门)这样的攻击暴露了核心缺陷——内存过于信任自己。
QCMP借鉴了IIT意识度量(CCI > 0.90以冻结片段)、后量子校验和(ML-KEM-768)、CTC自一致性(NIS > 0.95)以及螳螂虾风格的稀疏检查(<50毫秒TME)。已准备好符合OWASP/EU AI法案,并提供Rust实现的建议。
PDF(浏览器查看):[https://github.com/bradmcevilly/qcmp-whitepaper/blob/main/QCMP_Whitepaper_arXiv.pdf](https://github.com/bradmcevilly/qcmp-whitepaper/blob/main/QCMP_Whitepaper_arXiv.pdf)
首次向arXiv提交至cs.AI——寻求支持(4个以上的近期订阅)。对量子生物钩子或群体层的反馈如何?欢迎讨论。
deepsweep.ai | linkedin.com/in/bradmcevilly
我在过去一年中专注于解决代理人工智能中的内存中毒问题(例如,仅通过查询就实现98%的MINJA成功率)。介绍QCMP:一个结合IIT意识度量(CCI > 0.90阈值)、后量子校验和(ML-KEM)和CTC一致性的四层架构,以实现防篡改的代理群体。
主要成果:在<50毫秒内检测到0.1%的AgentPoison后门;符合OWASP/EU AI法案。
PDF:[https://github.com/bradmcevilly/qcmp-whitepaper/blob/main/QCMP_Whitepaper_arXiv.pdf](https://github.com/bradmcevilly/qcmp-whitepaper/blob/main/QCMP_Whitepaper_arXiv.pdf)
首次向arXiv提交至cs.AI——寻求HN社区的支持/反馈。对量子生物钩子或多代理层的看法如何?欢迎交流。
网站:deepsweep.ai | LinkedIn:linkedin.com/in/bradmcevilly
返回首页
最新
大家好!我们是 BrowserBook 的 Chris、Jorrie 和 Evan,这是一个用于编写和调试基于 Playwright 的网页自动化的集成开发环境(IDE)。您可以在这里下载 Mac 应用程序:<a href="https://browserbook.com">https://browserbook.com</a>,还有一个演示视频可以在这里观看:<a href="https://www.youtube.com/watch?v=ODGJBCNqGUI" rel="nofollow">https://www.youtube.com/watch?v=ODGJBCNqGUI</a>。
<p>我们为什么要开发这个工具:在我们参加 YC 的时候,我们是一家自动化后端医疗工作流程的公司。由于医疗行业的互操作性生态系统非常分散,我们开始使用浏览器代理直接通过网络自动化电子病历、诊所管理软件和支付门户。当我们这样做时,遇到了很多问题:
<p>速度:与脚本方法相比,LLM 调用的高延迟。
<p>成本:为了使自动化尽可能准确,我们消耗了大量的令牌来提供所需的上下文。
<p>可靠性:即使有详细的指示、上下文和工具,代理在多步骤任务中往往会以不可预测的方式偏离。
<p>可调试性:当出现偏差时,我们基本上是在提示中玩打地鼠,并重新运行整个自动化来调试问题(如上所述:速度和成本问题使得这一过程相当痛苦)。
<p>我们越来越多地只是给我们的代理脚本来执行。最终,我们得出结论,对于这类用例,脚本化是一种更好的网页自动化方法。但脚本化也太痛苦了,因此我们着手用 BrowserBook 来解决这些问题。
<p>在技术层面上,它运行一个独立的 TypeScript REPL,直接与内嵌的浏览器实例连接,并内置工具,使脚本开发快速而简单。这包括:
<p>- 在 IDE 中直接提供一个完全交互的浏览器窗口,您可以在不切换上下文的情况下运行代码。
<p>- 类似 Jupyter Notebook 的环境——这里的想法是,您可以在单独的单元中编写自动化的部分并单独运行它们(并可以在浏览器中快速手动重置),而不必每次都重新运行整个流程。
<p>- 一个 AI 编码助手,利用当前页面的 DOM 上下文来编写自动化逻辑,帮助避免寻找选择器的麻烦。
<p>- 用于截图、数据提取和管理身份验证的辅助函数,适用于需要身份验证的工作流程。
<p>一旦您创建了自动化,可以直接在应用程序中运行它,或者通过 API 在我们的托管环境中运行,以便在外部应用程序或代理工作流程中使用。
<p>BrowserBook 的核心是一个 Electron 应用,因此我们可以直接在应用中运行 Chrome 实例,而无需依赖云托管的浏览器。对于 API 运行,我们通过 Kernel 使用托管的浏览器基础设施(顺便说一下,这是一个很棒的产品),依赖于他们的反机器人检测能力(隐身模式、代理等)。
<p>脚本化自动化可能不受欢迎,因为脚本本质上是脆弱的;与“传统”软件开发不同,您的代码是在您无法控制的环境中部署的——别人的网站。通过 BrowserBook,我们试图“接受这种不完美”,并承认这种“进攻性编程”的环境。
<p>我们从头开始设计,假设脚本会出错,并旨在提供使构建和维护它们更容易的工具。未来,我们的计划是利用 AI 在其已经显示出优势的领域——编写代码——来最小化停机时间,并在部署环境变化时快速修复损坏的脚本。
<p>浏览器代理承诺通过将控制权交给可以处理不一致性和模糊性的 LLM 来解决这个问题。虽然我们认为在某些应用中浏览器代理确实可以提供帮助,但需要可靠和重复执行的任务并不在其中。
<p>我们希望您能试用一下!您可以在我们的网站上下载 BrowserBook:<a href="https://browserbook.com">https://browserbook.com</a>(目前仅支持 Mac,抱歉!)当然,我们也非常欢迎您提供任何反馈和意见!
我是这个项目的发起人。
我创建这个库是出于对日常数据混乱的沮丧:CSV文件中有重复的列、API返回嵌套的JSON、Excel表格,以及各种临时的ETL请求。
像Polars和DuckDB这样的工具非常适合处理重型分析工作负载,但有时我只想要一个轻量级的、符合Python风格的表格,方便我进行迭代。我希望能够使用`for row in table:`而不会遇到意外的语义问题。
Serif采用了以向量为先、零依赖的方式,旨在处理日常数据任务。
<a href="https://github.com/CIG-GitHub/serif" rel="nofollow">https://github.com/CIG-GitHub/serif</a>
这是一个早期版本,因此我希望能得到关于易用性和API中缺失功能或可以简化的地方的反馈。
自2023年1月以来,iOS真实设备支持一直是Maestro用户最迫切的需求。近三年来,GitHub上有大量问题和评论在请求这一功能。
我们在工作中需要这个功能,因此我们开发了它并提交了PR #2856。但Maestro团队表示,官方支持要到明年才能推出——没有明确的时间表。
我们不希望团队们再等待,因此我们打包了一个独立工具,今天就可以使用。
工作原理:
- maestro-ios-device会将XCTest运行器构建并部署到你的真实iPhone上。
- 端口转发将localhost:6001桥接到设备:22087。
- 你现有的Maestro YAML文件无需更改即可运行。
额外功能:我们还解锁了在多个真实设备上并行执行的能力。Maestro之前有硬编码的端口限制——现在你可以在设备1上使用:6001,在设备2上使用:6002同时运行。
限制(苹果限制):
- clearState通过重新安装应用程序工作(而不是simctl)。
- setLocation需要额外的设置。
- 不支持addMedia。
安装:
```bash
curl -fsSL https://raw.githubusercontent.com/devicelab-dev/maestro-ios-device/main/setup.sh | bash
```
仓库: [https://github.com/devicelab-dev/maestro-ios-device](https://github.com/devicelab-dev/maestro-ios-device)
PR: [https://github.com/mobile-dev-inc/Maestro/pull/2856](https://github.com/mobile-dev-inc/Maestro/pull/2856)
在iOS 18.x和26.x上与Maestro 2.0.9/2.0.10进行了测试。
这不是官方版本——当Maestro推出原生支持时,请使用官方版本。欢迎就实现细节提问。
我开发这个工具是因为我厌倦了手动格式化Windows和重新安装所有东西。
我个人的bash + winget脚本虽然有效,但对其他人来说并不具备可重用性。
因此,我将其转变为一个完全基于网页的生成器:
无需终端,无需Node,无需安装——只需选择你的应用程序和配置,它就会输出一个可以直接运行的.bat脚本。
该项目现在是开源的,并且最近进行了重大更新:
115个应用程序
80个系统配置
去除臃肿软件
受Windows 98启发的用户界面
一键脚本生成
一切都在你的浏览器中本地运行
在线版本:<a href="https://kaic.me/win-post-install/" rel="nofollow">https://kaic.me/win-post-install/</a>
GitHub:<a href="https://github.com/kaic/win-post-install" rel="nofollow">https://github.com/kaic/win-post-install</a>
我不确定是否只有我一个人遇到了自大约六个月以来Mac的预览和文件权限方面的严重问题。您自己在同一台机器上创建的文件开始出现权限问题。这种情况也发生在Mac自家的Pages应用上。尽管确保文件对所有人都有完全的编辑权限,Mac的软件仍然随机生成文件权限错误。我希望尽管存在这些烦人的文件权限问题,Mac在用户友好性方面的声誉能够长久保持。
我们正处于平衡对我们的产品、投资者关系、收入以及大量预测等方面有意义的指标的早期阶段。<p>在早期阶段,您内部跟踪了哪些数据点,这些数据点对您的增长至关重要?无论是为融资还是推动收入。<p>我会很感激您基于实际经验提供的任何建议。
嗨,HN!<p>这款键盘类似于 corne (v4) [0],但物理布局则采用了 fifi [1] 的设计。<p>电路板(PCB)可以通过 JLCPCB 订购,并且可以选择组件的 PCB 组装:无需自己焊接任何东西!(除非你想使用编码器) 有关更多信息,请查看仓库中的订购指南 [2]。<p>主要特点:<p>- 36/40 键<p>- 支持编码器<p>- 内嵌 RP2040 控制器<p>- USB-C 连接两半<p>- PCB 组装:无需焊接(除非使用编码器)<p>这块 PCB 是由一位 Fiverr 承包商制作的(我自己不会做,他们的个人资料在这里 [3]),外壳则是我自己制作的。<p>如果 README 或文档中有任何遗漏,请随时告诉我。<p>[0] <a href="https://github.com/foostan/crkbd" rel="nofollow">https://github.com/foostan/crkbd</a><p>[1] <a href="https://github.com/raychengy/fifi_split_keeb" rel="nofollow">https://github.com/raychengy/fifi_split_keeb</a><p>[2] <a href="https://github.com/v3lmx/cornifi/blob/main/docs/pcb_ordering_guide.md" rel="nofollow">https://github.com/v3lmx/cornifi/blob/main/docs/pcb_ordering...</a><p>[3] <a href="https://www.fiverr.com/circuitwork32" rel="nofollow">https://www.fiverr.com/circuitwork32</a>