返回首页
24小时热榜
解锁内容:<a href="https://www.nytimes.com/2026/05/11/us/politics/google-hackers-attack-ai.html?unlocked_article_code=1.hlA.vW7Y.pO_0G8yLYoca&smid=nytcore-android-share" rel="nofollow">https://www.nytimes.com/2026/05/11/us/politics/google-hacker...</a>,<a href="https://archive.ph/I4Ui5" rel="nofollow">https://archive.ph/I4Ui5</a><p><a href="https://apnews.com/article/google-ai-cybersecurity-exploitation-mythos-926aea7f7dc5e0e61adce3273c55c6d4" rel="nofollow">https://apnews.com/article/google-ai-cybersecurity-exploitat...</a><p><a href="https://www.cnbc.com/2026/05/11/google-thwarts-effort-hacker-group-use-ai-mass-exploitation-event.html" rel="nofollow">https://www.cnbc.com/2026/05/11/google-thwarts-effort-hacker...</a>
我开发了adamsreview,这是一个Claude Code插件,能够通过并行子代理、多阶段的PR审查、验证过程、持久的JSON状态以及通过Codex CLI和PR机器人评论进行可选的集成审查,来实现更深入的审查。
在我自己的PR中,它捕捉到的真实错误显著多于Claude内置的/review、/ultrareview、CodeRabbit、Greptile和Codex的内置审查,同时产生的误报更少。
adamsreview包含六个作为插件打包的Claude Code斜杠命令:review、codex-review、add、promote、walkthrough和fix。我是以内置的/review命令为模型,并进行了有意义的扩展。
您可以在审查阶段之间清除上下文,因为状态存储在磁盘上的JSON文档中,并且有内置脚本用于保持其更新。
walkthrough命令利用Claude的AskUserQuestion功能,逐一引导您处理不确定的发现或需要人工审查的项目。然后,fix命令会调度每个修复组的代理,并使用Opus重新审查工作,在提交最终结果之前恢复任何回归。
它与您的常规Claude Code订阅一起运行(推荐使用Max计划),而不同于收取额外使用费用的/ultrareview。
我非常希望听到Claude Code用户、专业开发者以及对AI代码审查有强烈看法的人的反馈。
仓库链接:<a href="https://github.com/adamjgmiller/adamsreview" rel="nofollow">https://github.com/adamjgmiller/adamsreview</a>
安装方法:
/plugin marketplace add adamjgmiller/adamsreview, /plugin install adamsreview@adamsreview
你好,HN!<p>如果你想将你的智能代理连接到数据库(比如,构建一个数据分析聊天机器人或任何类型的智能应用),今天你有两个选择:SQL MCP 服务器或语义层。<p>SQL MCP 是最简单的设置路径,特别是如果你还有一个 .md 知识库,代理可以对其进行更新。不过,这种方式很快就会变得混乱,尤其是在交互较多或数据库较大的情况下。如果你想理解数字的来源,生成的 SQL 很难审查,而相关查询也可能难以对齐和比较。<p>自然的替代方案是语义层,它是可用/有用数据(数据模型)的清单,以及使用结构化 DSL 查询这些数据的接口——通常是一个度量、维度、过滤器的列表,连接等操作在后台处理。<p>当我们在 Motley 需要一个语义层来连接客户数据时,我们首先选择了 Cube,并为多租户定制了连接,并实时更新模型。我们很快遇到了一些限制,这让我们意识到现有的语义层并不适合这个目的:它们仍然是商业智能(BI)领域的一部分,旨在为基本静态的人为策划仪表板提供高效的后端,而智能代理需要在寻找答案的过程中不断迭代和学习。于是我们构建了 SLayer 的第一个版本,现在已经开源。<p>使用 SLayer MCP 或 CLI,代理(和人类)可以:<p>- 探索模型,运行查询,连接多个数据库<p>- 编辑列/度量或创建新的<p>- 从 SQL 或其他模型的查询创建自定义模型<p>- 从交互中学习:保存和检索与模型、列或查询相关的自然语言记忆,以形成知识库<p>代理不断发展语义层,重用过去交互的结果,并在未来减少错误。<p>还有一些其他功能:<p>- 从检查你的数据库架构自动创建模型,以便快速启动<p>- 可嵌入性——不需要运行服务器<p>- 提供 Python 客户端以使用数据框进行数据分析<p>- 检测和处理模式漂移<p>- 表达性 DSL,具有紧凑、自然的表示方式,支持任意深度的多阶段查询、自定义聚合、时间偏移、结合来自多个模型的度量,以及其他在原始 SQL 中难以实现的功能<p>在路线图上:访问控制、缓存等更多功能。<p>代码库: <a href="https://github.com/MotleyAI/slayer" rel="nofollow">https://github.com/MotleyAI/slayer</a><p>文档: <a href="https://motley-slayer.readthedocs.io/en/latest/" rel="nofollow">https://motley-slayer.readthedocs.io/en/latest/</a>
你是如何判断一个模型是否足够好以完成特定任务的?目前我在规划和较复杂的任务中使用Opus,而在更明确的任务中则切换到Sonnet。但我觉得Sonnet有点笨,无法理解更大的上下文,导致了一些问题。有没有什么明确的方法来判断一个模型是否适合某个任务?还是说这全凭感觉?