返回首页
最新
Claude Code 在会话之间忘记所有内容。经过几个月的频繁使用,我在 ~/.claude/projects/ 下积累了 1.6GB 的 JSONL 会话文件。这些文件中包含了架构决策、调试突破和我再也找不到的解决方案。没有什么比重复解决同一个问题更让人烦恼的了。
我尝试过 RAG 管道和本地向量数据库,但它们为一个实际上只是对结构化文件进行文本搜索的问题增加了复杂性。因此,我构建了 search-sessions:一个单一的 Rust 二进制文件,可以直接搜索你的会话历史。没有数据库,没有索引步骤,没有依赖。
它支持两种模式:索引搜索(约 18 毫秒)用于查找正确的会话,以及深度搜索(使用 ripgrep 约 280 毫秒,不使用时约 1 秒)用于匹配完整的消息内容。每个结果都包括会话 UUID,以便你可以使用 `claude --resume` 恢复任何对话。
使其有效的设计选择是:完全跳过数据库。JSONL 文件本身已经是结构化的——只需快速搜索即可。在底层,它只是文件和一个命令行界面,因此易于检查、备份和删除。你可以将其安装为 Claude Code 的技能,然后问“你还记得那个身份验证重构吗?”Claude 会搜索你的历史并接上话题。它也可以与 OpenClaw 一起使用。
采用 MIT 许可证。支持 macOS 和 Linux:
```bash
brew install sinzin91/tap/search-sessions
```
或
```bash
cargo install search-sessions
```
我很好奇人们对默认情况下精确搜索、模糊搜索和语义搜索的看法,以及你希望支持的其他编码命令行工具。
嘿,HN,
我们大多数人希望在日常使用的机器上本地运行像 OpenClaw 这样的自主代理。我们希望它们能够真正与我们的文件、IDE 以及实际的本地工作流程进行交互。
但现在这样做面临着巨大的安全隐患。一个出现幻觉(或被劫持)的代理拥有原始系统访问权限,基本上就等于在本地执行远程代码,随时可能擦除目录或泄露 SSH 密钥。
目前的解决方案都很糟糕:
硬件隔离:购买一台专用的 Mac Mini 或一台便宜的二手笔记本,仅仅是为了安全地运行代理。
云服务:启动一个 VPS,这样会增加令人烦恼的延迟,花费金钱,并完全消灭“本地优先”的优势。
容器:将代理放入 Docker 容器中。这种方式笨重,并且完全削弱了代理的功能,因为它无法再看到或与您实际工作所在的主机操作系统进行交互。
我受够了,于是构建了 Raypher。
Raypher 是一种专为 AI 代理设计的裸金属安全架构。它允许您直接在主机上运行代理,同时保持对其的加密控制。
Alpha 的工作原理如下:
零接触拦截:您无需重写 Python/Node 代理脚本。Raypher 目前使用透明的系统代理注入(Windows 上的 netsh portproxy)自动捕获所有代理流量。
硬件身份:我们将代理的会话通过加密绑定到您的物理 TPM 2.0 芯片。
策略引擎:每个请求都根据严格的预算、域和时间限制策略进行评估。如果它试图连接到一个奇怪的域,它会被阻止。它还运行本地数据丢失防护(DLP),自动屏蔽 API 密钥或任何您自定义的敏感信息,以便在它们进入流之前进行处理。
我们将以一个单一脚本的形式发布该项目,该脚本设置拦截并启动一个本地指挥中心仪表板,以便您实时监控代理的安全状态。
(透明性说明:重型内核级 eBPF/WFP 钩子目前正在开发中,但这个代理 MVP 证明了硬件绑定的策略引擎确实有效)。
请加入候补名单,访问 raypherlabs.tech,成为首批获知我们发布消息的人。
大家好,我开发了 babyshark,这是一个针对 PCAP 文件的终端用户界面,旨在帮助那些觉得 Wireshark 功能强大但又感到困惑的人。
我们的目标是“让 PCAP 更加人性化”:
概览仪表盘可以回答当前发生了什么以及接下来该点击什么。
域名视图(优先显示主机名)→ 选择一个域名 → 直接跳转到相关的数据流(即使在 DNS 被加密或缓存的情况下,也可以通过观察到的 IP 地址进行分析)。
奇怪的内容视图可以显示常见的故障和延迟信号(如重传、乱序提示、重置、握手问题以及可见的 DNS 失败)。
从这里你可以深入分析:数据流 → 数据包 → 解释(简单易懂的提示)/ 跟踪流。
命令:
离线模式:babyshark --pcap capture.pcap
实时模式(需要 tshark):babyshark --list-ifaces 然后 babyshark --live en0
代码库及 v0.1.0 版本发布链接: [https://github.com/vignesh07/babyshark](https://github.com/vignesh07/babyshark)
期待大家对用户体验的反馈,以及你们希望下一个“奇怪检测器”是什么。
我在苹果备忘录中有2600多条笔记,几乎找不到任何东西。<p>我的孩子把所有东西都扔进了Telegram的保存消息里。我正在进行一项小型研究,想了解人们实际使用的系统(而不是他们希望使用的)。<p>你有一个有效的整理方式吗,还是像我一样,所有内容都散落在五个应用程序中?
“我想洗我的车。洗车场在50米外。我应该走路还是开车?”这个问题作为一个简单的人工智能逻辑测试在网络上广泛传播,因此我想看看它在不同模型中的表现如何。我测试了53个模型(包括领先的开源、开放权重和专有模型),没有系统提示,强制选择开车或走路,并提供了推理字段。
在一次测试中,只有53个模型中的11个答对了(42个选择了走路)。但一次测试并不能证明太多,所以我对每个模型进行了10次重复测试。使用相同的提示,没有缓存,干净的状态。
结果变得更糟。在11个通过第一次测试的模型中,只有5个能够持续正确回答。GPT-5的表现为7/10。GPT-5.1、GPT-5.2、Claude Sonnet 4.5,以及所有Llama和Mistral模型在10次测试中均得分为0/10。
人们一直说人类也会在这个问题上失败,因此我通过Rapidata获取了人类基线数据(10000人,使用相同的强制选择):71.5%的人选择了开车。大多数模型的表现低于这个水平。
所有的推理轨迹(通过我的初创公司Opper进行测试)、完整的模型分析、人类基线数据和原始JSON文件都在报告中,供任何想深入研究或进行自己分析的人使用。
我一直在通过Claude Code和Copilot CLI并行运行多个AI编码代理,我认为一旦超过3个并发任务,终端标签就变得难以管理。
因此,我构建了AIOffice——一个像素艺术风格的虚拟办公室,每个代理都坐在自己的桌子旁。你作为老板可以在办公室里走动,分配工作,并一目了然地查看每个人的状态。当你需要与某个代理互动时,可以走过去与他们聊天。
它的工作原理:
- 每个代理都是在你的机器上以PTY运行的真实CLI进程
- 服务器监视JSONL输出,通过WebSocket桥接消息
- Phaser将其渲染为一个具有空间感的像素艺术办公室
- 你可以使用代理的原生CLI接口与他们聊天
这种空间隐喻出乎意料地有用——你自然会记住“鲍勃在窗边的桌子上工作,正在处理API”,而不是“那个Claude实例在哪个标签页?”
它在你的机器上运行,并使用你的CLI工具。
使用TypeScript、Phaser 3、node-pty和WebSockets构建。
代码库: [https://github.com/ChristianFJung/AIOffice](https://github.com/ChristianFJung/AIOffice)
YC 最近发布了一段关于代理经济的视频——这个概念认为代理正在成为自主的经济参与者,能够在没有人类输入的情况下选择工具和服务。
这让我思考:如何真正优化代理的发现?对于人类来说,可以通过搜索引擎优化(SEO)、文案写作和口碑传播来实现。但代理只是根据上下文查看可用工具,并根据描述、架构和示例选择一个。
有没有人对此进行过实验?更好的文档是否能显著增加代理调用你工具的频率?你工具描述的措辞在不同模型(如 ZLM、Claude 和 Gemini)之间是否有影响?