返回首页
最新
嗨,HN,
我开发了epstein-search,这是一个开源的Python命令行工具和库,用于对公开发布的爱泼斯坦文件(解密的法庭文件、证词、FBI报告和航班记录)进行语义搜索和RAG(检索增强生成)。
我希望能够轻松浏览这些数千页的非结构化法律PDF,而不依赖于付费的第三方服务或将数据来回发送到云提供商。
它的工作原理如下:
运行epstein-search setup会下载约10万个预计算的文档片段和嵌入(使用all-MiniLM-L6-v2),这些都是基于公共的2万份文档语料库。
它将这些导入到zvec(一个本地向量数据库)中,因此索引大约在一分钟内准备就绪。
标准搜索(epstein-search search)会使用sentence-transformers在本地嵌入你的查询,并进行向量相似性搜索。这个步骤是100%离线的,不需要API密钥。
对于对话式RAG模式(epstein-search chat或ask),它使用LiteLLM。你可以将其指向Ollama或LM Studio实例,以实现完全免费的本地和私密的管道,或者接入像Anthropic、OpenAI或Gemini这样的云提供商。
你还可以通过文档类型过滤查询(例如,--doc-type flight_log或--source "FBI"),并将原始源上下文与生成的答案一起输出,以验证LLM的声明。
该数据集严格来源于公共领域发布的资料(美国司法部、众议院监督委员会、解密的联邦法院文件)。
代码库链接:<a href="https://github.com/simulationship/epstein-search" rel="nofollow">https://github.com/simulationship/epstein-search</a>
我很想听听你的想法、对代码的反馈,或者任何改善本地RAG管道的建议!欢迎随时提问。
嗨,HN!<p>我对在会议室或家庭办公室布线所需的长USB电缆和管道感到非常不满。此外,似乎macOS上可用的无线网络摄像头选择也不多。而且,网络摄像头的价格远高于同类的IP摄像头,后者现在基本上已经成为商品产品。<p>所以我在周末开发了LemurCam(网站:lemur.cam)。它运行得非常好!延迟极小,您可以使用任何现成的摄像头。我正在使用一款TP-Link Tapo,价格大约20欧元。为了实现这一点,我不得不构建一些开源技术,相关信息也在仓库的README文件中。总体来说,这对我来说效果很好,消除了USB布线的需求。<p>我希望它对您也有效!这是免费的,请试试看,并告诉我您的体验如何!
只需选择发送或拦截。
大多数浏览器自动化工具(如 Playwright MCP 等)创建一个由代理拥有的浏览器进程。而 chromectl 则颠覆了这一点:你启动一个命名的会话,代理连接到这个会话。该会话是隔离的——没有 cookies,没有保存的登录信息,代理无法进入你的银行标签页。
这也解锁了人工交接的功能。你可以启动一个会话,导航到一个网站,手动登录,然后将控制权交回给 Claude。这对于任何需要身份验证但不想自动化凭据的情况非常有用。
每个会话都有一个专用的 Chrome 配置文件。停止会话,明天再启动,你仍然保持登录状态。
Claude Desktop 也可以驱动 Chrome,但它需要一个插件,并且在你的主浏览器配置文件内工作——无法将其限制在一个干净的会话中。
Cloudflare 和 Anthropic 都写过关于为什么代理通过代码工作得比通过工具定义更好的原因——MCP 将每个工具的描述预加载到上下文中,无论是否使用。命令行界面(CLI)则更加轻量:给 Claude 一个终端和 `--help`,它就能搞定剩下的事情。没有工具架构,没有上下文膨胀。
像导航、评估、截图和抓取等标准功能都在其中,还有 `pick`——点击实时页面上的任何元素,返回其选择器、HTML 和计算样式的 JSON 格式。粘贴到 Claude 中并说“修复这个”。
分享此内容以防有用——想知道其他人是如何处理代理的浏览器问题的。
---
来源:
- Cloudflare 代码模式: [https://blog.cloudflare.com/code-mode-mcp/](https://blog.cloudflare.com/code-mode-mcp/)
- Anthropic 关于 MCP 的代码执行: [https://www.anthropic.com/engineering/code-execution-with-mcp](https://www.anthropic.com/engineering/code-execution-with-mcp)
构建这个工具是因为将完整的工具目录加载到编码代理中会浪费上下文,而手动选择工具则令人烦恼。
<p><pre><code>SkillMesh 流程如下:
1) 安装角色包
2) 根据提示路由前k个工具/卡片
示例:
skillmesh roles list
skillmesh Data-Analyst install
skillmesh emit --provider codex --query "构建一个带有治理的KPI仪表板" --top-k 5
我进行了一个10任务的基准测试(BI/ML/DevOps):
- 所有卡片基线:平均提示令牌5567.5, 中位延迟0.768秒
- 路由完整目录(top-k=5):1485.3令牌(减少73.3%),0.766秒
- 角色+路由(top-k=5):1457.7令牌(减少73.8%),0.171秒,top-1角色匹配率9/10
仓库链接:https://github.com/varunreddy/SkillMesh
希望能收到关于失败案例的反馈:
- 选择了错误的角色
- 跨域提示
- MCP安装/列表用户体验</code></pre>