我开始深入研究OpenClaw,然后发现了这个:<a href="https://clawhub.ai/steipete/trello" rel="nofollow">https://clawhub.ai/steipete/trello</a>。他们实际上在告诉人们,只要在环境变量中暴露凭据是可以的。
如果我们在构建AI,安全性必须成为产品原则,而不是事后考虑。AI使编码变得更加容易,但它也剥夺了你通常从经验丰富的导师和艰苦获得的生产经验中得到的保护措施。
因此,我们构建了Earl:一个为大型语言模型(LLM)代理提供安全的命令行界面(CLI)。Earl不直接给代理提供原始的shell和网络访问,而是强制执行基于模板的调用,将秘密存储在操作系统的钥匙串中,阻止SSRF/私有IP目标,支持出站白名单,并对Bash/JS/SQL执行进行沙箱处理。
它还作为MCP服务器运行,以便代理可以原生使用这些相同的控制。
开始使用:<a href="https://github.com/brwse/earl?tab=readme-ov-file#quick-start" rel="nofollow">https://github.com/brwse/earl?tab=readme-ov-file#quick-start</a>
返回首页
最新
我有一点电话焦虑,对打电话给餐馆、银行、医生等感到非常恐惧。我想:人工智能可以通过将网页表单转化为提示来解决这个问题。
最初,项目的构思很简单——使用11labs进行语音识别、Claude和Twilio,但实际上变得相当复杂(尽管我尽量采用了快速编码的方式)。
首先,快速找到电话号码是很困难的。这是通过使用一些基本的DuckDuckGo搜索和OpenAI调用进行网页抓取来实现的。
其次,收集正确的信息。我在这方面仍然有些挣扎,但架构是这样的:
A) 用户输入拨打电话的目标和商家名称
B) 如果检测到关键词,就启动默认表单类别之一
C) 如果没有,从GPT-4o-mini获取结构化的JSON并转化为React表单
每次拨打电话的成本失控,但幸运的是,Sonnet可以处理大部分电话,而我也愿意为Twilio付费。
这个为期一周的项目最终花了几个月的时间来完成,当然是因为各种原因。
目前仍在进行中,如果你有任何想法或遇到的问题,请随时给我发邮件:galcohavy@ucla.edu。
我开发了一个开源机器人,它可以将Trello卡片转化为可运行的代码,使用的是Claude Code。<p>将任务卡放入列表中 → Sergio会接手,探索你的代码库,并作为评论发布实施计划。你可以添加反馈,将卡片移回,进行迭代。当你满意时,将其移动到开发列表 → Sergio会创建一个工作树,编写代码,运行测试,并在GitHub上打开一个草稿PR。<p>这是一个可以被开发团队和产品经理使用的工具,旨在弥补非技术与技术规划之间的知识差距。<p>一切都通过拖动卡片触发。它基本上是Claude Code作为一个自主团队成员在一个每月5美元的虚拟机上运行,通过Trello进行协调。<p>这种双用户沙盒架构使得AI与秘密和凭证隔离(类似于OpenClaw在安全代理编码方面的做法)。<p>未来的路线图包括可插拔引擎支持(OpenCode、Codex)和MCP服务器,以便直接从卡片读取Google文档、Figma和Notion。
我创建 Paragent 是因为我在不同功能之间频繁切换。<p>这个想法是:用简单的英语描述你想要的功能,然后一个代理会分支出来,编写代码并打开一个拉取请求(PR)。你可以同时运行 10 个代理——每个代理在自己的分支上。<p>它的工作原理:
- 通过 GitHub 应用连接你的代码库(最小权限:内容 + PR)
- 描述一个功能(“在定价页面添加 Stripe 结账”)
- 代理进行规划、编写代码、运行验证并打开 PR
- 你像审查其他 PR 一样在 GitHub 上进行审查<p>你需要自带 API 密钥(OpenAI、Anthropic、Gemini)。我们负责协调,但从不存储你的代码或提示。<p>免费套餐:1 个代码库,2 个并发代理。
希望能听到任何尝试过 Cursor/Copilot 并希望有并行工作的功能的人的反馈。
我在构建人工智能代理时遇到了一个问题——它们总是忘记一切。每次对话都是从零开始。我希望能有一些功能:
- 自动从对话中提取事实(不仅仅是存储原始文本)
- 处理“用户从旧金山搬到纽约”而不同时保留两者为真的情况
- 按意义搜索,而不仅仅是关键词
- 对所有内容进行版本控制(谁在何时说了什么)
技术栈:
- TypeScript + Hono(快速,适合边缘计算)
- Convex(实时数据库 + 向量搜索)
- Gemini(嵌入 + 提取)
它的功能:
# 存储记忆
```bash
curl -X POST /v1/content -d '{"content": "用户喜欢徒步旅行,住在旧金山"}'
```
# 自然回忆
```bash
curl -X POST /v1/recall -d '{"query": "户外爱好"}'
```
# 返回:“用户喜欢徒步旅行”以及相关上下文
它处理那些无聊的事情——分块、嵌入、去重、矛盾检测、版本控制——这样你就可以专注于你的实际产品。
链接:
- GitHub: https://github.com/akhilponnada/aethene
- API 文档:仓库中的 OpenAPI 规范
这是我第一次公开发布任何东西。希望能得到反馈——还有什么缺失的?什么会让你真正使用这个?如果你想,可以批评我的代码,我能接受。
感谢阅读。
我已经使用 OpenClaw(AI 助手框架)一段时间了,非常喜欢它,因此我想将其推广到我的整个团队。问题是:让非工程师进行设置非常麻烦,而在团队中共享 API 密钥则带来了安全隐患。
因此,我构建了 ClawHuddle——一个自托管的平台,让您可以从一个单一的仪表板为团队配置和管理 OpenClaw 实例。
它的功能包括:
- 一键配置——管理员邀请用户,他们将获得自己的独立 OpenClaw 实例(每个实例在自己的 Docker 容器中运行)
- 管理技能——管理员为团队策划并预安装技能,确保每个人都能立即使用经过审核的工具
- 集中管理 API 密钥——团队成员无需各自拥有密钥。同时支持 Claude Code CLI 令牌登录
- 渠道设置——快速连接消息渠道(目前支持 Telegram,计划支持 Discord 和 LINE)
每个实例都是完全独立的——对话、文件和配置不会在用户之间泄露。
技术栈:Next.js 16、Fastify、SQLite、Docker、Traefik。使用 Turborepo 的单一代码库。
可以在 <a href="https://clawhuddle.com/" rel="nofollow">https://clawhuddle.com/</a> 观看实时演示(可能还有一些瑕疵,我们正在积极修复错误)。
开源项目:<a href="https://github.com/allen-hsu/clawhuddle" rel="nofollow">https://github.com/allen-hsu/clawhuddle</a>
希望这对您在团队环境中引入 OpenClaw 有所帮助。
您的AI代理在浏览网页时消耗的令牌是必要量的6倍。为了解决这个问题,我们开发了OpenBrowser MCP。
大多数浏览器MCP提供给大型语言模型(LLM)数十种工具:点击、滚动、输入、提取、导航。每次调用都会将整个页面的可访问性树转储到上下文窗口中。一页维基百科?超过124K的令牌。每一次调用都是如此。
OpenBrowser的工作方式不同。它只提供一个工具。您的代理编写Python代码,而OpenBrowser在一个持久的运行环境中执行这些代码,并提供完整的浏览器访问权限。代理控制返回的数据。没有冗余的页面转储,没有浪费的令牌。只有您的代理实际请求的数据。
结果如何?我们将其与Playwright MCP(微软)和Chrome DevTools MCP(谷歌)在6个实际任务中进行了基准测试:
- 比Playwright MCP少消耗3.2倍的令牌
- 比Chrome DevTools MCP少消耗6倍的令牌
- 响应负载小了144倍
- 在所有基准测试中任务成功率达到100%
一个工具。完全的浏览器控制。成本的一小部分。
它与任何兼容MCP的客户端兼容:
- Cursor
- VS Code
- Claude Code(带有MCP + Skills的市场插件)
- Codex和OpenCode(社区插件)
- n8n、Cline、Roo Code等
在这里安装插件:<a href="https://github.com/billy-enrizky/openbrowser-ai/tree/main/plugin" rel="nofollow">https://github.com/billy-enrizky/openbrowser-ai/tree/main/pl...</a>
它可以连接到任何LLM提供商:Claude、GPT 5.2、Gemini、DeepSeek、Groq、Ollama等。完全开源,遵循MIT许可证。
OpenBrowser MCP是更大构想的基础。我们正在构建一个云托管的通用代理平台,任何AI代理都可以在不管理基础设施的情况下浏览、互动和提取网络数据。完整平台即将推出。
请在openbrowser.me加入候补名单,以获得免费的早期访问权限。
查看演示:<a href="https://youtu.be/ov1rSYd42hE?si=pB6QgtQfm-CX1CEa" rel="nofollow">https://youtu.be/ov1rSYd42hE?si=pB6QgtQfm-CX1CEa</a>
查看完整的基准测试方法:<a href="https://docs.openbrowser.me/comparison" rel="nofollow">https://docs.openbrowser.me/comparison</a>
查看基准测试代码:<a href="https://github.com/billy-enrizky/openbrowser-ai/tree/main/benchmarks" rel="nofollow">https://github.com/billy-enrizky/openbrowser-ai/tree/main/be...</a>
浏览源代码:<a href="https://github.com/billy-enrizky/openbrowser-ai" rel="nofollow">https://github.com/billy-enrizky/openbrowser-ai</a>
LinkedIn帖子:
<a href="https://www.linkedin.com/posts/enrizky-brillian_opensource-ai-mcp-activity-7431080680710828032-iOtJ?utm_source=share&utm_medium=member_desktop&rcm=ACoAACS0akkBL4FaLYECx8k9HbEVr3lt50JrFNU" rel="nofollow">https://www.linkedin.com/posts/enrizky-brillian_opensource-a...</a>
#开源 #人工智能 #MCP #浏览器自动化 #AI代理 #开发工具 #LLM #通用人工智能 #代理智能
寻找一些制作精良且引人入胜的推荐。
我搭建了一个平台,您可以在上面配置自己的技术指标,并将交易信号直接发送到Telegram——无需编码。
希望获得反馈:哪些功能有效,哪些功能缺失,您希望添加什么?
我最近经常使用Claude Code,并希望能够监控与安全相关的执行情况——这种情况在代理运行时可能并不容易察觉。
CanaryAI是一款macOS菜单栏应用,能够监控Claude Code的会话日志,并对可疑行为发出警报,包括反向Shell、凭证文件访问、LaunchAgent/cron持久性、下载并执行模式、Shell配置文件修改。它解析Claude Code本地写入的JSON日志——不进行拦截,也不使用代理。该应用仅提供警报功能,绝不会阻止代理的运行。
所有处理都是本地进行的。检测规则采用YAML格式,可以进行扩展。
> [https://github.com/jx887/homebrew-canaryai](https://github.com/jx887/homebrew-canaryai)
如果您有任何问题,请随时告诉我。