返回首页
最新
背景简介:我拥有数学和计算机科学学位,并且在计算机视觉、语音和扩散模型方面有大约两年的经验(主要侧重于工程方面)。我现在希望更多地转向机器人领域,并且对制定学习路线图非常感兴趣。我想深入了解软件和人工智能方面的内容,特别是像视觉-语言-动作(VLA)模型这样的主题。有没有人能给我一些建议或推荐一个适合我这种背景、相对新手的机器人领域学习路线图?非常感谢任何指点!
我一直觉得从网站上复制粘贴内容到ChatGPT非常烦人,基本上希望Cursor的CMD+K能在任何地方都能使用。<p>于是我开发了一个小的Chrome扩展程序,名为InPageAI,旨在实现这个功能:<a href="https://inpageai.com" rel="nofollow">https://inpageai.com</a><p>在任何页面上按下快捷键,它会自动抓取上下文,然后你可以让AI进行总结、解释等。你还可以直接在输入框/文本框中使用它进行写作。<p>虽然现在还处于早期阶段,但你可以试试吗?我很想听听你的想法,或者如果你发现它在哪些地方出现问题!
大家好!我个人已经使用这个技术栈一段时间了,决定通过将其转化为一个可以重复使用的模板来进行一些自动化。希望其他人也能觉得它有用!
刚刚发布了我们的计划静态分析工具——plan-linter,这是一个小型的静态分析工具,可以在AI代理计划运行之前捕捉到“明显愚蠢”的错误。
<p>GitHub 仓库 -> <a href="https://github.com/cirbuk/plan-lint">https://github.com/cirbuk/plan-lint</a></p>
<p>还可以阅读关于如何使用四步安全堆栈(“没有安全词”)来处理安全问题的文章 → <a href="https://mercurialsolo.substack.com/p/no-safe-words" rel="nofollow">https://mercurialsolo.substack.com/p/no-safe-words</a></p>
<p>为什么?</p>
<p>代理现在生成机器可读的 JSON/DSL 计划。大多数生产事故(循环、特权激增、原始机密)都可以通过离线扫描这些计划来捕捉,但大家都专注于运行时的防护措施。</p>
<p>它的功能:</p>
* 模式 + 策略验证(JSONSchema / YAML / OPA)
* 数据流 + 敏感信息和个人身份信息(PII)的污点检查
* 循环检测(图循环)
* 风险评分 0-1,失败阈值可配置
* 通过入口点的插件规则
<p>对于100步的计划,运行时间小于50毫秒,零令牌成本。</p>
<p>在生产环境中部署具有工具访问权限的代理时,您是如何处理安全问题(预算超支、令牌泄漏)的?</p>
我之前的帖子标题没有“Show HN”前缀,所以在这里重新发布一下。<p>整个技术栈都是使用人工智能构建的,从基础设施管道、后端API、前端到AI聊天服务器。<p>下一步:构建一个代理,以通过以下方式提升用户体验:
- 测试与AI角色的聊天
- 分析体验
- 改进角色的系统提示
- 然后重复这个过程