1作者: quocanh34大约 1 个月前原帖
背景简介:我拥有数学和计算机科学学位,并且在计算机视觉、语音和扩散模型方面有大约两年的经验(主要侧重于工程方面)。我现在希望更多地转向机器人领域,并且对制定学习路线图非常感兴趣。我想深入了解软件和人工智能方面的内容,特别是像视觉-语言-动作(VLA)模型这样的主题。有没有人能给我一些建议或推荐一个适合我这种背景、相对新手的机器人领域学习路线图?非常感谢任何指点!
4作者: andersmyrmel大约 1 个月前原帖
我一直觉得从网站上复制粘贴内容到ChatGPT非常烦人,基本上希望Cursor的CMD+K能在任何地方都能使用。<p>于是我开发了一个小的Chrome扩展程序,名为InPageAI,旨在实现这个功能:<a href="https://inpageai.com" rel="nofollow">https://inpageai.com</a><p>在任何页面上按下快捷键,它会自动抓取上下文,然后你可以让AI进行总结、解释等。你还可以直接在输入框/文本框中使用它进行写作。<p>虽然现在还处于早期阶段,但你可以试试吗?我很想听听你的想法,或者如果你发现它在哪些地方出现问题!
1作者: mercurialsolo大约 1 个月前原帖
刚刚发布了我们的计划静态分析工具——plan-linter,这是一个小型的静态分析工具,可以在AI代理计划运行之前捕捉到“明显愚蠢”的错误。 <p>GitHub 仓库 -> <a href="https://github.com/cirbuk/plan-lint">https://github.com/cirbuk/plan-lint</a></p> <p>还可以阅读关于如何使用四步安全堆栈(“没有安全词”)来处理安全问题的文章 → <a href="https://mercurialsolo.substack.com/p/no-safe-words" rel="nofollow">https://mercurialsolo.substack.com/p/no-safe-words</a></p> <p>为什么?</p> <p>代理现在生成机器可读的 JSON/DSL 计划。大多数生产事故(循环、特权激增、原始机密)都可以通过离线扫描这些计划来捕捉,但大家都专注于运行时的防护措施。</p> <p>它的功能:</p> * 模式 + 策略验证(JSONSchema / YAML / OPA) * 数据流 + 敏感信息和个人身份信息(PII)的污点检查 * 循环检测(图循环) * 风险评分 0-1,失败阈值可配置 * 通过入口点的插件规则 <p>对于100步的计划,运行时间小于50毫秒,零令牌成本。</p> <p>在生产环境中部署具有工具访问权限的代理时,您是如何处理安全问题(预算超支、令牌泄漏)的?</p>
2作者: gfai大约 1 个月前原帖
我之前的帖子标题没有“Show HN”前缀,所以在这里重新发布一下。<p>整个技术栈都是使用人工智能构建的,从基础设施管道、后端API、前端到AI聊天服务器。<p>下一步:构建一个代理,以通过以下方式提升用户体验: - 测试与AI角色的聊天 - 分析体验 - 改进角色的系统提示 - 然后重复这个过程