返回首页
最新
快速概述一下,因为帖子内容较长:我在OpenAI从2017年到2020年进行机器人操作研究,当时的桌面设置成本大约是现在的10倍,并且需要一个团队来运行。这个项目是我在测试一个人是否能够在同类问题上进行有意义的工作:从物理和软件设置开始。
我有几个决策尚未确定,非常希望能得到一些反对意见或反馈:
- 单臂与双臂(我选择了单臂是出于成本和空间考虑,虽然这排除了像折叠布料这样的任务)
- 目前不校准相机的外部参数和内部参数
- 从零开始的策略选择RGB与RGB-D(ACT / Diffusion Policy)
还有一个我更有信心但预计会有分歧的决定:不基于ROS 2 / LeRobot,而是自己编写一个堆栈。乐意分享我的理由。
大家好,我们是 Oskar、Szymon 和 Piotr,我们正在构建 TesterArmy(<a href="https://tester.army">https://tester.army</a>)。TesterArmy 是一个智能测试平台,在部署前和生产环境中进行端到端检查。我们不再浪费时间在手动测试或维护静态脚本上,而是让您用自然语言指定测试,平台会处理其中的一切。我们完全围绕代理构建了这个平台。我们的代理将可靠地执行测试,而您的编码代理可以管理平台中的所有内容,从用自然语言定义测试到代表您运行测试。
请查看我们的演示视频:<a href="https://www.youtube.com/watch?v=291IkUbPrlk" rel="nofollow">https://www.youtube.com/watch?v=291IkUbPrlk</a>。
我们创建 TesterArmy 是因为测试仍然太痛苦。人工智能编码工具使得编写和发布代码的速度大大加快,但测试仍然是一个瓶颈。传统的端到端测试设置缓慢且维护成本高。管理身份验证和测试用户非常麻烦。设置预发布环境也很麻烦。可靠地运行测试更是困难。
我们认为大多数团队并不想花时间编写选择器或维护测试基础设施。他们只想确保核心流程正常工作。使用 TesterArmy,工程师可以注册,给代理我们的命令行工具,然后让它处理创建测试和按计划或在 GitHub 上运行测试。
当出现问题时,TesterArmy 会通过 Slack 或 Discord 及时提醒您的团队。
在过去几个月里,我们的产品用户从零增长到每天有 30 多个团队使用。我们在关键流程中发现了错误,包括用户注册、结账和 AI 聊天。许多客户因为我们代理的质量和可靠性而从已经建立的竞争对手那里迁移到我们这里。
以下是我们代理发现的一些近期错误(数量相当多!):
1) 一个客户应用中的时区错误,影响了预订流程,仪表板非常复杂,人类难以发现。
2) 代理编排中的回归问题导致沙盒环境卡在加载状态,得益于 TesterArmy,团队能够在问题影响生产之前解决它。
3) 在一个复杂的仪表板结账流程中错误计算订单金额,得益于 TesterArmy,团队能够在影响收入之前解决它。
4) 捕捉到 AI 聊天流程中的回归问题,导致用户无法检索数据,因为工具调用出现故障。
还有许多其他问题,主要与一些错误的 API 调用、404 错误、未处理的错误等相关。
如果这听起来有用,我们非常希望听到您的反馈,您可以访问 <a href="https://tester.army">https://tester.army</a>。我们为您准备了一些免费的测试运行供您尝试。请放心,我们不会让您进行销售电话,也没有冗长的入职流程或烦人的设置。我们的目标是提供一种“开箱即用”的体验。
如果您正在寻找端到端测试解决方案,我们非常期待您的反馈!
SunCalc 是我最早的开源项目之一——我在 15 年前进行了第一次提交,自那时以来它得到了许多精彩的应用,但近几年有些被忽视。现在,现代 AI 工具使我能够弥补多年来积累的技术债务和用户问题,我终于有能力复兴这样的项目,并保持它们的良好状态。
v2 是一个新版本,它将太阳的计算准确性提高了 5 倍,月球的提高了 20 倍,这一改进经过了与美国海军天文台的真实数据进行的广泛测试验证。此外,它还修复了大量问题,并通过 ESM 现代化了分发方式。希望你喜欢这个版本。