11作者: mahmoud-almadi4 天前原帖
嗨,HN,我们是Mahmoud和Alan,正在开发Cyberdesk(<a href="https://www.cyberdesk.io">https://www.cyberdesk.io</a>),这是一款用于自动化Windows桌面应用程序的确定性计算机使用代理。开发者使用我们的工具来自动化医疗、会计、建筑等领域的遗留软件中的重复任务,通过直接在桌面上执行点击和键入操作。 <p>以下是Cyberdesk计算机使用代理的几个演示:</p> 快速完成对遗留桌面应用程序的文件导入自动化:<a href="https://youtu.be/H_lRzrCCN0E" rel="nofollow">https://youtu.be/H_lRzrCCN0E</a> <p>在一个名为OpenDental的庞大Windows单体应用上工作(同时展示了代理的学习过程):<a href="https://youtu.be/nXiJDebOJD0" rel="nofollow">https://youtu.be/nXiJDebOJD0</a>。</p> 提交W-2税表:<a href="https://youtu.be/6VNEzHdc8mc" rel="nofollow">https://youtu.be/6VNEzHdc8mc</a> <p>许多行业仍在使用遗留的Windows桌面应用程序,员工被耗时的重复任务所困扰。为这些任务提供自动化的供应商最终往往会编写脆弱的机器人流程自动化(RPA)脚本,或者雇佣海外团队进行手动任务执行。RPA常常因为不可避免的用户界面变化或意外弹出窗口(如Windows更新或随机的应用内通知)而失效。海外团队通常不可靠,成本也高于软件,而且对于受监管的行业来说并不总是可行的选择。</p> <p>我之前在一家财富100强公司编写了影响超过2万名员工的RPA脚本,亲身体验了RPA的脆弱性和不灵活性。对我来说,这显然是一个治标不治本的解决方案。Alan在他之前的创业公司中构建了一个计算机使用代理,并意识到它在自动化许多行业的手动计算机任务方面具有巨大的潜力,因此我们开始了Cyberdesk的开发。</p> <p>计算机使用模型在处理抽象的、长期的任务时可能会遇到困难,但它们在逐屏做出上下文感知决策方面表现出色,因此非常适合自动化这些桌面应用程序。</p> <p>可靠性的关键在于设计高度具体且经过深思熟虑的提示。就像使用ChatGPT一样,模糊或含糊不清的提示不会得到你想要的结果。这在计算机使用中尤其如此,因为模型处理的是几乎整个桌面屏幕的额外视觉信息;没有精确的指令,它不知道该关注哪些细节或如何行动。</p> <p>与RPA不同,Cyberdesk的代理并不是盲目重放点击。它会在每次操作之前读取屏幕状态,并在流程偏离时自我纠正(如弹出窗口、延迟、用户界面变化)。与现成的计算机使用AI不同,Cyberdesk在生产中以确定性运行:代理主要遵循它所学习的步骤,只有在发生异常时才会回退到推理。Cyberdesk通过自然语言指令学习工作流程,捕捉细微差别并处理动态任务——远远超出简单屏幕录制几次运行所能编码的内容。</p> <p>这种方法在可靠性和成本方面都表现良好:可靠性,因为在意外情况下我们会回退到计算机使用模型;成本方面,因为计算机使用模型昂贵,我们只在需要时使用它们。否则,我们会利用更快、更实惠的视觉大语言模型(LLMs)在确定性运行期间逐步检查屏幕状态。我们的代理还配备了故障保护、数据提取、屏幕评估等工具,以处理动态和敏感的情况。</p> <p>工作原理:您只需在任何Windows机器上安装我们的开源驱动程序(<a href="https://github.com/cyberdeyyoyoubackhackersk-hq/cyberdriver" rel="nofollow">https://github.com/cyberdeyyoyoubackhackersk-hq/cyberdriver</a>)。它与我们的后端通信以接收命令(点击、输入、滚动、截图)并发送数据(截图、API响应等)。您给我们的计算机使用代理提供详细的自然语言描述,类似于员工第一次学习新任务的标准操作程序(SOP)。然后,代理利用计算机使用AI模型学习步骤,并通过将每个截图与其操作(点击这些坐标、输入XYZ、等待页面加载等)一起保存来记忆这些步骤。</p> <p>代理以确定性的方式快速且可预测地执行这些步骤。为了应对弹出窗口和用户界面变化,我们的代理会将实时屏幕状态与记忆状态进行对比,以确定是否可以安全地继续执行记忆步骤。如果没有重大变化妨碍安全执行记忆步骤,它将继续;否则,它会回退到一个具有过去操作和剩余任务上下文的计算机使用模型。</p> <p>目前,客户使用我们来处理手动任务,如从遗留桌面应用程序中导入和导出文件、在桌面患者管理系统(PMS)中为患者预约,以及在电子病历(EMR)中填写患者资料等数据录入。</p> <p>我们还没有自助服务选项,但我们希望手动为您提供入驻服务。请在此预约演示以了解更多信息!(<a href="https://www.cyberdesk.io">https://www.cyberdesk.io</a>)如果您希望稍后等待自助服务选项,请在此提交您的电子邮件(<a href="https://forms.gle/HfQLxMXKcv9Eh8Gs8" rel="nofollow">https://forms.gle/HfQLxMXKcv9Eh8Gs8</a>),以便在准备好时及时通知您。您还可以在此查看我们的文档:<a href="https://docs.cyberdesk.io">https://docs.cyberdesk.io</a>。</p> <p>我们非常希望听到您对我们方法和遗留行业桌面自动化的看法!</p>
18作者: tombert4 天前原帖
我刚刚被拒绝了一份工作,这让我感到比应该更沮丧。<p>(在我律师(ChatGPT)的建议下,我不会透露公司的名字)。<p>这真的让我很恼火;在四周的时间里,我进行了三次面试,我对自己的技术问题回答得相当有信心。可能是我的简历看起来太“跳跃”,这也可以理解,但他们本可以在浪费我和他们的时间之前先阅读我的简历,避免这三次耗时的面试。<p>我唯一能想到的就是,他们在面试中可能不喜欢我的个性,这让我感到最沮丧。如果我在技术部分表现不佳,那我可以通过学习更多技术知识来提升自己,但我并不完全确定我的个性在这些面试中出了什么问题,更不知道该如何改变。<p>保持动力很难,但我想我别无选择,因为我还需要支付房贷,所以我想知道这里有没有人能给我一些建议,如何调整我的个性以便在面试中表现得更好?我希望能保持诚实(如果没有其他原因,那是因为我实在是个糟糕的说谎者)。
1作者: suayip4 天前原帖
大家好, 我一直在为Django REST框架开发一个新的过滤后端。 目前,django-filter是处理过滤和查询参数的事实标准库,但在某些使用场景中,它的功能有所不足。以下是一些新特性: - 您可以使用序列化器字段进行解析和验证,不再需要处理Django表单和小部件。 - 您可以对过滤器进行分组,分组允许您自定义过滤器之间的交互。 - 您可以使用约束系统在过滤器之间执行验证。 - 您可以创建带有子过滤器的嵌套过滤器。 ……还有更多。在文档中,我解释了这些选择背后的原因,并提供了一些实际案例。请查看一下: 我希望能看到大家的评论。我欢迎建议和推荐。谢谢!
2作者: eimrine4 天前原帖
我除了演示之外从未使用过这个工具,但我想购买一个账户。我打算实施我梦寐以求的软件产品创意。在购买之前我应该考虑些什么?也许已经有一些相关的文献或至少是博客文章?我听说它能生成很好的代码,但前提是生成的代码的总行数会比原始代码长几倍。