1作者: dnoberon21 天前原帖
免责声明:这篇文章是关于人工智能及其在工程领域的应用。<p>我是一名高级工程师,已经在这个行业工作了12年,但我对是否应该使用人工智能以及使用多少人工智能感到困惑。我的感受就像我离开前宗教时一样:在一个新的世界里,我努力寻找自己的身份和真正的价值观。<p>我重视工艺,但我也重视完成工作。我一直倡导使用最强大的工具,推崇调试器而非打印调试,使用现代编辑器的功能,比如语言服务器协议(LSP)等。我更看重独特性而非统一性,更看重创造力而非机械背诵。这些价值观中有些支持使用人工智能,而有些则似乎强烈建议避免使用。就像二战期间及其后通过可怕手段发现的一些发明一样,我觉得人工智能具有巨大的潜力,但同时也在侵蚀版权,毒害生态系统和社区。<p>我必须保住我的工作,以便养活我的家人,但我不想保留任何要求我放弃价值观的工作。然而,在工作中,我看到许多工程师的输出严重依赖人工智能,结果往往质量不佳——当然,并不是每次都是这样。我读过“人工智能的使用就像老虎机”的帖子,能感受到其中的一部分,但难道它不是一个节省我们时间的强大工具吗?<p>如果我不够使用人工智能,我会不会落后,无法在我一生中热爱的领域工作?<p>我知道这就像是在对着虚空呐喊;但你们中总有一些人会在听,对吧?
3作者: neilsharma42521 天前原帖
我厌倦了将 Langfuse 用于追踪、将 promptfoo 用于红队测试和评估,以及为 CI/CD 编写自定义脚本。这一切都很混乱,所以我创建了 EvalsHub。 EvalsHub 将所有功能整合到一个平台上。自动化的生产评分、红队测试、提示版本管理以及 CI/CD 集成。30 分钟内即可实现从零到全面评估覆盖。 希望能收到任何在生产环境中部署 AI 的人的严厉反馈。 evalshub.ai