1作者: AJ1313k2 个月前原帖
在过去几个月里,我和我的联合创始人一直在构建复杂的智能代理工作流,但我们不断遇到相同的可靠性问题:共享状态不一致、无声故障、代理之间的偏离,以及没有清晰的方法在不重启整个工作流的情况下进行恢复。 显然,大多数故障并不是“LLM问题”,而是经典的分布式系统问题在多代理设置中显现出来。 由于当前生态系统中没有任何解决方案能够妥善应对这些问题,我们开始为代理工作流构建一个可靠性层——这个层次为多代理系统增加了结构、安全性和可预测的恢复能力,而不需要开发者重写他们的技术栈。 我们希望与那些遇到类似问题或正在构建生产级代理工作流的人联系。我们的目标是了解其他人在这些系统中如何看待可靠性、故障恢复和工作流一致性。 如果您在这个领域工作或想尝试早期访问,请访问以下链接: https://tally.so/r/LZDb0j 我们非常欢迎大家分享在代理可靠性方面的想法或经验,特别是关于故障案例或痛点的分享。