你是支持人工智能还是反对人工智能?
返回首页
最新
目前,我正在开发一个用于管理文档、数据库和白板的网络应用程序——这是一款典型的应用,旨在像 Notion 一样。<p>然而,现在我面临着制定一个有 AI 使用限制的计划的困境,因为我的想法是让它更具自主性:能够在整个工作区内编辑和查询上下文,并将其转移到文档中,例如,可能在白板上绘制一些东西等。不过,我感觉消费可能会很快失控。我计划使用 DeepSeek 进行 AI 聊天,但使用 Gemini 3 Flash 进行自主使用和编辑,因为它更智能。最近,我注意到许多核心 AI 应用程序已经将定价模式从按请求计费转变为固定使用限制,但我不确定这是否会受到批评,是否会导致用户体验不佳,或者甚至让人觉得没有得到所支付的价值。因此,我希望听听大家对我应该做出什么决策的看法。
我正在研究基础设施,以解决重试风暴和故障问题。在深入之前,我想了解一下人们今天实际在做什么。比较不同的解决方案,也许能帮助某些人发现潜在的解决办法。
问题:
- 重试风暴 - API 失败,整个系统的实例独立重试,造成“雷鸣般的群体效应”,使情况更糟。
- 部分故障 - API 虽然“在线”,但性能下降(响应慢,间歇性500错误)。健康检查通过,但请求却受到影响。
我想了解的是:
- 你们目前的解决方案是什么?(熔断器、队列、自定义协调、服务网格,还是其他?)
- 效果如何?存在哪些不足之处?
- 你们的规模有多大?(公司规模、实例数量、请求数/秒)
我很想听听哪些方法有效,哪些无效,以及你们希望存在的解决方案。
在<a href="https://kagapa.com/" rel="nofollow">https://kagapa.com/</a>的指导下,将Kannada Nudi编辑器的桌面版本移植到网页端。