1作者: jag7297 个月前原帖
嗨,HN!Voicelab 是一个用于优化顶级开源文本转语音(TTS)模型推理的 API。目前支持的模型有 CSM-1B 和 Orpheus,但我们将在接下来的几周内添加 Dia、Chatterbox、Kokoro 等更多模型。 尽管每个月都有新的超现实主义开源语音模型发布,但大多数人仍然使用少数几个闭源提供商。原因在于这些研究预览版本往往缺乏生产就绪性;它们的推理架构通常不适合进行可扩展的运行(即每个 GPU 只能处理一个并发流),而且公开权重生成的语音质量可能不一致。 我们通过构建针对音频变换器优化的服务基础设施来解决这个问题(使可扩展推理更快、更具成本效益),并通过使用配音演员、电话通话和其他私下收集的音频数据对公开权重进行后期训练,从而提高生成质量的一致性。 开源语音正在变得越来越令人兴奋,我们希望能够提供一个高质量、可扩展的推理层,以利用这些团队所发布的丰富研究。非常感谢您的反馈 :) 文档:docs.vogent.ai 游乐场:app.vogent.ai
3作者: jakejohnson7 个月前原帖
嗨,HN,我在帮助客户预测AI代理的费用时,遇到了同样的问题。定价可能很复杂,需要认真处理电子表格。你需要考虑不同的模型层级、令牌估算、提示缓存以及特定工作流程中的各种服务。 在为每个客户手动构建电子表格后,我决定开发BotBudget——一个免费的计算器,可以对数百种大型语言模型(LLM)和AI服务的成本进行建模。 主要功能: - 多服务工作流程(LLM + 语音转文本/文本转语音 + RAG + 保护措施) - 主要供应商的最新定价数据 - 内置的令牌化工具用于提示估算 - 包含增长情景的成本预测 - 可分享的团队链接 这对我的咨询工作非常有帮助,我希望其他开发AI产品的人也能找到它的价值。 可以在botbudget.com上试用——非常希望能收到关于缺失功能或改进建议的反馈。 顺便提一下,技术栈很简单:它是用Next.js构建的,托管在Cloudflare Workers上,使用@opennextjs/cloudflare,并且每日通过GitHub工作流从自己和社区维护的来源更新平面JSON定价数据。
1作者: pinter697 个月前原帖
我想重新启动我的旧通讯,并建立一个新网站。每个网页也将作为一封通讯邮件。我希望有一个简单易用的设置,能够让我拥有数据和受众,而不依赖于某个平台在未来几年内继续以合理的价格为我服务。