Elevenlabs 3B 类别参数开源文本转语音模型
1. 自然语言语音控制
2. 15种以上的内联情感标签,用于表达性语音
3. 流媒体音频生成
4. vLLM集成
5. 可在单个GPU上运行
https://huggingface.co/maya-research/maya1
查看原文
1. Natural Language Voice Control<p>2. 15+ Inline Emotion Tags for Expressive Speech<p>3. Streaming Audio Generation<p>4. vLLM integration<p>5. Runs on single GPU<p>https://huggingface.co/maya-research/maya1