返回首页
最新
现有的文本转语音(TTS)工具通常只支持单一声音,但我需要自然的多角色对话来制作有声书和播客,因此我开发了Voxica。
<p>实时演示:<a href="https://voxica.io" rel="nofollow">https://voxica.io</a>(试试“Maya & Noah”的对话)
<p>Voxica可以生成:
<p>从简单文本输入生成多角色对话
<p>自动切换声音
<p>逼真的背景音效(咖啡馆、雨声、办公室等)
<p>可导出的音频文件
<p>非常适合:
<p>播客/有声书创作者
<p>开发语音应用的开发者
<p>制作互动课程的教育工作者
<p>任何需要快速获取对话音频的人
<p>我是在花了几周时间手动编辑播客音频片段后开发这个工具的——现在只需30秒,而不是3小时。
<p>API文档:<a href="https://voxica.io/docs" rel="nofollow">https://voxica.io/docs</a>
免费试用,之后按使用量计费。
<p>想知道这里还有哪些其他用例或对话场景会对大家有帮助!
嘿,HN!
我创建了DBLayer,旨在帮助开发者快速将他们的数据库转换为API。它适合独立开发者、早期团队以及希望快速访问数据而无需搭建后端的数据工作者。
你可以:
- 编写查询并将其暴露为端点
- 添加身份验证并监控使用情况
- 通过用户界面自定义端点
- 跳过样板代码,几分钟内即可开始使用
期待你的反馈以及你发现的任何bug或边缘案例!
如果战术认知正在液化,那么稀缺的技能就是元工作:设计反馈循环,决定哪些问题值得代理人关注,策划模糊性必须由人类来把控的边界。战略从直接解决问题转变为问题框架的构建——选择哪些约束是重要的,以及哪些信号可以被视为真相。
大家好!<p>再次感谢大家对我原始帖子的细致反馈,非常感激。<p>我对 chonkify 进行了几处更新,这是我用来分块任何内容(数组、字符串、缓冲区、异步可迭代对象等)的微型工具(约 1kB):<p>- 现在包含完整源代码(不再只有压缩版分发)<p>- 明确了字符串的行为:<p>-- chonk() 使用 UTF-16 代码点(与 JS 一致)<p>-- 新增 chonkGraphemes() 按字形集拆分(这样表情符号可以保持完整)<p>- 更新了 README,提供了清晰的示例和权衡说明<p>我仍然认为字形支持很酷——只是现在不再是默认选项。<p>JS 字符串基于 UTF-16,但现实世界中的文本(表情符号、印地语、泰语等)通常需要对字形的敏感处理。现在你可以在“JS 的做法”和“用户的期望”之间进行选择。<p>这仍然是一个个人项目——我主要是为自己构建的,并不声称具备任何生产级的严肃性。话虽如此,如果它对其他人有用,我会非常高兴。<p>期待更多反馈!