1作者: sidearea20 天前原帖
现有的文本转语音(TTS)工具通常只支持单一声音,但我需要自然的多角色对话来制作有声书和播客,因此我开发了Voxica。 <p>实时演示:<a href="https://voxica.io" rel="nofollow">https://voxica.io</a>(试试“Maya & Noah”的对话) <p>Voxica可以生成: <p>从简单文本输入生成多角色对话 <p>自动切换声音 <p>逼真的背景音效(咖啡馆、雨声、办公室等) <p>可导出的音频文件 <p>非常适合: <p>播客/有声书创作者 <p>开发语音应用的开发者 <p>制作互动课程的教育工作者 <p>任何需要快速获取对话音频的人 <p>我是在花了几周时间手动编辑播客音频片段后开发这个工具的——现在只需30秒,而不是3小时。 <p>API文档:<a href="https://voxica.io/docs" rel="nofollow">https://voxica.io/docs</a> 免费试用,之后按使用量计费。 <p>想知道这里还有哪些其他用例或对话场景会对大家有帮助!
1作者: scor32k20 天前原帖
嘿,HN! 我创建了DBLayer,旨在帮助开发者快速将他们的数据库转换为API。它适合独立开发者、早期团队以及希望快速访问数据而无需搭建后端的数据工作者。 你可以: - 编写查询并将其暴露为端点 - 添加身份验证并监控使用情况 - 通过用户界面自定义端点 - 跳过样板代码,几分钟内即可开始使用 期待你的反馈以及你发现的任何bug或边缘案例!
1作者: narayan_prasath20 天前原帖
如果战术认知正在液化,那么稀缺的技能就是元工作:设计反馈循环,决定哪些问题值得代理人关注,策划模糊性必须由人类来把控的边界。战略从直接解决问题转变为问题框架的构建——选择哪些约束是重要的,以及哪些信号可以被视为真相。
2作者: Beardier20 天前原帖
大家好!<p>再次感谢大家对我原始帖子的细致反馈,非常感激。<p>我对 chonkify 进行了几处更新,这是我用来分块任何内容(数组、字符串、缓冲区、异步可迭代对象等)的微型工具(约 1kB):<p>- 现在包含完整源代码(不再只有压缩版分发)<p>- 明确了字符串的行为:<p>-- chonk() 使用 UTF-16 代码点(与 JS 一致)<p>-- 新增 chonkGraphemes() 按字形集拆分(这样表情符号可以保持完整)<p>- 更新了 README,提供了清晰的示例和权衡说明<p>我仍然认为字形支持很酷——只是现在不再是默认选项。<p>JS 字符串基于 UTF-16,但现实世界中的文本(表情符号、印地语、泰语等)通常需要对字形的敏感处理。现在你可以在“JS 的做法”和“用户的期望”之间进行选择。<p>这仍然是一个个人项目——我主要是为自己构建的,并不声称具备任何生产级的严肃性。话虽如此,如果它对其他人有用,我会非常高兴。<p>期待更多反馈!