2作者: claviska大约 1 个月前原帖
嗨,HN, 我是一名长期的网页开发者,但这是我第一次开发 macOS 应用。非常欢迎反馈 <3 我创建 TongueType 是因为我尝试过的每个听写应用都在以下三方面至少失败了一项:要么将我的音频发送到某个云端,要么收取我月费,要么使用起来笨拙或显得过于企业化。云端处理对于任何敏感信息来说都是致命的。收取订阅费对于“Whisper + 一个热键”来说简直是侮辱。 TongueType 在 Apple Silicon 上通过 CoreML 本地运行 Whisper。它的设计感觉就像第二个键盘:按下热键,开始说话,松开后,文字就出现了。它位于菜单栏中(没有 Dock 图标,没有可点击的按钮)。我经常用它来生成 LLM 提示、代码注释、电子邮件和私信。它完全不会干扰我的工作。(它还可以转录音频和视频文件。) 没有账户,没有服务器,零遥测。免费版每月提供 30 分钟的实时听写。专业版一次性收费 19.99 美元,最多支持 5 台 Mac。没有订阅,我承诺会一直保持这种方式。 我希望这个应用能够有趣且个性化。我包含了二十种口音颜色,包括 Rainbow Mode,在你说话时会在波形上显示令人满意的渐变。自定义听写标签、可调叠加位置、语音提示(如“新段落”或“删掉这个”),还有可自定义的后处理规则!我希望这个应用能让你感到它是属于你的,而不是你在租用的东西。 有两件事情值得一提,关于我尝试过但没有成功的部分: 首先,我尝试将 iOS 键盘扩展作为应用的一部分。iOS 的听写功能实在不够好,而本地的 Whisper 键盘本来会是一个真正的升级。结果发现,键盘扩展根本无法访问 iOS 上的麦克风 API,因此唯一的解决办法是跳转到一个主应用进行录音,然后再返回键盘,这样的体验非常糟糕。因此,它目前仅支持 macOS。 其次,我最初将其提交到 Mac App Store,但根据指南 2.4.5 被拒绝,该指南规定应用不能出于非无障碍目的使用无障碍 API。这是导致大多数听写应用被拒的臭名昭著的规则。讽刺的是,第三方听写应用实际上具有非常真实的无障碍角度。患有 RSI、震颤、关节炎、中风后偏瘫等的人,往往发现长时间打字既痛苦又甚至不可能。苹果的立场是“在光标处插入文本”并不算是无障碍用例,即使用户实际上根本无法使用双手。因此,这是一个直接下载的应用,已签名并公证,未在 App Store 上架。 同时,我要特别感谢 Polar(polar.sh),它在设置和使用支付方面绝对令人愉快!它的体验就像 2011 年的 Stripe。简单、快速、直观,完全可以正常工作。 网站和下载链接: [https://tonguetype.app](https://tonguetype.app) (我女儿为视频做了配音……她做得很好!) 我很乐意回答任何问题,真心想听听哪些地方有问题或可以改进!