返回首页
最新
嗨,HN,
我很高兴分享 SpeechAnalyzerDylib,这是一个小型的 C 兼容动态库,封装了即将在 macOS 26.0(Tahoe)中推出的 SpeechAnalyzer API。如果您正在构建 Swift、Objective-C 或纯 C 项目,并希望在几乎没有样板代码的情况下添加设备上的转录功能,这可能会对您有所帮助。
## 主要特性
- *C-FFI 封装*
提供一个简单的 C 兼容 API,您可以从 Swift、Objective-C 或纯 C 中调用。
- *异步文件转录*
`sw_transcribeFile(const char *filePath, const char *locale, TranscriptionCallback callback, void *userData)`
在后台转录磁盘上的任何音频文件;通过回调返回完整的转录文本或错误字符串。
- *内存数据转录*
`sw_transcribeData(const uint8_t *bytes, size_t size, const char *locale, TranscriptionCallback callback, void *userData)`
通过内部写入临时文件并重用基于文件的转录路径来转录原始音频缓冲区。
- *实时麦克风流式传输*
`sw_startMicrophoneTranscription(const char *locale, TranscriptionCallback callback, void *userData)`
从默认麦克风实时流式传输语音,接收部分转录文本,并在引擎停止时自动停止。
- *区域设置感知*
所有 API 接受一个可选的区域设置标识符(默认为系统区域设置),以支持特定语言的模型。
- *自动模型管理*
在开始转录之前,验证或下载所需的离线语音模型,以匹配您选择的区域设置。
- *基于回调的错误处理*
在失败时,您的回调将收到一个 `"Error: …"` 字符串,以便您可以处理重试或回退。
- *零外部依赖*
完全基于 Apple 的 AVFoundation 和 Speech 框架构建,无需第三方库。
## 版本要求
macOS 26.0(Tahoe)beta
Xcode 26 beta
这两个版本目前都处于测试阶段,SpeechAnalyzer 仅在 beta 版本中可用,因此您需要运行开发者 beta 版本才能尝试。
## 仓库与许可证
[https://github.com/aethiopicuschan/speech-analyzer-dylib](https://github.com/aethiopicuschan/speech-analyzer-dylib)
许可证为 MIT。
## 欢迎反馈与贡献
- 开放问题以报告您遇到的错误或边缘情况
- 提交 PR 以添加测试、CI 或示例集成
- 在下方分享您的经验或集成问题
期待听到您用它构建的内容!
我是HeartStamp的创始人,这是一家获得种子阶段资金支持的初创公司。我们正在构建一个生成式人工智能平台,旨在通过结合尖端模型、LoRA定制和市场,来实现个性化的数字表达,将创意意图转化为精美呈现的数字内容和高保真、可打印的媒体。我们计划在2026年第一季度在美国、加拿大和英国推出,并在此后迅速扩展到全球市场。
我们正在招聘一位基础性的*自由职业AI工作流工程师*,帮助我们推出最小可行产品(MVP)。你将与我们的技术负责人紧密合作,设计和优化我们的生产流程,使用ComfyUI、Stable Diffusion(SD3.5/SDXL)、LoRA和TensorRT。这个角色的一个关键部分还包括帮助我们定义需求、面试并引入我们的初始提示工程团队。这不仅仅是一个自由职业的工作机会,而是一个基础性的、共同创始人的机会。作为我们第一位外部工程师,你将直接与创始团队合作,并有明确的路径转为全职共同创始人角色,享有可观的股权。
鉴于你的专业背景,我认为这可能非常适合你。如果你对新项目持开放态度,我很乐意与您交流并分享更多细节。你可以通过这里联系我,或在Telegram上找到我 *@phoenixonego*,或者通过电子邮件联系 *admin@heartstamp.com*。