我正在开发一个名为 t2t 的语音转文本应用,它具有系统范围的功能,并且有一些独特之处:它支持 MCP(模型上下文协议)服务器,以实现可扩展的自动化。
*功能介绍:*
- 按住 `fn` → 说话 → 文本会出现在任何地方(本地 Whisper 转录)
- 按住 `fn+ctrl` → 代理模式,连接到任何 MCP 服务器
- 除了代理模式下的 OpenRouter API 调用外,所有处理都是本地进行的
- 跨平台:支持 macOS、Windows、Linux
*开发原因:*
我希望有一个不依赖于特定应用的语音转文本工具,并且我对 MCP 感到兴奋,因为它可以使代理模式变得可扩展。与其硬编码集成,不如连接到任何 MCP 服务器(数据库、API、文件系统等)。
*架构:*
- 使用 Rust + Tauri 开发桌面应用
- 本地 Whisper 模型(whisper-rs)用于转录
- 本地 MCP 客户端(stdio/HTTP/SSE) - 无需远程工作者
- OpenRouter API 用于 AI(直接从 Rust 调用)
- Svelte 5 前端
MCP 客户端完全在 Rust 中运行,因此在开发和生产版本中都能正常工作。工具执行通过 JSON-RPC 在本地进行。
*开源项目:* [https://github.com/acoyfellow/t2t](https://github.com/acoyfellow/t2t)
我很想听听大家对架构的反馈,特别是关于本地 MCP 客户端的方案。同时也想知道其他人是否觉得 MCP 集成有用,或者我是否在过于复杂化问题。
你怎么看?
返回首页
最新
ASR + TTS + 聊天 + 视觉 + 文档
试用演示:<a href="https://workshop.dwani.ai" rel="nofollow">https://workshop.dwani.ai</a><p>在过去的11个月里构建了dwani.ai。<p>可以用印度语言与AI对话,并通过语音和文本获得回复。<p>结合开放权重模型,为印度语言构建AI。<p>GitHub:<a href="https://github.com/dwani-ai" rel="nofollow">https://github.com/dwani-ai</a><p>设置:<a href="https://docs.dwani.ai" rel="nofollow">https://docs.dwani.ai</a>
嗨,HN——分享 ragctl,这是一个开源命令行工具,专注于 RAG 流水线中最容易出错的部分:文档导入、OCR、解析/清理和分块。
目前,向向量数据库的设置相对标准化,但将高质量、一致的文本和元数据导入其中仍然需要大量脆弱的粘合代码。ragctl 旨在使这一“向量前”步骤可重复:只需几条命令即可将杂乱的文档转换为可检索的分块。
功能:
- 支持多种格式输入:PDF、DOCX、HTML、图像
- 针对扫描/基于图像的文档的 OCR
- 语义分块(LangChain)
- 支持批量运行,带重试和错误处理
- 输出:直接导入 Qdrant(目前)
寻求反馈:
- 开发体验:命令行界面是否直观?
- 性能/边缘情况:奇怪的 PDF、混合布局、表格
- 路线图:下一个应该支持哪些连接器(S3、Slack、Notion)或向量存储?
仓库链接: [https://github.com/datallmhub/ragstudio](https://github.com/datallmhub/ragstudio)
欢迎就架构和分块方法提出问题。
这是一个较长的难题,有点像一副2000片的拼图。建议与他人一起合作解决这个难题。
如果你喜欢规则,那么规则是你可以使用谷歌或任何其他外部资源来寻求帮助。不过,查看页面源代码被视为作弊。
特别感谢Octagon和TND团队在游戏测试和提出类别方面的帮助。
<a href="https://xcancel.com/haravayin_hogh/status/2003299405907247502" rel="nofollow">https://xcancel.com/haravayin_hogh/status/200329940590724750...</a>
大家好,我不想为 Strong 或 Heavy 付费,所以我开始自己制作一个举重日志应用程序。<p>这个应用是免费的,并且将始终保持免费。<p>网址:https://stronk.app<p>源代码(欢迎贡献)。如果你发现了bug,请在问题区反馈。如果你现在不使用这个应用,但计划在我完善功能后使用,请给这个项目加星,这样我就知道要继续进行下去。<p>网址:https://github.com/alshdavid/stronk<p>还有很多事情要做,我需要添加以下功能:
- Strava/Facebook 同步
- 导入/导出
- 图表
- 训练类型(热身/掉重)
- 计时器
- 一次最大重复次数(1RM)计算
- 在线备份(目前数据保存在你的手机上)<p>这是一个网页应用,因为我不想为在应用商店发布而支付苹果和谷歌的费用。