1作者: YugaHashimoto大约 1 个月前原帖
开源的Android语音助手应用程序,专为OpenClaw设计。<p>主要功能: - 离线唤醒词检测(Vosk) - VoiceInteractionService集成(长按主页键) - 实时聊天 + 流式响应 - 加密设置 + 设备身份 - 双语用户界面(英语/日语)<p>欢迎对架构、入门体验和生产环境的安全性提出反馈。
1作者: pulko大约 1 个月前原帖
文档会出现偏差。README.md 中的示例可能与实现不再匹配,而持续集成(CI)通常不会注意到这一点。<p>我开发了 doksnet,这是一个小型的 Rust 命令行工具,它可以将文档部分与代码片段链接起来,并通过 Blake3 哈希值验证两者是否保持同步。<p>你可以定义如下的映射:<p>• README.md:15-25<p>• src/lib.rs:40-65<p>doksnet 将这些范围及其哈希值存储在一个紧凑的 .doks 文件中。doksnet test 会重新提取内容,如果有任何变化(包括空格),则会失败(退出代码 1)。<p>基本流程:<p>• doksnet new – 初始化<p>• doksnet add – 创建文档 ↔ 代码映射(交互式)<p>• doksnet test – CI 安全验证<p>• doksnet test-interactive – 审查/修复不匹配<p>它是本地仓库的,不依赖外部服务,也没有解析/抽象语法树魔法——仅仅是确定性的文本提取和哈希。<p>如果你想在 CI 中强制同步,还有一个 GitHub Action。<p>仓库: <a href="https://github.com/Pulko/doksnet" rel="nofollow">https://github.com/Pulko/doksnet</a> 安装:cargo install doksnet 网站: <a href="https://doksnet.pulko-app.com" rel="nofollow">https://doksnet.pulko-app.com</a><p>希望能收到对这种方法的反馈——特别是这个工具是否能比“根据新变化重写所有 README,确保没有错误”更有用,尤其是在 AI 使用受到限制的环境中。
1作者: fabiosuizu大约 1 个月前原帖
我开发了一个英语发音评估引擎,体积仅为17MB,并且在CPU上运行时间不到300毫秒。<p>架构:CTC强制对齐 + GOP评分 + 集成头(MLP + XGBoost)。不使用wav2vec2或大型自监督模型——整个流程采用量化的NeMo Citrinet-256作为声学骨干。<p>在speechocean762(标准学术基准,2500个发音)上进行基准测试: - 音素准确率(PCC):0.580 — 超过人类标注者间的一致性(0.555) - 句子准确率:0.710 — 超过人类一致性(0.675) - 模型体积比基于wav2vec2的最先进技术小70倍<p>权衡:在原始准确率上,我们比最先进技术低约10-15%。但对于语言学习应用中的实时反馈而言,这种延迟/体积的权衡是值得的。<p>可作为REST API、MCP服务器(用于AI代理)以及在Azure市场上提供。<p>演示:<a href="https://huggingface.co/spaces/fabiosuizu/pronunciation-assessment" rel="nofollow">https://huggingface.co/spaces/fabiosuizu/pronunciation-assessment</a><p>希望获得关于评分方法和人们认为有价值的用例的反馈。