返回首页
一周热榜
嗨,HN,
我最近在一个名为 Kontra 的小项目上工作,并刚刚发布了它。
Kontra 是一个数据质量测量引擎。您可以在 YAML 或 Python 中定义规则,然后将其应用于 Parquet、CSV 或数据库表,最终获得违规计数和抽样的失败行。
我们的主要目标是避免不必要的工作。Kontra 不会将所有规则视为相同,而是区分执行路径。有些检查仅通过 Parquet 元数据就能得到答案,而其他检查则会推送到 SQL 中,只有在确实需要的规则才会进行完整的内存扫描。不同的规则有不同的保证,Kontra 明确说明这一点,而不是将其隐藏。
在底层,它使用 DuckDB 进行文件的 SQL 推送,并使用 Polars 进行内存中的执行。它还支持对数据集进行分析,从观察到的数据中草拟起始规则,以及对随时间变化的验证运行进行差异比较。规则可以携带用户定义的上下文,运行后可以进行注释,而不会影响验证行为。
它既可以作为命令行工具使用,也可以作为 Python 库。
欢迎提出问题或反馈。
这个周末写的,因为我想念在Linux上使用的本地听写/人工智能工具。使用Groq来提高速度。用Python编写。
嗨,HN,
我创建这个库是因为我想要一种清理杂乱文本数据并提取个人身份信息(PII)的方法,而不需要将敏感信息发送到云API或处理脆弱的正则表达式模式。
该工具通过 llama.cpp 在本地运行量化模型,并使用从 Pydantic 模型生成的 GBNF 语法。这强制大型语言模型(LLM)输出严格遵循模式的有效 JSON,从而解决了小模型常见的可靠性问题。目前,它支持 Pandas 和 Polars 数据框,并且可以与任何 GGUF 模型配合使用。
它仍处于早期 alpha 阶段,因此在较旧的 CPU 上的性能可能会成为瓶颈,相较于标准字符串操作,我发现它在正则表达式失效的语义提取任务中非常有用。我非常欢迎对实现的反馈或优化建议。
嗨,HN,
我开发了一个完全在浏览器中运行的语音转文本工具。免费版无需注册,也不会将数据发送到我的服务器。
试试吧: [https://voicetotextonline.com](https://voicetotextonline.com)
我为什么要开发这个工具:
- 现有工具需要注册,有时间限制,或者收费
- Google Docs 的语音输入需要 Google 账户
- Dragon 的价格在 $150 到 $500 之间
- Otter.ai 的免费版有使用限制
(A) 免费功能(无需账户):
1/ 核心转录:
- 使用 Web Speech API 实现实时语音转文本
- 支持 55 种以上语言
- 自动标点和句子大小写选项
- 首次加载后可离线使用(PWA)
2/ AI 增强(基于用户调查添加 - 80% 投票支持):
- 自动修正语法、标点和格式
- 一键清理转录文本
3/ 我的项目(本地存储):
- 将转录文本保存到浏览器的 localStorage
- 使用文件夹组织(笔记、工作、个人等)
- 自定义文件夹和标签
- 在所有转录文本中搜索
- 编辑、复制、下载为 TXT
- 100% 私密 - 从不离开您的设备
- 导出:
- 复制到剪贴板
- 下载为 TXT 或 DOCX
(B) 专业功能($10/月或 $1/小时按需付费):
1/ 文件上传与转录:
- 上传音频/视频文件(MP3、WAV、M4A、MP4、MOV、AVI、MKV)
- 每个文件最大 500MB
- 批量上传(一次最多 10 个文件)
- 由 AssemblyAI 提供支持(准确率超过 95%)
- 每月 150 小时转录
2/ 高级功能:
- 实时进度和预计完成时间
- 说话者标签
- 浏览器内音频录制(最长 5 分钟,可暂停/恢复)
- 翻译成 25 种以上语言(GPT-4o)
3/ 导出格式:
- 带时间戳的 TXT、SRT、VTT、JSON
- 段级时间戳精确度
4/ 云存储:
- 云中的转录历史
- 10GB 存储,每月 1,000 个文件
(C) 数据与隐私:
免费版:
- 所有转录文本仅存储在浏览器的 localStorage 中
- 从不接触我们的服务器
- 100% 私密
专业版:
- 音频文件存储在 Supabase(加密)
- 文件保留 30 天以供重新下载,然后自动删除
- 转录文本永久存储在您的账户中
- 您可以随时删除任何转录文本或整个账户
- 我们不会将您的数据用于训练
技术栈:
- Next.js 14(应用路由)
- Web Speech API(免费实时转录)
- AssemblyAI(专业文件转录,准确率超过 95%)
- OpenAI GPT-4o(AI 增强与翻译)
- Supabase(身份验证与存储)
- Stripe(支付)
- Tailwind CSS
- 托管在 Vercel 上
限制:
- 实时转录在 Firefox 中无法使用(不支持 Web Speech API)
- 免费版的准确性取决于 Chrome 的语音引擎
非常希望能收到关于用户体验、定价或功能想法的反馈。考虑将核心转录组件开源。