一周热榜

3 分•作者: saran-damm•3 天前•原帖

我开发了 depup，这是一个命令行工具，用于扫描 Python 依赖项、检查 PyPI 版本、评估升级影响，并支持持续集成工作流。<p>文档：<a href="https://saran-damm.github.io/depup/" rel="nofollow">https://saran-damm.github.io/depup/</a> 代码库：<a href="https://github.com/saran-damm/depup/" rel="nofollow">https://github.com/saran-damm/depup/</a>

展示HN：基于Pipecat构建的开源可定制AI语音听写工具

3 分•作者: kstonekuan•3 天前•原帖

Tambourine 是一个开源、完全可定制的语音听写系统，允许您控制语音转文本（STT）/自动语音识别（ASR）、大型语言模型（LLM）的格式和插入干净文本的提示，以便在任何应用中使用。我在这方面已经花了几周时间进行开发。促使我开发这个项目的原因是希望拥有一个可定制的 Wispr Flow 版本，能够完全控制模型、格式和系统行为，而不是依赖一个黑箱。 Tambourine 是直接建立在 Pipecat 之上的，依赖于其模块化的语音代理框架。后端是一个本地的 Python 服务器，利用 Pipecat 将 STT 和 LLM 模型整合成一个单一的管道。这种模块化特性使得更换服务提供商、尝试不同的设置以及对语音 AI 进行精细控制变得简单。我与朋友分享了一个早期版本，并在本地的 Claude Code 聚会上进行了展示。反馈非常积极，大家鼓励我更广泛地分享这个项目。桌面应用是使用 Tauri 构建的。前端使用 TypeScript 编写，而 Tauri 层则使用 Rust 处理低级系统集成。这使得能够注册全局热键、管理音频设备，并在 Windows 和 macOS 上可靠地在光标处输入文本。从高层次来看，Tambourine 为您的操作系统提供了一个通用的语音接口。您按下全局热键，讲话，格式化的文本会直接在光标处输入。它可以在电子邮件、文档、聊天应用、代码编辑器和终端中使用。在底层，音频通过 WebRTC 从 TypeScript 前端流式传输到 Python 服务器。服务器使用可配置的 STT 提供商进行实时转录，然后将转录文本传递给一个 LLM，该模型去除填充词、添加标点，并应用自定义格式规则和个人词典。STT 和 LLM 提供商以及提示可以在不重启应用的情况下进行切换。该项目仍在积极开发中。我正在处理边缘案例并完善用户体验，可能会有一些重大变更，但大部分核心功能已经运行良好，并已成为我日常工作流程的一部分。我非常希望能得到反馈，特别是来自对语音作为接口未来感兴趣的朋友们。

帕金森病可能与水有关

3 分•作者: wjb3•7 天前•原帖

国会取消军方“维修权”

3 分•作者: beepbooptheory•5 天前•原帖

展示HN：PhotoToVideoAI – AI照片转视频生成器

3 分•作者: qzcanoe•3 天前•原帖

PhotoToVideoAI 是一款基于人工智能的工具，可以将您的照片转换为动态视频。您只需上传一张照片和一个提示，约30秒后即可获得高质量的视频，分辨率高达1080p，时长为5或10秒。该工具专为内容创作者、营销人员和摄影师设计，欢迎反馈！

Console.text() – 代码执行时的短信提醒

3 分•作者: Noel04•6 天前•原帖

<p><pre><code> 嗨，HN！我开发了 console.text() - 一个在特定代码路径在生产环境中执行时向你发送短信的工具。这个想法来源于 Jason Goodison 的 YouTube 视频，讲述了微型SaaS产品。我在教程的泥潭中挣扎了几个月，所以我决定直接发布一些东西。它的功能： npm install @holler2660/console-text const { init } = require("@holler2660/console-text"); init({ apiKey: 'ct_live_xxx' }); console.text('支付失败', { userId: '123' }); // → 短信将在 5-10 秒内到达尝试一下： https://soorajdmg.github.io/Console-text/ 为什么选择这个而不是 Sentry/PagerDuty？这些工具非常适合团队使用。而这个工具则是为独立开发者和副项目设计的，旨在提供简单明了的警报，而无需繁琐的设置。如果你知道 console.log()，你就已经知道如何使用它。</code></pre>

我从查看GitHub上400个开源医疗AI工具中学到了什么

3 分•作者: jjiangkells•6 天前•原帖

美国的资本主义——财富的崇拜

3 分•作者: exceptione•3 天前•原帖

澳大利亚的社交媒体禁令陷入混乱，年轻人纷纷转向中国替代品。

3 分•作者: delichon•2 天前•原帖

展示HN：我推出了一个播客，专门采访创作者

3 分•作者: sillysideprojs•7 天前•原帖

多年来，我一直想启动一个播客，采访那些在创作追求中充满好奇和热情的创作者。<p>我非常欢迎任何反馈和评分，如果你知道谁会是一个很好的嘉宾，请告诉我！

大学生活：从50年前到现在（2019年）

3 分•作者: zeristor•3 天前•原帖

《系统工程的潜规则》（1994）

3 分•作者: o4c•6 天前•原帖

再见，妈妈。

3 分•作者: reducesuffering•3 天前•原帖

展示HN：我使用Gemini 3在两周内将42本书转化为互动网页

3 分•作者: Rand_cat•6 天前•原帖

请咨询您的密码学家，了解上下文提交的AEAD是否适合您。

3 分•作者: nabla9•3 天前•原帖

研究表明，网络盗版可能会提升票房收入。

3 分•作者: gslin•3 天前•原帖

现代SID芯片替代品 [视频]

3 分•作者: vismit2000•3 天前•原帖

C语言中的闭包成本

3 分•作者: ingve•6 天前•原帖

苹果在Epic案件中败诉，未能推翻藐视法庭的裁决。

3 分•作者: samuel246•3 天前•原帖

展示HN：Nimbalyst，本地的所见即所得Markdown/模型编辑器，由Claude Code驱动

3 分•作者: wek•6 天前•原帖

你好，Hacker News。我们四个人在使用Claude Code时，发现通过迭代构建完整的上下文，并在工作中使用和更新该上下文，能够取得最佳效果。因此，我们开发了Nimbalyst，以最大化我们（以及你们）与AI迭代和构建上下文的能力。 Nimbalyst是一个本地的所见即所得（WYSIWYG）编辑器和会话管理器，你可以在其中与Claude Code一起迭代处理文档、图表、原型和代码。 Nimbalyst让你可以： - 在用户界面中充分利用Claude Code的强大功能 - 与Claude Code合作，编写和编辑所见即所得的Markdown，实时查看AI的修改（以红色/绿色标记），并进行批准 - 在标准Markdown中集成mermaid图表、文本、表格、原型和图像，以便于人类与Claude Code之间的上下文交流 - 与Claude Code一起对HTML原型进行迭代，注释原型，然后将其作为人类和Claude Code编程的上下文 - 将会话与文档关联，查找和恢复会话，将会话视为上下文，运行并行会话 - 在所有这些上下文中使用Claude Code进行编码，使用命令，查看git状态 Nimbalyst目前处于测试阶段，支持本地使用，并且是免费的。我们非常希望听到你的反馈。

上一页 1...15 16 17 18 19...102 下一页