返回首页

一周热榜

3作者: saran-damm3 天前原帖
我开发了 depup,这是一个命令行工具,用于扫描 Python 依赖项、检查 PyPI 版本、评估升级影响,并支持持续集成工作流。<p>文档:<a href="https://saran-damm.github.io/depup/" rel="nofollow">https://saran-damm.github.io/depup/</a> 代码库:<a href="https://github.com/saran-damm/depup/" rel="nofollow">https://github.com/saran-damm/depup/</a>
3作者: kstonekuan3 天前原帖
Tambourine 是一个开源、完全可定制的语音听写系统,允许您控制语音转文本(STT)/自动语音识别(ASR)、大型语言模型(LLM)的格式和插入干净文本的提示,以便在任何应用中使用。 我在这方面已经花了几周时间进行开发。促使我开发这个项目的原因是希望拥有一个可定制的 Wispr Flow 版本,能够完全控制模型、格式和系统行为,而不是依赖一个黑箱。 Tambourine 是直接建立在 Pipecat 之上的,依赖于其模块化的语音代理框架。后端是一个本地的 Python 服务器,利用 Pipecat 将 STT 和 LLM 模型整合成一个单一的管道。这种模块化特性使得更换服务提供商、尝试不同的设置以及对语音 AI 进行精细控制变得简单。 我与朋友分享了一个早期版本,并在本地的 Claude Code 聚会上进行了展示。反馈非常积极,大家鼓励我更广泛地分享这个项目。 桌面应用是使用 Tauri 构建的。前端使用 TypeScript 编写,而 Tauri 层则使用 Rust 处理低级系统集成。这使得能够注册全局热键、管理音频设备,并在 Windows 和 macOS 上可靠地在光标处输入文本。 从高层次来看,Tambourine 为您的操作系统提供了一个通用的语音接口。您按下全局热键,讲话,格式化的文本会直接在光标处输入。它可以在电子邮件、文档、聊天应用、代码编辑器和终端中使用。 在底层,音频通过 WebRTC 从 TypeScript 前端流式传输到 Python 服务器。服务器使用可配置的 STT 提供商进行实时转录,然后将转录文本传递给一个 LLM,该模型去除填充词、添加标点,并应用自定义格式规则和个人词典。STT 和 LLM 提供商以及提示可以在不重启应用的情况下进行切换。 该项目仍在积极开发中。我正在处理边缘案例并完善用户体验,可能会有一些重大变更,但大部分核心功能已经运行良好,并已成为我日常工作流程的一部分。 我非常希望能得到反馈,特别是来自对语音作为接口未来感兴趣的朋友们。
3作者: qzcanoe3 天前原帖
PhotoToVideoAI 是一款基于人工智能的工具,可以将您的照片转换为动态视频。您只需上传一张照片和一个提示,约30秒后即可获得高质量的视频,分辨率高达1080p,时长为5或10秒。该工具专为内容创作者、营销人员和摄影师设计,欢迎反馈!
3作者: Noel046 天前原帖
<p><pre><code> 嗨,HN!我开发了 console.text() - 一个在特定代码路径在生产环境中执行时向你发送短信的工具。 这个想法来源于 Jason Goodison 的 YouTube 视频,讲述了微型SaaS产品。我在教程的泥潭中挣扎了几个月,所以我决定直接发布一些东西。 它的功能: npm install @holler2660/console-text const { init } = require("@holler2660/console-text"); init({ apiKey: 'ct_live_xxx' }); console.text('支付失败', { userId: '123' }); // → 短信将在 5-10 秒内到达 尝试一下: https://soorajdmg.github.io/Console-text/ 为什么选择这个而不是 Sentry/PagerDuty? 这些工具非常适合团队使用。而这个工具则是为独立开发者和副项目设计的,旨在提供简单明了的警报,而无需繁琐的设置。如果你知道 console.log(),你就已经知道如何使用它。</code></pre>
3作者: sillysideprojs7 天前原帖
多年来,我一直想启动一个播客,采访那些在创作追求中充满好奇和热情的创作者。<p>我非常欢迎任何反馈和评分,如果你知道谁会是一个很好的嘉宾,请告诉我!
3作者: wek6 天前原帖
你好,Hacker News。我们四个人在使用Claude Code时,发现通过迭代构建完整的上下文,并在工作中使用和更新该上下文,能够取得最佳效果。 因此,我们开发了Nimbalyst,以最大化我们(以及你们)与AI迭代和构建上下文的能力。 Nimbalyst是一个本地的所见即所得(WYSIWYG)编辑器和会话管理器,你可以在其中与Claude Code一起迭代处理文档、图表、原型和代码。 Nimbalyst让你可以: - 在用户界面中充分利用Claude Code的强大功能 - 与Claude Code合作,编写和编辑所见即所得的Markdown,实时查看AI的修改(以红色/绿色标记),并进行批准 - 在标准Markdown中集成mermaid图表、文本、表格、原型和图像,以便于人类与Claude Code之间的上下文交流 - 与Claude Code一起对HTML原型进行迭代,注释原型,然后将其作为人类和Claude Code编程的上下文 - 将会话与文档关联,查找和恢复会话,将会话视为上下文,运行并行会话 - 在所有这些上下文中使用Claude Code进行编码,使用命令,查看git状态 Nimbalyst目前处于测试阶段,支持本地使用,并且是免费的。我们非常希望听到你的反馈。