返回首页
一周热榜
PhotoToVideoAI 是一款基于人工智能的工具,可以将您的照片转换为动态视频。您只需上传一张照片和一个提示,约30秒后即可获得高质量的视频,分辨率高达1080p,时长为5或10秒。该工具专为内容创作者、营销人员和摄影师设计,欢迎反馈!
<p><pre><code> 嗨,HN!我开发了 console.text() - 一个在特定代码路径在生产环境中执行时向你发送短信的工具。
这个想法来源于 Jason Goodison 的 YouTube 视频,讲述了微型SaaS产品。我在教程的泥潭中挣扎了几个月,所以我决定直接发布一些东西。
它的功能:
npm install @holler2660/console-text
const { init } = require("@holler2660/console-text");
init({ apiKey: 'ct_live_xxx' });
console.text('支付失败', { userId: '123' });
// → 短信将在 5-10 秒内到达
尝试一下: https://soorajdmg.github.io/Console-text/
为什么选择这个而不是 Sentry/PagerDuty?
这些工具非常适合团队使用。而这个工具则是为独立开发者和副项目设计的,旨在提供简单明了的警报,而无需繁琐的设置。如果你知道 console.log(),你就已经知道如何使用它。</code></pre>
Tambourine 是一个开源、完全可定制的语音听写系统,允许您控制语音转文本(STT)/自动语音识别(ASR)、大型语言模型(LLM)的格式和插入干净文本的提示,以便在任何应用中使用。
我在这方面已经花了几周时间进行开发。促使我开发这个项目的原因是希望拥有一个可定制的 Wispr Flow 版本,能够完全控制模型、格式和系统行为,而不是依赖一个黑箱。
Tambourine 是直接建立在 Pipecat 之上的,依赖于其模块化的语音代理框架。后端是一个本地的 Python 服务器,利用 Pipecat 将 STT 和 LLM 模型整合成一个单一的管道。这种模块化特性使得更换服务提供商、尝试不同的设置以及对语音 AI 进行精细控制变得简单。
我与朋友分享了一个早期版本,并在本地的 Claude Code 聚会上进行了展示。反馈非常积极,大家鼓励我更广泛地分享这个项目。
桌面应用是使用 Tauri 构建的。前端使用 TypeScript 编写,而 Tauri 层则使用 Rust 处理低级系统集成。这使得能够注册全局热键、管理音频设备,并在 Windows 和 macOS 上可靠地在光标处输入文本。
从高层次来看,Tambourine 为您的操作系统提供了一个通用的语音接口。您按下全局热键,讲话,格式化的文本会直接在光标处输入。它可以在电子邮件、文档、聊天应用、代码编辑器和终端中使用。
在底层,音频通过 WebRTC 从 TypeScript 前端流式传输到 Python 服务器。服务器使用可配置的 STT 提供商进行实时转录,然后将转录文本传递给一个 LLM,该模型去除填充词、添加标点,并应用自定义格式规则和个人词典。STT 和 LLM 提供商以及提示可以在不重启应用的情况下进行切换。
该项目仍在积极开发中。我正在处理边缘案例并完善用户体验,可能会有一些重大变更,但大部分核心功能已经运行良好,并已成为我日常工作流程的一部分。
我非常希望能得到反馈,特别是来自对语音作为接口未来感兴趣的朋友们。
我开发了 depup,这是一个命令行工具,用于扫描 Python 依赖项、检查 PyPI 版本、评估升级影响,并支持持续集成工作流。<p>文档:<a href="https://saran-damm.github.io/depup/" rel="nofollow">https://saran-damm.github.io/depup/</a>
代码库:<a href="https://github.com/saran-damm/depup/" rel="nofollow">https://github.com/saran-damm/depup/</a>
你好,Hacker News。我们四个人在使用Claude Code时,发现通过迭代构建完整的上下文,并在工作中使用和更新该上下文,能够取得最佳效果。
因此,我们开发了Nimbalyst,以最大化我们(以及你们)与AI迭代和构建上下文的能力。
Nimbalyst是一个本地的所见即所得(WYSIWYG)编辑器和会话管理器,你可以在其中与Claude Code一起迭代处理文档、图表、原型和代码。
Nimbalyst让你可以:
- 在用户界面中充分利用Claude Code的强大功能
- 与Claude Code合作,编写和编辑所见即所得的Markdown,实时查看AI的修改(以红色/绿色标记),并进行批准
- 在标准Markdown中集成mermaid图表、文本、表格、原型和图像,以便于人类与Claude Code之间的上下文交流
- 与Claude Code一起对HTML原型进行迭代,注释原型,然后将其作为人类和Claude Code编程的上下文
- 将会话与文档关联,查找和恢复会话,将会话视为上下文,运行并行会话
- 在所有这些上下文中使用Claude Code进行编码,使用命令,查看git状态
Nimbalyst目前处于测试阶段,支持本地使用,并且是免费的。我们非常希望听到你的反馈。