返回首页
最新
嗨,HN,
我开发了一款 macOS 桌面应用,让你可以完全在本地与文档进行聊天。
没有云服务,没有 API 密钥,没有数据离开你的机器。所有功能都在 Apple Silicon 上离线运行,使用 GGUF 模型和 llama.cpp。
它的功能包括:
- 上传 PDF、文本文件和图像
- 对图像和扫描的 PDF 进行光学字符识别(OCR)
- 本地嵌入和检索(RAG)
- 使用本地大语言模型(LLM)与文档聊天
- 模型在首次运行时下载并存储在本地
技术栈:
- Electron(前端)
- Python 后端打包为本地二进制文件
- llama.cpp + GGUF(目前使用 Gemma / Mistral 类模型)
- SentenceTransformers 用于嵌入
- FAISS 用于向量搜索
- 完全在设备上运行(CPU / Metal)
我为什么要开发这个:
我想要一个以隐私为优先的替代方案来替代云文档聊天工具。将完整的本地 LLM + OCR + RAG 流水线打包成一个单一的 macOS 应用,结果比预期要困难得多(Gatekeeper、PyInstaller、动态库、模型大小等)。
下载链接:
GitHub 发布(macOS Apple Silicon):
[https://github.com/navid72m/chatbot/releases/tag/v.0.1.2](https://github.com/navid72m/chatbot/releases/tag/v.0.1.2)
关于 macOS 安全性的说明:
由于该应用尚未签名,macOS 可能会在首次启动时阻止它。
你可以运行以下命令:
`xattr -rd com.apple.quarantine "/Applications/Document Chat.app"`
我非常希望能收到关于以下方面的反馈:
- 文档聊天的用户体验(UX)
- 模型选择 / 性能
- 其他人如何在桌面上处理本地 RAG
欢迎提出技术问题。
这是一个围绕代码灵感服装的小型个人项目。
我作为开发者工作了很长时间,但从未拥有过一件开发者T恤。我总觉得大多数T恤设计太过喧闹或搞笑,不适合日常穿着,因此最终停止了寻找。
最近自由职业工作相对清闲,我终于花了一些时间在一个我心中酝酿多年的想法上——看看能否制作出我真正想穿的那种服装。
从技术角度来看,这个项目相对简单:使用Shopify作为店面,Printful负责按需印刷和履行订单。现在只有我一个人在这个项目上工作,同时还要兼顾其他事务。
我希望能在几个方面获得反馈:这个想法是否引起共鸣,大家对目前选择的编程语言有什么看法,是否还有其他语言是你们期待或希望看到的,以及——如果这个概念合理——是否有人有使用Shopify + Printful的经验(无论好坏)。如果有兴趣,我还有更长的语言列表。
链接:<a href="https://slashstar.store" rel="nofollow">https://slashstar.store</a>
感谢您抽出时间来查看。
我尝试联系支持团队和各种反馈渠道,但都没有成功。我知道这种帖子在HN上效果不好,但我没有其他地方可以尝试,所以决定试一试。
当你从手机应用分享一个Reel时,它会生成类似这样的链接:
https://www.instagram.com/reel/DTAcc_gE7J7/(追踪参数已移除)
当你在网页上打开这个链接时(你必须先登录,抱歉),它根本无法正常工作。
它会:首先重定向到 `/reels/`(多了一个s,通常这两个都应该能工作),然后要么
在一个白色页面上卡住,出于某种原因让我的CPU风扇疯狂运转;
要么放弃,直接重定向到你的Reel时间线,即一个随机视频,而不是 `/DTAcc_gE7J7/`。
并不是所有Reel链接都会出现这个问题,但相当数量的链接,甚至大多数链接都会这样。
唯一的解决办法是手动将链接更改为 `/p/{post_id}` 并作为帖子打开(这有一个不同且更糟糕的用户界面,因为视频画布非常小)。
这个问题至少已经存在几周了,我在Twitter上也看到有人讨论过。但时间已经过去,仍然没有修复的迹象。
嗨,HN / YC
我刚刚发布了Speechable——一个免费的开源AI文本转语音解决方案,专为WordPress设计,完全在浏览器中运行,无需API密钥、付费服务或服务器基础设施。
我在这里写了详细介绍:
[https://tanishmittal.com/speechable-ai-text-to-speech-for-wordpress-websites](https://tanishmittal.com/speechable-ai-text-to-speech-for-wordpress-websites)
它的功能:
- 为WordPress帖子添加原生音频播放器
- 使用基于浏览器的神经TTS
- 支持12种以上语言
- 提供多种声音预设和效果
- 允许访客下载音频
- 与旁白同步高亮显示单词
我为什么要开发它:
大多数TTS插件依赖于昂贵的API、外部服务器和数据共享。我希望:
- 以隐私为优先的体验
- 无需重复费用
- 高质量的语音输出
- 适用于任何WordPress网站的简单安装
试试看:
代码库和文档:[https://github.com/tansihmittal/speechable](https://github.com/tansihmittal/speechable)
非常希望得到反馈——特别是关于:
- 用户体验中的痛点
- 在真实博客中的表现
- 您认为应该支持的边缘案例
如果您尝试了它或用它构建了一些酷炫的东西,请在X上喊我:@glowdopera
谢谢!