1作者: n8大约 1 个月前原帖
我开发了Crit,这是一款命令行工具,能够让你从iOS模拟器中捕获屏幕截图,标记出问题所在,并向任何编码代理提供结构化反馈。 你只需: - `crit capture` — 截取你的应用屏幕截图 - `crit serve` — 在浏览器中查看,点击标记错误并添加评论 告诉你的代理:“查看 .crit 并修复每个问题”。 它会将带注释的截图和JSON文件保存到 `.crit/` 文件夹中。可以与Claude Code、Cursor、Codex、Gemini等任何能够读取图像的工具配合使用。无需插件、无需MCP、无需依赖。 需要macOS和Xcode。尚不支持Android。 代码库: [https://github.com/natethegreat/crit](https://github.com/natethegreat/crit)
2作者: digitalofen大约 1 个月前原帖
嗨,HN, 我一直在实验将文件转换尽可能多地推向浏览器的可行性。去年,我尝试将 LibreOffice 无头模式编译为 WASM。我能得到的最小构建大约是 150MB——仅仅为了将 DOCX 转换为 PDF,这个体积实在太大了。于是我转向了一种混合的方法。 如今,大约 90% 的转换是在客户端使用 WASM 进行的(FFmpeg、PDF/图像工具、电子表格等)。较重的边缘案例则回退到一个小型服务器管道(LibreOffice、Pandoc、Poppler)。 主要的挑战并不在于库本身,而在于: - 浏览器的内存限制 - 处理大文件时不冻结用户界面 - 仅在需要时懒加载大约 30MB 的 WASM - Safari 与 Chromium 行为差异 FFmpeg.wasm 的运行速度大约是原生速度的 10% 到 20%。对于小型和中型文件来说是可以接受的,但对于大型媒体文件就不太合适了。我还尝试在浏览器中使用多线程的 FFmpeg,但还没有找到稳定的设置。 我很好奇其他人如何看待客户端处理与完全服务器端管道之间的权衡。 → anythingconverter.com
25作者: cpcloud大约 1 个月前原帖
micasa 是一个终端用户界面,帮助你在一个 SQLite 文件中跟踪家庭事务。没有云存储,没有账户,也没有订阅。可以通过 cp 进行备份。 我之所以开发它,是因为我厌倦了在笔记应用中丢失所有信息,以及那些“我会记得的”承诺。比如,我什么时候需要清洁洗碗机的过滤器?对后院进行全面翻修的最佳报价是多少?哎呀,发现修边条后面有些霉菌,需要尽快处理。这类事情。 我制作 micasa 的另一个原因是希望构建一个(希望有用的)低风险个人项目,代码完全由 AI 编写。我仍然会审查代码并点击合并按钮,但 99% 的编程工作是由一个代理完成的。 以下是我认为值得一试的一些特点: - Vim 风格的模态用户界面。浏览模式用于浏览,编辑模式用于修改。多列排序,模糊跳转到列,固定和过滤行,隐藏不需要的列,深入相关记录(例如项目的报价)。设计的许多精神和一些实际设计选择都受到 VisiData 的启发。你也应该去看看它。 - 本地 LLM 聊天。绝对是个噱头,但我试图预防那种“是的,但它能 AI 吗?”的对话。这是一个可选功能,你可以选择假装它不存在。所有功能在没有它的情况下也能正常工作。 - 单文件 SQLite 架构。文档附件(手册、收据、照片)作为 BLOB 存储在同一个 SQLite 数据库中。一个文件就是整个应用的状态。如果你认为这无法扩展,你是对的。不过,操作起来非常简单。 - 纯 Go,零 CGO。基于 Charmbracelet 构建 TUI,使用 GORM 和 go-sqlite 作为数据库。Charm 制作的 TUI 非常不错,而这是我第一次使用它。 可以用示例数据试试: ```bash go install github.com/cpcloud/micasa/cmd/micasa@latest && micasa --demo ``` 如果你疯了,也可以运行 `micasa --demo --years 1000` 来生成 1000 年的演示数据。不确定哪个房子能撑那么久,但随便你。
1作者: josiahsrc大约 1 个月前原帖
嗨,HN,我是Josiah。我们喜欢语音输入,但希望有一个开源版本,以便于透明性、隐私保护,以及让每个人都能参与。因此,我们开发了Voquill,这是一个开源的替代方案,类似于WisprFlow、Monologue和Willow。 它可以让你在任何桌面应用程序中进行语音输入。只需按下热键,开始说话,文本就会被插入。你可以在本地运行Whisper,使用我们的服务器,或者连接任何你想要的提供商(如OpenAI、Claude、Groq、OpenRouter等)。你可以完全控制你的数据去向。 该软件支持Windows、macOS和Linux。它是开源的,采用AGPLv3许可证,使用Tauri和Rust构建。我们也在开发移动应用(Flutter)。 要尝试它:从代码库或voquill.com下载。在首次启动时点击“本地设置”。希望你喜欢它!