3作者: yanaimngvov6 个月前原帖
嘿,HN, 和你们中的许多人一样,我最近一直在构建RAG管道,但在第一步就遇到了瓶颈:从PDF中获取干净、结构化的Markdown。 我发现自己陷入了“环境地狱”的循环——不断创建不同的Conda环境来测试Marker、PP-StructureV3和MinerU,只是为了看看哪个模型在特定论文或财务报告上效果最好。这真是一个巨大的时间浪费。静态排行榜并没有太大帮助,因为它们无法告诉你某个模型在你特定的、杂乱的文档上表现如何。 因此,我构建了我希望拥有的工具。这是一个我称之为“OCR竞技场”的简单网络工具。 你可以在这里试用: [https://fast360.xyz](https://fast360.xyz) 这个想法很简单:上传一个文档,从7个领先的开源模型中选择,然后它会并行运行所有模型,并将结果并排显示。目标是让你在一分钟内从“我该用哪个解析器?”转变为获得最佳的Markdown。 这个工具完全免费,我确保不需要登录/注册,你可以毫无障碍地试用。这里有一个工作流程的快速GIF: [https://github.com/shijincai/fast360/blob/main/nologin.gif](https://github.com/shijincai/fast360/blob/main/nologin.gif) 技术栈是一个相当标准的设置:前端使用Next.js/React,后端是一个充当BFF的Node.js/Express,Python服务通过Redis/BullMQ队列管理模型执行。 这是一个网络服务,而不是一个开源项目,但我已经建立了一个公共的GitHub仓库,作为信息中心,跟踪社区反馈,并分享更多技术信息。你可以在这里找到它: GitHub: [https://github.com/shijincai/fast360](https://github.com/shijincai/fast360) 我构建这个工具是为了自己解决问题,但我希望它也能对你们中的一些人有用。我会在这里待一整天,回答任何问题并倾听你们的想法。
1作者: novoreorx6 个月前原帖
展示HN:ASCII树编辑器 我创建了一个基于网页的ASCII文件目录树编辑器,名为asciitreeman。它旨在简化对tree命令输出的编辑和重组。 您可以在这里试用: [https://reorx.github.io/asciitreeman/](https://reorx.github.io/asciitreeman/) 源代码托管在GitHub上: [https://github.com/reorx/asciitreeman](https://github.com/reorx/asciitreeman) 一些主要功能包括:可视化树形编辑,类似拖放的操作,实时同步,修改会立即反映在ASCII输出中,导航的键盘快捷键(J/K或方向键),以及自动将您的工作保存到本地存储。 有趣的是,我使用Claude Code在很短的时间内“振动编码”了这个项目。这是一次有趣的AI辅助开发实验。对于那些对这个过程感兴趣的人,我在源代码中包含了我使用的提示和规格。您可以在仓库中的spec.md和CLAUDE.md文件中查看它们。 希望您觉得它有用!
1作者: iatemykindle6 个月前原帖
我正在寻找一个应用程序,让我在美国的女儿能和她在中国的祖父母交流。我的女儿只有4岁,只会说英语,而她的祖父母只会说中文(普通话和粤语)。他们对科技不是很熟悉,所以我们主要通过微信进行视频通话(用非常简单的中英文交流,显得有些尴尬)。 如果有人有推荐的可以跨越防火墙的应用程序,我将非常感激!
3作者: lihaciudaniel6 个月前原帖
必要条件并不特殊 1. 熟悉技术,能够使用Linux并使用终端。 2. 在黑客技术方面比我更先进,我在寻找可以学习的人。 3. 如果你是俄罗斯人,那就更好了,因为我离俄罗斯很近,也许可以指导我了解俄罗斯的技术:Telegram、VK,甚至解释一下Yandex。 非常感谢!