5作者: amber_raza大约 1 个月前原帖
嗨,HN, 我是一名独立开发者,正在构建一个临床搜索引擎,以帮助我的妻子(住院医师)和她的同事们。 问题:目前的工具(如 UpToDate/OpenEvidence)价格昂贵、速度慢,或者充斥着越来越多的药企广告。 解决方案:我构建了 Evidex,旨在成为一个干净、以隐私为先的替代品。搜索演示(GIF):[https://imgur.com/a/zoUvINt](https://imgur.com/a/zoUvINt) 技术架构(基于搜索的 RAG):我没有使用传统的预索引向量数据库(如 Pinecone),因为它可能提供过时的数据,而是实现了实时 RAG 模式: 协调器:一个 Node.js 后端对查询进行“智能路由”(正则表达式/关键词分析),决定调用哪些外部 API(PubMed、Europe PMC、OpenAlex 或 ClinicalTrials.gov)。 检索:它在运行时并行请求这些 API,以获取大约 15 篇摘要。 本地数据:临床指南存储在本地的 SQLite 数据库中,通过全文搜索(FTS)进行检索,确保医学术语的精确匹配。 推理:我使用 Gemini 2.5 Flash 处理连接的摘要。巨大的上下文窗口使我能够输入不同的搜索结果,并强制严格的引用映射,而不会出现延迟瓶颈。 工作流工具(“集成”):我还构建了一个“推理层”,以处理复杂的病历(案例模式)和起草文档(SOAP 笔记)。案例模式演示(GIF):[https://imgur.com/a/h01Zgkx](https://imgur.com/a/h01Zgkx) 笔记生成演示(GIF):[https://imgur.com/a/DI1S2Y0](https://imgur.com/a/DI1S2Y0) 为什么不使用向量数据库?在医学领域,“新鲜度”至关重要。如果今天有新的试验发布,预索引的向量存储可能会错过它。我的实时方法确保答案中包含今天发布的论文。 商业模式:临床搜索是免费的。我计划通过向医院管理员出售账单自动化工具来实现盈利。 反馈请求:我希望能收到关于检索延迟(请求实时 API 的速度比向量查找慢)和合成答案准确性的反馈。