返回首页

一周热榜

1作者: ambitious_potat大约 4 小时前原帖
我为新加坡法律构建了一个“三级故障转移”RAG,并根据您的反馈重新编写了逻辑。 大家好! 我是一名学生开发者。最近,我创建了“探索新加坡”,这是一个基于RAG的搜索引擎,抓取了大约20,000页新加坡政府法案和法律。 我最近发布了最小可行产品(MVP),并收到了关于幻觉和查询深度的一些严厉但重要的反馈。我采纳了这些反馈,专注于改进,并刚刚发布了版本2。 以下是我如何将系统从基本的RAG升级到生产级别的。 设计与用户界面 我旨在避免一个乏味的政府网站。 设计:深受苹果极简风格的启发。 技术:自定义前端与Python后端交互。 版本2的工程大改造 社区对我提出了三个主要挑战。以下是我如何解决这些问题的: 1. “个性”修复 问题:我使用了一个“三级故障转移”系统,三个模型作为备份。当主模型失败时,备份模型的声音完全不同。 解决方案:我添加了动态系统指令。现在,如果后端切换到模型B,它会使用专为模型B特性设计的特定提示,使其模仿主模型的结构和语调。用户根本不会注意到变化。 2. “深度搜索”修复 问题:对“创业”的简单语义搜索会遗漏与“税务”或“劳动”法相关的法律。 解决方案:我实现了多查询检索(MQR)。一个大型语言模型(LLM)现在会拦截您的查询。它将查询分解为子意图(例如,“商业注册”、“公司税”、“就业规则”)。它同时搜索所有这些子意图并结合结果。 结果:提供了更丰富、具有上下文意识的答案。 3. “幻觉”修复 问题:垃圾进,垃圾出。如果FAISS检索到一个不良文档,LLM就会生成不准确的信息。 解决方案:我添加了一个交叉编码器重新排序层。 步骤1:FAISS获取前10个结果。 步骤2:一个专门的交叉编码器模型评估它们的相关性。 步骤3:在它们到达聊天LLM之前,移除不相关的部分。 技术栈 嵌入:BGE-M3(本地运行) 向量数据库:FAISS 后端:Python + 自定义三级模型故障转移 逻辑:多查询 + 重新排序(版本2中新功能) 试用一下 我仍在学习中。非常希望听到您对新逻辑的看法。 在线演示: [https://adityaprasad-sudo.github.io/Explore-Singapore/](https://adityaprasad-sudo.github.io/Explore-Singapore/) GitHub仓库: [https://github.com/adityaprasad-sudo/Explore-Singapore](https://github.com/adityaprasad-sudo/Explore-Singapore) 欢迎反馈,特别是关于故障转移速度的意见!
1作者: devavinoth12大约 3 小时前原帖
嗨,HN, 我刚刚推出了Fitspire,这是一款围绕一个理念构建的小型iOS应用:有效的锻炼不需要45到60分钟。 作为一名开发者,和许多长时间工作的人一样,我发现很难坚持传统的健身计划。大多数应用要么过于激烈,要么耗时太长,或者功能过于复杂。 因此,我围绕以下几点构建了Fitspire: 1. 结构化的5分钟锻炼 2. 简约、无干扰的用户界面 3. 简单的进度跟踪(连续锻炼、报告、历史记录) 4. 启动时不收取订阅费(目前完全免费) 我们的目标不是取代全面的健身训练,而是降低开始锻炼的门槛。 技术栈: 1. 使用React Native构建 2. 后端使用Firebase 3. 通过App Store发布iOS版本 我主要希望得到以下方面的反馈: 5分钟的定位是否合理? 什么能让这个应用真正吸引用户? 健身应用通常在哪些方面在用户留存上失败? 非常感谢任何诚实的反馈,尤其是批评意见。 谢谢。
1作者: takmak007大约 2 小时前原帖
嗨,HN。我是Akash。 我开始这个项目是因为个人经历:我家里有一个严重的疾病,尽管有多年的实验室报告、处方和扫描结果,但直到很晚才被诊断出来。数据是存在的,但散落在各个门户和PDF文件中,没有人将其整合在一起进行长期观察。最后,我不得不把数据复制到电子表格中,只是为了看看是否有什么异常。 这个经历让我意识到一个显而易见的事实:医学是一个长期的过程,但医疗软件却将每次就诊视为一个独立的事件。 这个项目是一个纵向健康记录系统,将来自不同来源的医疗数据整合成一个单一的、按时间顺序排列的历史记录。患者可以上传来自任何提供者的实验室报告、处方和扫描结果,系统会将其组织起来,使得趋势和变化更容易回顾。在临床方面,它作为一个轻量级记录系统,专注于门诊和诊断工作流程,侧重于历史回顾,而不是账单或复杂的医院流程。 与传统的电子健康记录(EHR)不同的是,我们强调连续性和可携带性。记录是围绕患者的时间线构建的,而不是单一医院或就诊。我们在后台对混乱的现实输入进行规范化,并将其结构化,以便实验室、药物和诊断可以在时间上一起查看。 这个系统目前已经上线,约有25000名患者和一些医院在使用。我们仍在学习纵向视图在实际应用中最有帮助的地方,以及哪些地方效果不佳。 你可以在这里尝试:<a href="https:&#x2F;&#x2F;myaether.live" rel="nofollow">https:&#x2F;&#x2F;myaether.live</a> (这里有一个上传记录和查看时间线的演示流程。) 欢迎提问,特别是关于数据规范化、隐私权衡,或者为什么这个在医疗行业之前没有很好地运作的原因。