3作者: elias_t3 个月前原帖
几个月前,我正在开发一个航班搜索引擎,计划将宠物运输费用纳入其中(我知道一些费用,但将它们存储并在用户界面中进行计算会更好)。在收集几家航空公司的宠物定价时,我发现很难以统一格式提取数据,且避免出现虚假的数值。 就在那时,我想到:如果我使用多个大型语言模型(LLM),并选择最常见的响应来提高准确性会怎么样? 这个想法最终演变成了这个新项目。您只需提供您的文档、一个SQLModel架构、一个LLM提供者,以及您希望提取的内容,Extrai会处理剩下的工作,包括之后将数据存储到数据库中。 此外,还有一些其他功能,比如基于您的文档生成SQLModel、层次提取以更高效地管理嵌套对象,以及内置分析功能。 欢迎反馈,因为这仍然是一个正在进行中的项目! 我为对托管解决方案感兴趣的人建立了一个着陆页(我在其中也玩得很开心,使用了threeJS!) 请告诉我您的想法。 着陆页:extrai.xyz GitHub: [https://github.com/Telsho/Extrai](https://github.com/Telsho/Extrai)