13作者: jellyotsiro24 天前原帖
嗨,HN, 我构建了一个开源的人工智能代理,它已经对整个爱泼斯坦文件进行了索引,并可以搜索大约1亿字的公开发布文档。 目标很简单:使大量杂乱的PDF和文本文件能够以精确的方式立即进行搜索,而不依赖于关键词搜索或冗长的提示。 它的功能包括: - 整个数据集已经被索引 - 你可以用自然语言提问 - 答案是有依据的,并包含对源文档的直接引用 - 支持精确文本查找和语义搜索 关于这些文件的讨论往往是零散的。这使得直接探索主要来源并验证主张成为可能,而无需手动翻阅成千上万的页面。 很高兴回答任何问题或深入讨论技术细节。 代码链接: [https://github.com/nozomio-labs/nia-epstein-ai](https://github.com/nozomio-labs/nia-epstein-ai)