3作者: Adam_SDDk大约 1 个月前原帖
嘿,我一直在寻找高质量的CC0数据方面遇到问题。因此,我想分享我生成和收集的数据,并将其免费发布。所有数据都可以在 neurvance.com 上找到,其中一部分也在 <a href="https:&#x2F;&#x2F;huggingface.co&#x2F;Neurvance" rel="nofollow">https:&#x2F;&#x2F;huggingface.co&#x2F;Neurvance</a> 上。你还可以购买合规文件,这样当欧盟需要根据第10条提供证据以证明训练数据的来源时,你就可以做到这一点,但这个文件是需要付费的,这也是我从中获利的方式!
2作者: CShorten大约 1 个月前原帖
向量搜索看起来很简单,直到你面临生产规模的挑战。 我非常激动地与大家分享Weaviate播客的新一期,邀请到了来自@bookingcom的Başak,讨论生产规模的向量搜索、RAG和自主智能体(agentic AI)! 播客开始时讨论了Booking在采用向量搜索方面的转折点以及新兴的应用案例。 仅仅是合作伙伴与客户之间的消息交流量就令人震惊!每天有近250,000次这样的交流,而Booking的智能助手已经在帮助处理其中的数万条信息! Başak描述了团队如何应对不断增加的规模和工作负载的复杂性。他们对Weaviate进行了全面评估,使用了1亿个嵌入,并进行了许多常见近似最近邻(ANN)基准测试中常常遗漏的测试。这包括过滤向量搜索、支持多线程并发,以及同时进行读写的测试。 播客最后,Başak分享了她的职业旅程以及对旅行代理人的看法! YouTube: https://www.youtube.com/watch?v=O9edM9ZS_FQ Spotify: https://spotifycreators-web.app.link/e/8tc6Dyb7e3b