返回首页
最新
大约一年前,我构建了一个ETL系统,用于从电子商务网站提取和处理产品数据,主要是补充品。该系统能够映射产品结构,自动收集数据,清理和分类信息,并通过API集成直接上传到Shopify。
该系统使用Python和Selenium进行数据提取,转换步骤主要集中在数据清理、丰富和产品分类上。它被设计为模块化,易于扩展到新的网站。
我暂停了开发,但正在考虑重新启动。欢迎反馈或建议。
代码库: [https://github.com/GustavoFortti/products-crawler](https://github.com/GustavoFortti/products-crawler)