通用
库
私有化部署
cookiecutter项目
https://gitee.com/luzhenxiong/cookiecutter-scrapy
分批处理,持久化记录爬取的页码,每批爬取一页数据,利用Scrapy内置的JOBDIR配置实现
参见
Keeping persistent state between batches
决定是否使用playwright请求网址