获取网址数据
正则提取数据
保存文本数据
项目思路解析找到自己需要的文库资料这篇文章主要介绍的如何处理复制限制的问题在做一个爬虫项目之前首先要知道数据的来源,以及数据的加载方式当前网页数据为加载得到的数据需要通过抓包的方式提取对应数据打卡抓包工具进行数据找寻数据来自一个json文件保存的数据采c字段里面找到目标数据之后在找寻数据资源地址的加载方式要知道数据是从哪里加载过来的通过搜索关键字的方式找到数据的来源通过搜索到数据其实是前端页面自带的加载之后的数据需要从文章页面提取出所有的数据下载地址对文章首页发送网络请求通过正则的方式提取出所有的数据下载地址defget_url(self):url="