当前位置：网站首页 > python教程 > 文章当前位置： python教程 > 文章

python爬虫教程视频教程最新的python爬虫教程requests百度云网盘

时间：2022-05-10 点击：次来源：网络作者：佚名 - 小 + 大

python爬虫教程视频教程最新的python爬虫教程requests百度云网盘

下载地址

https://share.weiyun.com/0UhC6msn

资料目录
30个小时搞定Python网络爬虫视频课程（全套详细版）
Python网络爬虫工程师系列培训视频课程（65集全）
廖雪峰商业爬虫（含课件、案例和练习）
零基础Python实战四周实现爬虫网站
《Python 3网络爬虫开发实战》崔庆才著.pdf
《Python网络爬虫从入门到实践》庄培杰编著.pdf
Python 3爬虫、数据清洗与可视化实战_零一等编著.pdf
Python3网络爬虫数据采集陶俊杰翻译.pdf
Python爬虫开发与项目实战范传辉编著.pdf
Python爬虫大数据采集与挖掘-微课视频版曹剑平编著.pdf
python网络爬虫从入门到实践唐松等.pdf
网络爬虫－Python和数据分析王澎著.pdf
用Python写网络爬虫李斌翻译.pdf
自己动手写网络爬虫罗刚等编著.pdf
Python项目案例开发从入门到实战：爬虫、游戏和机器学习 by 郑秋生夏敏捷

举例

Requests 请求常用设置
Requests 请求的相关设置如下：
设置请求头：headers={'xxx':'yyy'}
代理：proxies={'https':'xxx'}
超时(单位秒)：timeout=15

Requests 处理返回结果
Requests 请求会返回一个 requests.models.Response 对象，可以通过调用表 3.2 中的字段获取响应信息。
表 3.2 可获取响应信息的相关字段
字段描述
status_code 获取状态码
reason 状态信息
url 获取请求的 URL
content 获取 byte 类型的返回结果，相当于 urllib.urlopen().read
raw 获得原始的返回结果，请求里需要设置 stream=True
text
获取 str 类型的返回结果，会自动根据响应头部的字符编码进行解码；可以调用 r.encoding 获得编码方式，或者在调用 text 之前先用 r.encoding='编码'来设置编码类型，text 就会按照对应的编码进行解析json
解析序列化为 JSON 格式的数据，可以直接通过['xxx']获取数据。如果解析错误，则会抛出异常：
ValueError: No JSON object could be decoded
除此之外，还可以使用 headers 获得响应头，代码示例如下：
r = requests.get('http://gank.io/api/data/Android/50/1')
# 直接根据键获得值
print(r.headers.get('Date'))
# 遍历获得请求头里所有键值
for key, value in r.headers.items():
print(key + " : " + value)
如果想获取请求头信息，可以调用 r.request.headers。除此之外，还可调用
raise_for_status()，当响应码不是 200 时，会抛出 HTTPError 异常，可用于响应码校验。另外，由 Requests 发起的请求，当相应内容经过 gzip 或 deflate 压缩时，Requests 会自动解包，可以通过 content 获得 byte 方式的响应结果。

Requests 处理 Cookie
通过r.cookies即可获得RequestsCookieJar对象，其行为与字典类似；如果想带着Cookies去访问，可以在请求里添加 cookies={'xxx':'yyy'}参数；也可以通过 requests.cookies.
RequestsCookieJar()调用 set 方法进行构造，比如：
jar.set('gross_cookie', 'blech', domain='httpbin.org', path='/elsewhere')
# 遍历cookies：
for c in r.cookies:
print(c.name + ":" + c.value)
CookieJar 与字典间互转的代码示例如下：
# 字典 -> CookieJar
cookies = requests.utils.cookiejar_from_dict(cookie_dict, cookiejar=None, overwrite=True)
# CookieJar-> 字典
cookies = requests.utils.dict_from_cookiejar(r.cookies)

上一篇：python爬虫教程入门教程python爬虫教程csdn我要自学网百度云

下一篇：没有了