手机版 | 登陆 | 注册 | 留言 | 设首页 | 加收藏
当前位置: 网站首页 > python教程 > 文章 当前位置: python教程 > 文章

python爬虫教程视频教程最新的python爬虫教程requests百度云网盘

时间:2022-05-10    点击: 次    来源:网络    作者:佚名 - 小 + 大

python爬虫教程视频教程最新的python爬虫教程requests百度云网盘


下载地址

https://share.weiyun.com/0UhC6msn


资料目录
30个小时搞定Python网络爬虫视频课程(全套详细版)
Python网络爬虫工程师系列培训视频课程(65集全)
廖雪峰商业爬虫(含课件、案例和练习)
零基础Python实战 四周实现爬虫网站
《Python 3网络爬虫开发实战 》崔庆才著.pdf
《Python网络爬虫从入门到实践》 庄培杰编著.pdf
Python 3爬虫、数据清洗与可视化实战_零一等编著.pdf
Python3网络爬虫数据采集 陶俊杰 翻译.pdf
Python爬虫开发与项目实战 范传辉 编著.pdf
Python爬虫大数据采集与挖掘-微课视频版 曹剑平 编著.pdf
python网络爬虫从入门到实践  唐松等.pdf
网络爬虫-Python和数据分析 王澎著.pdf
用Python写网络爬虫 李斌 翻译.pdf
自己动手写网络爬虫 罗刚等 编著.pdf
Python项目案例开发从入门到实战:爬虫、游戏和机器学习 by 郑秋生 夏敏捷


举例

Requests 请求常用设置
Requests 请求的相关设置如下:
设置请求头:headers={'xxx':'yyy'}
代理:proxies={'https':'xxx'}
超时(单位秒):timeout=15

Requests 处理返回结果
Requests 请求会返回一个 requests.models.Response 对象,可以通过调用表 3.2 中的字段获取响应信息。
表 3.2 可获取响应信息的相关字段
字 段  描 述
status_code  获取状态码
reason  状态信息
url  获取请求的 URL
content  获取 byte 类型的返回结果,相当于 urllib.urlopen().read
raw  获得原始的返回结果,请求里需要设置 stream=True
text
获取 str 类型的返回结果,会自动根据响应头部的字符编码进行解码;可以调用 r.encoding 获得编码方式,或者在调用 text 之前先用 r.encoding='编码'来设置编码类型,text 就会按照对应的编码进行解析json
解析序列化为 JSON 格式的数据,可以直接通过['xxx']获取数据。如果解析错误,则会抛出异常:
ValueError: No JSON object could be decoded
除此之外,还可以使用 headers 获得响应头,代码示例如下:
r = requests.get('http://gank.io/api/data/Android/50/1')
# 直接根据键获得值
print(r.headers.get('Date'))
# 遍历获得请求头里所有键值
for key, value in r.headers.items():
print(key + " : " + value)
如果想获取请求头信息,可以调用 r.request.headers。除此之外,还可调用
raise_for_status(),当响应码不是 200 时,会抛出 HTTPError 异常,可用于响应码校验。另外,由 Requests 发起的请求,当相应内容经过 gzip 或 deflate 压缩时,Requests 会自动解包,可以通过 content 获得 byte 方式的响应结果。

Requests 处理 Cookie
通过r.cookies即可获得RequestsCookieJar对象,其行为与字典类似;如果想带着Cookies去访问,可以在请求里添加 cookies={'xxx':'yyy'}参数;也可以通过 requests.cookies.
RequestsCookieJar()调用 set 方法进行构造,比如:
jar.set('gross_cookie', 'blech', domain='httpbin.org', path='/elsewhere')
# 遍历cookies:
for c in r.cookies:
print(c.name + ":" + c.value)
CookieJar 与字典间互转的代码示例如下:
# 字典 -> CookieJar
cookies = requests.utils.cookiejar_from_dict(cookie_dict, cookiejar=None, overwrite=True)
# CookieJar-> 字典
cookies = requests.utils.dict_from_cookiejar(r.cookies)

上一篇:python爬虫教程入门教程python爬虫教程csdn我要自学网 百度云

下一篇:没有了

推荐阅读
声明 | 联系我们 | 关于我们
备案ICP编号  |   QQ:2151239526  |  地址:北京市东城区  |  电话:16605168200  |