当前位置：网站首页 > python教程 > 文章当前位置： python教程 > 文章

廖雪峰python教程实战3怎么样廖雪峰python教程官网免费下载

时间：2022-05-07 点击：次来源：网络作者：佚名 - 小 + 大

廖雪峰python教程实战3怎么样廖雪峰python教程官网免费下载

下载地址

https://share.weiyun.com/RS9A6Xk6

资料目录

廖雪峰python视频教程1 爬虫的基本框架及知识（day1-day15）
廖雪峰python视频教程2 scapy框架及爬虫进阶（day16-day20）
廖雪峰python视频教程3 爬虫高级知识及就业培训（day21-day28）
廖雪峰python教程官网doc
廖雪峰 2018年官方最新Python3教程（一）pdf
廖雪峰 2018官方Python3教程（二）pdf
廖雪峰2018官方Python3教程（三）pdf
廖雪峰python学习笔记（入门+进阶）.doc
Python3高级教程（开课吧）pdf
Python3零基础教程（开课吧）pdf
利用Python进行数据分析(中文版)pdf
廖雪峰商业爬虫案例
廖雪峰商业爬虫课件
廖雪峰商业爬虫练习答案
爬虫第一节-爬虫第十四节
Python爬虫预习书籍
python环境和pychram

举例

Cookie 是某些网站为了辨别用户身份、进行 session 跟踪而存储在用户本地终端上的数据（通常经过加密），比如有些页面你在登录前是无法访问的，登录成功会给你分配 Cookie，然后带着 Cookie 去请求页面才能正常访问。
使用 http.cookiejar 这个模块可以获取 Cookie，实现模拟登录。该模块的主要对象（父类→子类）为 CookieJar→FileCookieJar→MozillaCookieJar 与 LWPCookieJar，示例代码如下：
# ============ 获得Cookie ============
# 1.实例化CookieJar对象
cookie = cookiejar.CookieJar()
# 2.创建Cookie处理器
handler = urllib.request.HTTPCookieProcessor(cookie)
# 3.通过CookieHandler创建opener
opener = urllib.request.build_opener(handler)
# 4.打开网页
resp = opener.open("http://www.zhbit.com")
for i in cookie:
print("Name = %s" % i.name)
print("Name = %s" % i.value)
# ============ 保存Cookie到文件 ============
# 1.用于保存Cookie的文件
cookie_file = "cookie.txt"
# 2.创建MozillaCookieJar对象保存Cookie
cookie = cookiejar.MozillaCookieJar(cookie_file)
# 3.创建Cookie处理器
handler = urllib.request.HTTPCookieProcessor(cookie)
# 4.通过CookieHandler创建opener
opener = urllib.request.build_opener(handler)
# 5.打开网页
resp = opener.open("http://www.baidu.com")
# 6.保存Cookie到文件中，参数依次是:
# ignore_discard：即使Cookie将被丢弃也将它保存下来
# ignore_expires：如果在该文件中Cookie已存在，覆盖原文件写入
cookie.save(ignore_discard=True, ignore_expires=True)
# ============ 读取Cookie文件 ============
cookie_file = "cookie.txt"
# 1.创建MozillaCookieJar对象保存Cookie
cookie = cookiejar.MozillaCookieJar(cookie_file)
# 2.从文件中读取Cookie内容
cookie.load(cookie_file, ignore_expires=True, ignore_discard=True)
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
resp = opener.open("http://www.baidu.com")
print(resp.read().decode('utf-8'))
部分代码执行后生成的 cookie.txt 文件内容如下：
# Netscape HTTP Cookie File
# http://curl.haxx.se/rfc/cookie_spec.html
# This is a generated file! Do not edit.
.baidu.com TRUE / FALSE 3681539028 BAIDUID F16617940595A8E3EF9BB50E63AC09
54:FG=1
.baidu.com TRUE / FALSE 3681539028 BIDUPSID F16617940595A8E3EF9BB50E63AC0
954
.baidu.com TRUE / FALSE H_PS_PSSID 1442_21106_22074
.baidu.com TRUE / FALSE 3681539028 PSTM 1534055381
www.baidu.com FALSE / FALSE BDSVRTM 0
www.baidu.com FALSE / FALSE BD_HOME 0
www.baidu.com FALSE / FALSE 2480135321 delPer 0

上一篇：廖雪峰python教程视频廖雪峰python教程的实战学习笔记在哪看啊

下一篇：没有了