廖雪峰python教程实战3怎么样廖雪峰python教程官网免费下载
下载地址 https://share.weiyun.com/RS9A6Xk6
资料目录 廖雪峰python视频教程1 爬虫的基本框架及知识(day1-day15) 廖雪峰python视频教程2 scapy框架及爬虫进阶(day16-day20) 廖雪峰python视频教程3 爬虫高级知识及就业培训(day21-day28) 廖雪峰python教程官网doc 廖雪峰 2018年官方最新Python3教程(一)pdf 廖雪峰 2018官方Python3教程(二)pdf 廖雪峰2018官方Python3教程(三)pdf 廖雪峰python学习笔记(入门+进阶).doc Python3高级教程(开课吧)pdf Python3零基础教程(开课吧)pdf 利用Python进行数据分析(中文版)pdf 廖雪峰商业爬虫案例 廖雪峰商业爬虫课件 廖雪峰商业爬虫练习答案 爬虫第一节-爬虫第十四节 Python爬虫预习书籍 python环境和pychram 举例 Cookie 是某些网站为了辨别用户身份、进行 session 跟踪而存储在用户本地终端上的数据(通常经过加密),比如有些页面你在登录前是无法访问的,登录成功会给你分配 Cookie,然后带着 Cookie 去请求页面才能正常访问。 使用 http.cookiejar 这个模块可以获取 Cookie,实现模拟登录。该模块的主要对象(父类→子类)为 CookieJar→FileCookieJar→MozillaCookieJar 与 LWPCookieJar,示例代码如下: # ============ 获得Cookie ============ # 1.实例化CookieJar对象 cookie = cookiejar.CookieJar() # 2.创建Cookie处理器 handler = urllib.request.HTTPCookieProcessor(cookie) # 3.通过CookieHandler创建opener opener = urllib.request.build_opener(handler) # 4.打开网页 resp = opener.open("http://www.zhbit.com") for i in cookie: print("Name = %s" % i.name) print("Name = %s" % i.value) # ============ 保存Cookie到文件 ============ # 1.用于保存Cookie的文件 cookie_file = "cookie.txt" # 2.创建MozillaCookieJar对象保存Cookie cookie = cookiejar.MozillaCookieJar(cookie_file) # 3.创建Cookie处理器 handler = urllib.request.HTTPCookieProcessor(cookie) # 4.通过CookieHandler创建opener opener = urllib.request.build_opener(handler) # 5.打开网页 resp = opener.open("http://www.baidu.com") # 6.保存Cookie到文件中,参数依次是: # ignore_discard:即使Cookie将被丢弃也将它保存下来 # ignore_expires:如果在该文件中Cookie已存在,覆盖原文件写入 cookie.save(ignore_discard=True, ignore_expires=True) # ============ 读取Cookie文件 ============ cookie_file = "cookie.txt" # 1.创建MozillaCookieJar对象保存Cookie cookie = cookiejar.MozillaCookieJar(cookie_file) # 2.从文件中读取Cookie内容 cookie.load(cookie_file, ignore_expires=True, ignore_discard=True) handler = urllib.request.HTTPCookieProcessor(cookie) opener = urllib.request.build_opener(handler) resp = opener.open("http://www.baidu.com") print(resp.read().decode('utf-8')) 部分代码执行后生成的 cookie.txt 文件内容如下: # Netscape HTTP Cookie File # http://curl.haxx.se/rfc/cookie_spec.html # This is a generated file! Do not edit. .baidu.com TRUE / FALSE 3681539028 BAIDUID F16617940595A8E3EF9BB50E63AC09 54:FG=1 .baidu.com TRUE / FALSE 3681539028 BIDUPSID F16617940595A8E3EF9BB50E63AC0 954 .baidu.com TRUE / FALSE H_PS_PSSID 1442_21106_22074 .baidu.com TRUE / FALSE 3681539028 PSTM 1534055381 www.baidu.com FALSE / FALSE BDSVRTM 0 www.baidu.com FALSE / FALSE BD_HOME 0 www.baidu.com FALSE / FALSE 2480135321 delPer 0
|