python编程题题库基础怎么搜noc比赛python编程题计算购物金额
下载地址 https://share.weiyun.com/oKXAf8Zh
资料目录 Python编程基础教学视频 51CTO学院(60集) python编程基础教学视频 乾颐盾系列 Python编程基础 张健 张良均 人民邮电出版社.pdf Phthon编程金典.pdf Python 编程指南.pdf 《Python 编程基础》 教学大纲.pdf 《Python编程入门指南(上下册)》 明日科技.pdf 《小小的Python编程故事》毛雪涛,丁毓峰编著.pdf Python编程初学者指南.pdf Python编程入门经典.pdf 树莓派Python编程入门与实战 第2版.pdf Python编程实战__运用设计模式、并发和程序库创建高质量程序.pdf 《Python编程基础》复习资料.pdf Python编程基础与应用-题库大全.doc Python编程基础张健 , 张良均课后习题及答案.pdf Python程序设计基础及实践(慕课版)郭炜习题答案.pdf 《Python程序设计基础与应用》习题答案.pdf 《Python快速编程入门》——课后题答案.doc Python程序设计基础习题答案与分析.doc python基础试题(含答案).doc Python考试题复习知识点试卷试题.doc Python编程基础.pptx 《Python编程之美:最佳实践指南》by Kenneth Reitz.pdf 《Python编程基础与HTTP接口测试》阿奎 编著.pdf Python编程 从入门到实践 by Eric Matthes.pdf Python编程导论第2版_2018 翻译 陈光欣.pdf Python编程快速上手—让繁琐工作自动化_[美] Al Sweigart 著.pdf 趣学python编程中文版.pdf 举例 获取数据 Scrapy 爬虫框架可以通过特定的CSS 或 XPath 表达式来选择 HTML 文件中的某一处,并且提取出相应的数据。CSS(Cascading Style Sheets,层叠样式表)用于控制 HTML 页面布局、字体、颜色、背景及其他效果。XPath 是一门可以在 XML 文档中根据元素和属性查找信息的语言。 1.CSS 提取数据 当使用 CSS 提取 HTML 文件中的某一处数据时,可以指定 HTML 文件中的标签名称。例如,在获取网页的<title>标签中的数据时,可以使用如下代码: response.css('title').extract() 获取结果如图 16.18 所示。 图 16.18 使用 CSS 提取<title>标签中的数据 说明:返回的内容为 CSS 表达式所对应节点的列表。所以,在提取标签中的数据时,可以使用以下代码: response.css('title::text').extract_first() 或者 response.css('title::text')[0].extract() 2.XPath 提取数据 当使用 XPath 表达式提取 HTML 文件中的某一处数据时,需要根据 XPath 表达式的语法规定来获取指定的数据信息。例如,同样获取<title>标签中的数据,可以使用如下代码: response.xpath('//title/text()').extract_first() 下面通过一个示例,实现使用 XPath 表达式获取多条信息。示例代码如下: 01 # 响应信息 02 def parse(self, response): 03 # 获取所有信息 04 for quote in response.xpath(".//*[@class='quote']"): 05 # 获取名人名言文字信息 06 text = quote.xpath(".//*[@class='text']/text()").extract_first() 07 # 获取作者 08 author = quote.xpath(".//*[@class='author']/text()").extract_first() 09 # 获取标签 10 tags = quote.xpath(".//*[@class='tag']/text()").extract() 11 # 以字典形式输出信息 12 print(dict(text=text, author=author, tags=tags)) 3.翻页提取数据 在以上的示例中,已经实现了获取网页中的数据。如果需要获取整个网页的所有信息,就需要使用翻页功能。例如,获取整个网页的作者名称,可以使用以下代码: 01 # 响应信息 02 def parse(self, response): 03 # div.quote 04 # 获取所有信息 05 for quote in response.xpath(".//*[@class='quote']"): 06 # 获取作者 07 author = quote.xpath(".//*[@class='author']/text()").extract_first() 08 print(author) # 输出作者名称 09 10 # 实现翻页 11 for href in response.css('li.next a::attr(href)'): 12 yield response.follow(href, self.parse)
|