项目3 简单静态网页爬取-获取某企业官网基本信息 教案_第1页
项目3 简单静态网页爬取-获取某企业官网基本信息 教案_第2页
项目3 简单静态网页爬取-获取某企业官网基本信息 教案_第3页
项目3 简单静态网页爬取-获取某企业官网基本信息 教案_第4页
项目3 简单静态网页爬取-获取某企业官网基本信息 教案_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目3简单静态网页爬取——获取某企业官网基本信息教案课程名称:Python网络爬虫技术课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论24学时,实验40学时)总学分:4.0学分本章学时:16学时材料清单《Python网络爬虫技术(第2版)(微课版)》教材。配套PPT。引导性提问。探究性问题。拓展性问题。教学目标与基本要求教学目标使用Chrome开发者工具定位目标元素,查看网页资源加载情况;使用urllib3和Requests库实现HTTP请求,并使用Xpath、BeautifulSoup库和正则表达式解析网页内容;讲解将解析得到的数据存储到JSON文件、MySQL数据库当中的方法。基本要求掌握Chrome浏览器开发者工具的使用方法。掌握使用urllib3和Requests库实现HTTP请求的流程。掌握Xpath的基本语法和常用函数。掌握创建BeautifulSoup对象的方法。掌握正则表达式解析网页的常用方法。掌握使用JSON模块和PyMySQL库存储数据的方法。问题引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。Chrome开发者模式中如何查看网页源码?定位某个元素?创建HTML文件时,使用到了各种标签,能否使用标签之间的关系定位到某个标签?结合之前课程的学习,文本信息保存到本地,使用Python代码可以保存为什么类型?探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。Xpath和BeautiuflSoup定位标签元素时,有何异同点?正则表达式中贪婪模式和非贪婪模式分别是何含义?如何区分?MySQL是用什么SQL指令实现数据插入?如何实现多行数据插入?拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。使用PyMySQL库如何从数据表中删除数据?更新数据?Chrome开发者工具中,其他选项卡的作用是什么?主要知识点、重点与难点主要知识点Chrome浏览器查看网页。urllib3库实现HTTP请求。Requests库实现HTTP请求。Xpath解析网页。BeautifulSoup库解析网页。正则表达式解析网页。将数据存储为JSON文件。将数据存储到MySQL数据库。重点Requests库实现HTTP请求。Xpath解析网页。BeautifulSoup库解析网页。将数据存储到MySQL数据库。难点正则表达式解析网页。将数据存储到MySQL数据库。教学过程设计理论教学过程使用Chrome浏览器查看网页。使用urllib3库实现HTTP请求。使用Requests库实现HTTP请求。使用Xpath解析网页。使用BeautifulSoup库解析网页。使用正则表达式解析网页。将数据存储为JSON文件。将数据存储到MySQL数据库。实验教学过程使用Chrome浏览器查看网页源码,并定位节点。使用urllib3和Requests实现HTTP请求发送和接收响应结果。使用Xpath、BeautifulSoup或者正则表达式对响应的内容进行解析。将数据存储到JSON文件中。将数据存储到MySQL数据库中。教材与参考资料教材池瑞楠.Python网络爬虫技术(第2版)(微课版)[M].人民邮电出版社.2023.参考资料江吉彬.Python网络爬虫技术[M].人民邮电出版社.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论