



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学校________________班级____________姓名____________考场____________准考证号学校________________班级____________姓名____________考场____________准考证号…………密…………封…………线…………内…………不…………要…………答…………题…………第1页,共3页湖北工程学院《数据挖掘与Python应用》2022-2023学年期末试卷题号一二三总分得分一、单选题(本大题共20个小题,每小题2分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、以下哪个不是爬虫中处理数据合法性验证的方法?()A.正则表达式B.数据类型检查C.范围检查D.忽略验证2、网络爬虫如何处理网页中的加密数据?()A.破解加密B.寻找解密方法C.放弃抓取D.以上都是3、网络爬虫如何判断一个页面是否已经抓取过?()A.数据库记录B.缓存记录C.文件记录D.以上都是4、以下哪个不是爬虫中处理数据验证的内容?()A.完整性B.准确性C.一致性D.美观性5、以下哪个不是爬虫中处理数据压缩的算法?()A.GzipB.Bzip2C.RARD.Deflate6、在爬虫中,以下哪个库常用于处理HTTP代理?()A.requests-proxyB.urllib.request.ProxyHandlerC.socksD.以上都是7、在爬虫中,以下哪个库常用于处理异常日志?()A.loggingB.sentryC.fluentdD.以上都是8、爬虫在处理网页中的多媒体资源时,通常考虑的因素是()A.资源大小B.资源类型C.版权问题D.以上都是9、以下哪个不是常见的爬虫框架?()A.PySpiderB.Crawler4jC.Node.jsD.Scrapy10、在爬虫中,如何处理网页中的验证码识别错误?()A.重新识别B.跳过C.人工干预D.以上都是11、以下哪个不是爬虫中处理异步请求的方式?()A.使用回调函数B.使用线程C.使用协程D.以上都是12、在爬虫中,处理数据的筛选通常基于()A.数据值B.数据类型C.数据来源D.以上都是13、爬虫获取数据后,进行数据清洗通常不包括()A.去除重复数据B.转换数据格式C.加密数据D.纠正错误数据14、以下哪个不是爬虫中处理数据加密的场景?()A.传输过程B.存储过程C.计算过程D.展示过程15、在爬虫中,如何处理网页中的跳转页面?()A.跟随跳转B.忽略跳转C.分析跳转目的D.以上都是16、以下哪个不是爬虫中处理异常的方式?()A.重试B.跳过C.终止程序D.记录日志17、在爬虫中,以下哪个库常用于处理会话保持?()A.requests.SessionB.httpx.SessionC.aiohttp.ClientSessionD.以上都是18、以下哪个不是爬虫中处理数据重复的方法?()A.去重算法B.数据库去重C.缓存去重D.保留重复19、以下哪种数据格式常用于存储爬虫获取的数据?()A.CSVB.JSONC.XMLD.以上都是20、在爬虫中,处理重定向的常见方法是()A.自动跟随B.忽略重定向C.手动处理D.以上都是二、简答题(本大题共4个小题,共40分)1、(本题10分)说明网络爬虫如何处理网页中的用户行为的可视化展示数据。2、(本题10分)说明网络爬虫如何处理网页中的地理定位信息。3、(本题10分)简述网络爬虫如何处理网页中的数据分页和加载更多机制。4、(本题10分)简述网络爬虫如何处理网页中的智能规划相关元素。三、编程题(本大题共2个小题,共20分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024广西鱼峰集团秋季招聘31人笔试参考题库附带答案详解
- 2024年淮南寿县新桥燃气有限公司招聘2人笔试参考题库附带答案详解
- 《奥运中的数学》(教学设计)-2023-2024学年四年级下册数学北师大版
- 第二单元第十六课《越算越精彩》教学设计 2023-2024学年粤教版(2019)初中信息技术八年级上册
- Unit 2 第六课时:assessment 教学设计2024-2025学年译林版(2024)七年级英语上册
- 第二单元 第七课 电子标签我揭秘 教学设计2024-2025学年人教版(2024)初中信息科技八年级上册
- 2025年湖南食品药品职业学院单招职业技能测试题库完美版
- 2025年湖南财经工业职业技术学院单招职业技能测试题库完美版
- 2025年湖南现代物流职业技术学院单招职业技能测试题库附答案
- 2025年海口经济学院单招职业适应性测试题库审定版
- 轮状病毒性肠炎
- 世界社会主义五百年
- 加氢裂化操作工题库(合并版)
- 正大集团大猪场开发流程
- 高中政治必修四知识体系每单元的总体框架
- 房地产金融创新与风险防范的理论演进
- GB/T 41255-2022智能工厂通用技术要求
- GB/T 41029-2021石油天然气钻井海洋弃井作业规程
- 深入推进依法行政
- GB/T 4026-1992电器设备接线端子和特定导线线端的识别及应用字母数字系统的通则
- 马工程教材《公共财政概论》PPT-第二章 公共财政职能
评论
0/150
提交评论