版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)《网络爬虫与信息提取》在线作业试卷总分:100得分:100一、单选题(共20道试题,共40分)1.Python操作CSV文件可通过()容器的方式操作单元格A.列表B.元组C.字典D.集合答案:C2.以下关于Charles的说法正确的是()A.Charles是一个跨平台的HTTP抓包工具,可以截取HTTP或者HTTPS请求的数据包B.Charles有Windows32/64版和Linux64版,但是目前还没有对MacOS进行有C.Charles上面滚动的数据就是目前计算机发起的数据包。单击工具栏上面的黄色笤帚图D.在Charles启动时,系统自带浏览器的部分HTTP流量不会经过Charles。答案:A3.Redis中写数据到列表中,使用关键字()A.pushB.appendC.lpushD.lappend答案:C4.使用UIAutomator使屏幕向上滚动一屏的操作是得到相应控件后使用命令()A.scroll__forwadB.scroll__upC.scroll.forwardD.scroll.vert.forward答案:D5.Python中若定义object=[1,2,3,4,5],则print(object[-4])输出()A.NULLB.2C.4D.程序报错答案:B6.Python中哪种容器一旦生成就不能修改A.列表B.元组C.字典D.集合答案:B7.windows中创建定时任务的命令为A.taskB.schtasksC.createtasksD.maketasks答案:B8.参数headers=(),把请求头添加到Scrapy请求中,使爬虫的请求看起来像是从浏览器发A.HEADERB.HEADERSC.HEAD答案:B9.Python中把列表转换为集合需要使用##函数A.setB.listC.convertD.change答案:A10.Redis中读取数据语句lrangechapter03,那么表示读列表中()个值A.2B.3C.4D.5答案:C11.chrome默认打开开发者工具的快捷是A.F5B.F11C.F12D.F2答案:C12.网站根目录中哪个文件里面的内容会告诉爬虫哪些数据是可以爬取的,哪些数据是不可以爬取的()。A.robot.txtB.robot.htmlC.robots.txtD.robots.html答案:C13.PyMongo中逻辑查询表示等于的符号是()A.$gtB.$ltC.$eq$$ne答案:C14.使用Xpath获取文本使用()A.textB.text()C.contentD.content()答案:B15.Python中以下哪个容器里的元素不能重复()A.列表B.元组C.字典D.集合答案:D16.HTTP状态码401表示A.请求报文中可能存在语法错误B.请求需要通过HTTP认证C.请求资源的访问被拒绝D.服务器上没有请求的资源答案:B17.MongoDB中数据存储的形式类似于()A.列表B.元组C.字典D.集合答案:C18.HTTP常用状态码表明服务器上没有请求的资源的是()A.500B.503C.403D.404答案:D19.可以通过()绕过网站登录。A.sessionB.cookiesC.moonpiesD.localstorage答案:B20.浏览器用来记录用户状态信息的数据叫A.sessionB.cookiesC.moonpiesD.selenium答案:B二、多选题(共10道试题,共20分)21.如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据()来起诉使用爬虫的A.服务器日志B.数据库日志记录C.程序日志记录D.服务器监控答案:ABCD22.requests中post请求方法的第二个参数可以为()A.字典B.列表C.json数据D.字符串答案:AC23.BS4可以用来从()中提取数据B.XMLC.数据库D.JSON答案:AB24.MongoDB中获取名字为db的库的语句为()A.client.dbB.client('db')C.client['db']D.client{'db'}答案:AC25.要使用tesseract来进行图像识别,需要安装两个第三方库A.requestsB.beautifulsoupC.PillowD.pytesseract答案:CD26.Python中()容器有推导式A.列表B.元组C.字典D.集合答案:ACD27.网络爬虫的用途有()A.收集数据B.尽职调查C.提高流量D.攻击服务器答案:ABC28.cookies的缺点是A.实现自动登录B.跟踪用户状态C.http中明文传输D.增加http请求的流量答案:CD29.PyMongo删除操作有()A.deleteB.delete__allC.delete__oneD.delete__many答案:CD30.下载器中间件的作用有哪些?A.更换代理IPB.更换CookiesC.更换User-Agent答案:ABCD三、判断题(共20道试题,共40分)31.process__spider__output(response,result,output)是在下载器中间件处理完成后,马上要进入某个回调函数parse__xxx()前调用答案:错误32.process__spider__input(response,spider)是在爬虫运行yielditem或者yieldscrapy.Request()的时候调用答案:错误33.在安装Scarpy的依赖库时,由于VisualC++BuildTools的安装速度很慢,为了节省时间,可以和安装Twisted同时进行答案:错误34.当Charles抓包以后,在MacOS系统下可以按Command+F组合键,在Windows系统下按Ctrl+F组合键打开Charles进行搜索答案:正确35.MongoDB是一个关系数据库产品答案:错误36.RoboMongo是MongoDB的管理软件答案:正确37.UIAutomatorViewer与Pythonuiautomator可以同时使用答案:错误38.需要实名认证的打码网站更加安全可靠。答案:错误39.PyMongoDB中排序方法sort第二个参数1表示降序答案:错误40.代理中间件的可用代理列表一定要写在settings.py里面答案:错误41.在发送请求时需要注意requests提交的请求头不能与浏览器的请求头一致,因为这样才能隐藏好自己达到获取数据的目的答案:错误42.如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好。于是将数据或者分析结果出售给某基金公司,从而获得销售收入。这是合法的。答案:正确43.使用Charles,可以轻松截获手机App和微信小程序的数据包,从而开发出直接抓取App后台和小程序后台的爬虫。答案:正确44.mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本答案:正确45.当运行爬虫代码后,出现"Forbiddenbyrobots.txt"提示后,说明当前时间段被爬取的网站无法访问。答案:错误46.Python中直接对浮点数进行计算有print(0.1+0.2),则结果为0.3答案:错误47.如果目标网站本身就是提供公众查询服务
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度股权投资基金股权转让与出资安排合同
- 2025年度互联网广告投放合同模板
- 2025年度农业贷款担保合同执行细则
- 2025年度新能源领域合伙经营协议合同
- 2025年度荒山承包合同样本(生态旅游项目合作)
- 2025年度舞台音响设备维修与购销合同模板
- 2025年度商业地产购房贷款抵押合同模板
- 2025年度新能源电站合同主体变更及电力销售协议范本
- 2025年度广告宣传效果提升方案合同
- 2025版校车承运合同:校车设备维护与更新协议3篇
- 2024年计算机二级WPS考试题库
- 广东省广州黄埔区2023-2024学年八年级上学期期末数学试卷(含答案)
- 法理学课件马工程
- 2024年广东省公务员录用考试《行测》真题及解析
- 高中英语必背3500单词表(完整版)
- 2024年版《输变电工程标准工艺应用图册》
- 2024年高考数学试卷(北京)(空白卷)
- 人教版2024年新教材七年级上册英语starter unit 1 -unit7重点短语句型清单
- 护理服务在产科中的应用课件
- 2024年小升初语文入学分班测试卷四(统编版)
- 流行文化对青少年价值观的影响研究
评论
0/150
提交评论