南开大学22春学期《网络爬虫与信息提取》在线作业答卷_第1页
南开大学22春学期《网络爬虫与信息提取》在线作业答卷_第2页
南开大学22春学期《网络爬虫与信息提取》在线作业答卷_第3页
南开大学22春学期《网络爬虫与信息提取》在线作业答卷_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

22春学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业-00002试卷总分:100得分:100一、单选题(共20道试题,共40分)1.Python中Object=obj_T:T','obj_2,:'2'},则Objcet.get('boj_3','3')是()123D.无输出答案:C2.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个。A.列表B.元组C.字典0.集合答案:C.在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息?()spiders文件夹item,pypipeline,pysettings,py答案:D.执行下面代码,结果为():namelist=[]ifnamelistandnamelist[100]=='张三’:print('OK')A.程序报错OKNULLD.无输出答案:B5.PyMongo中查询所有age>29的记录是()collection,find({*age,:{'$gt':29}))collection,find({'age'>29})collection,find_all({'age':{'$gt':29}})collection.find_all({Jage'>29})答案:A6.如果计算机上连接了很多台手机,查看这些手机串号,需要在终端输入以下命令:()A.adbdeviceB.adbdevicesC.adbdevices-1D.adbdevices-list答案:C.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为0,Value就是一个集合。A.字典.集合的名字C.集合D.文档答案:B8.在MacOS下安装MongoDB使用命令()installmongodbA.brewB.apt-getsudoapt答案:A在Scrapy的目录下,哪个文件负责存放爬虫文件?()spiders文件夹item,pypipeline,pysettings,py答案:A一般来说在页面传输登录信息都用HTTP。请求类型GETPOSTPUTSEND答案:BPython中若定义object=[1,2,3,4,5],则print(object[-4])输出()NULL2C.4D.程序报错答案:BPython中列表可以用()方法在末尾添加元素A.addB.appendC.plusI).+答案:B13.以下哪个命令是创建文件夹命令()A.curlB.tar-zxvfmkdircp答案:C14.某些网站在发起Ajax请求时会携带()字符串用于身份验证A.TokenB.CookieC.ReqTimeD.sum答案:ARedis中读取数据语句1rangechapter03,那么表示读列表中()个值2345答案:CHTTP常用状态码表明服务器正忙的是0500503403404答案:B17.以下哪个命令是利用URL语法在命令行下工作的文件传输工具()A.curlB.tar-zxvfmkdircp答案:APython读CSV文件需要哪个方法()A.CSVReaderB.CsvReaderC.DictReaderD.FileReader答案:c19.如果很多爬虫同时对一个网站全速爬取,那么其实就是对网站进行了()攻击XSSDOSDDOSD.跨域答案:C.请问按哪个键可以打开Chrome自带的开发者工具()F10F1F11D.F12答案:D二、多选题(共10道试题,共20分).HTTP常用状态码表明请求被正常处理的有()200301302204答案:AD.以下哪些方法属于Python写CSV文件的方法()writeheaderswriteheaderwriterrowsD.writerow答案:ACD23.使用Selennium获取网页中元素的方法有find_e1ement_by_namefind_e1ement_by_idC.find_e1ements_by_namefindelementsbyid答案:ABCD.Redis中的值可以支持()A.列表B.哈希C.集合D.有序集合答案:ABCD.下载器中间件的作用有哪些?A.更换代理IPB.更换CookiesC.更换User-AgentD.自动重试答案:ABCDPython中有哪些实现多线程方法0A.multiprocess,dummyB.threading.ThreadC.processD.PyMongoDB答案:AB27.要使用tesseract来进行图像识别,需要安装两个第三方库requestsbeautifulsoupC.PillowD.pytesseract答案:CD.Python中哪种容器生成后可以修改内容A.列表B.元组C.字典D.集合答案:ACD.常用的会话跟踪技术是A.sessionB.cookiesC.moonpiesD.localstorage答案:AB.最常见的HTTP请求类型有()GETPOSTSENDD.RECEIVE答案:AB三、判断题(共20道试题,共40分)device,sleep。方法是使用UIAutomatorr关闭屏幕的命令答案:正确middlewares,py是下载器中间件答案:错误Cookies一般包含在请求头Headers中答案:正确scrapy与selenium结合可以实现直接处理需要异步加载的页面答案:正确MongoDB是一个关系数据库产品答案:错误验证码必须通过手动填充识别。答案:错误requests中post请求方法的使用为requests,postC网址',data二data)答案:正确所有的异步加载都会向后台发送请求答案:错误使用UIAutomatorr操作实体键的命令为device,press.实体按键名称0答案:正确需要实名认证的打码网站更加安全可靠。答案:错误当Charles抓包以后,在MacOS系统下可以按Command+F组合键,在Windows系统下按Ctrl+F组合键打开Charles进行搜索答案:正确cookies在http请求中是明文传输的。答案:正确在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装答案:错误Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库答案:正确HTTP状态码503表示服务器内部故障。答案:错误Python中函数返回值的个数可以是多个答案:正确H

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论