南开20春学期(1709、1803、1809、1903、1909、2003)《网络爬虫与信息提取》在线作业答案_第1页
南开20春学期(1709、1803、1809、1903、1909、2003)《网络爬虫与信息提取》在线作业答案_第2页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、20春学期(1709、1803、1809、1903、1909、2003)网络爬虫与信息提取在线作业试卷总分:100 得分:98一、单选题 (共 20 道试题,共 40 分)1.Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()A.列表B.元组C.字典D.集合答案:B2.以下表示请求正常处理的HTTP状态码为A.200B.301C.404D.500答案:A3.Python中线程池map()方法第二个参数是()A.列表B.元组C.字典D.集合答案:A4.()是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。A.metaB

2、.headC.headerD.body答案:A5.如果使用Python的数据结构来做类比的话,MongoDB中集合相当于一个()A.列表B.元组C.字典D.集合答案:A6.PyMongo中逻辑查询表示不等于的符号是()A.$neB.$ltC.$gtD.$eq答案:7.PyMongo中逻辑查询表示大于等于的符号是()A.$gtB.$ltC.$gteD.$lte答案:C8.以下哪个HTML标签表示定义文档的主体()A.<div>B.<body>C.<head>D.<footer>答案:B9.某些网站在发起Ajax请求时会携带()字符串用于身份验证A.

3、TokenB.CookieC.ReqTimeD.sum答案:A10.下面Python代码输出为(): def default_para_trap(para=, value=0): para.append(value) return para print('第一步:'.format(default_para_trap(value=100) print('第二步:'.format(default_para_trap(value=50)A.第一步:100 第二步:100,50B.第一步:100 第二步:50C.第一步:100 第二步:D.第一步:100 第二步:100

4、答案:A11.用Xpathh获取第二个div标签应该是()A.dvi(1)B.div(2)C.div1D.div2答案:D12.查看网站请求一般在Chrome开发者模式下的()选项卡中查看A.ConsoleB.SourcesC.NetworkD.Performance答案:C13.Python中Object='obj_1':'1','obj_2':'2',则Objcet.get('boj_1','3')是()A.1B.2C.3D.无输出答案:A14.通常使用()工具来模拟浏览器进行爬虫请求A.Sel

5、eniumB.ChromeC.ChromeDriverD.WebDriver答案:A15.Python并导入uiautomator来操作设备的语句是from uiautomator import ()A.DeviceB.DevicesC.JobsD.Job答案:A16.Python中把列表转换为集合需要使用#函数A.setB.listC.convertD.change答案:A17.Python中若定义object="12345",则print(object:-1)输出()A.1B.5C.54321D.程序报错答案:C18.Python正则表达式模块的findall方法如果没

6、有匹配到结果,则返回结果为()A.空B.空列表C.空元组D.不返回答案:B19.以下哪个命令是利用URL语法在命令行下工作的文件传输工具()A.curlB.tar -zxvfC.mkdirD.cp答案:A20.使用UI Automatorr输入文字的操作是得到相应控件后使用命令()A.settextB.setC.set_textD.text答案:C二、多选题 (共 10 道试题,共 20 分)21.HTTP常用状态码表明表明客户端是发生错误的原因所在的有()A.403B.404C.500D.503答案:AB22.Python中()容器有推导式A.列表B.元组C.字典D.集合答案:ACD23.P

7、ython中通过Key来从字典object中读取对应的Value的方法有()A.objectkeyB.object.get(key)C.object.pop(key)D.object.pop()答案:AB24.PyMongo更新操作有()A.updateB.update_allC.update_oneD.update_many答案:CD25.HTTP常用状态码表明表明服务器本身发生错误的有()A.403B.404C.500D.503答案:CD26.以下哪些可以独立成为Python编译器()A.PycharmB.IDLEC.EclipseD.Visual Studio 2010答案:AB27.r

8、equests中post请求方法的第二个参数可以为()A.字典B.列表C.json数据D.字符串答案:AC28.MongoDB中获取名字为set1的集合的语句为()A.database.set1B.database('set1')C.database'set1'D.database'set1'答案:AC29.最常见的HTTP请求类型有()A.GETB.POSTC.SENDD.RECEIVE答案:AB30.PyMongo删除操作有()A.deleteB.delete_allC.delete_oneD.delete_many答案:CD三、判断题 (共

9、 20 道试题,共 40 分)31.在请求头中设置User-Agent即可正常请求网站答案:错误32.一般来说在页面都通过GET将用户登录信息传递到服务器端。答案:错误33.Scrapy作为一个爬虫的框架,它在单机环境下运行时就可以获得最大性能优势答案:错误34.当运行爬虫代码后,出现"Forbidden by robots.txt"提示后,说明当前时间段被爬取的网站无法访问。答案:错误35.使用UI Automatorr操作实体键的命令为device.press.实体按键名称()答案:正确36.爬虫中间件的作用对象是请求request和返回response答案:错误37.

10、Redis中列表读取数据命令lrange中l代表left,即从左侧开始读取答案:错误38.运行MongoDB以后,不会在终端打印任何Log答案:错误39.Selenium必须加载对应的webdriver才能模拟浏览器访问答案:正确40.Robo 3T与RoboMongo是完全不一样的软件答案:错误41.在中间人攻击中,攻击者可以拦截通信双方的通话,并插入新的内容或者修改原有内容答案:正确42.使用Charles,可以轻松截获手机App和微信小程序的数据包,从而开发出直接抓取App后台和小程序后台的爬虫。答案:正确43.要实现Charles对Android抓包,其过程比iOS稍微复杂一点。这是因为不同的Andorid设备,安装证书的入口可能不一样答案:正确44.Python中包含字典的列表页可以转换成JSON字符串答案:正确45.MongoDB URI的格式为: mongodb:/服务器IP或域名:端口用户名:密码答案:错

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论