南开21春学期1703-2103年级《网络爬虫与信息提取》在线作业答案1_第1页
南开21春学期1703-2103年级《网络爬虫与信息提取》在线作业答案1_第2页
南开21春学期1703-2103年级《网络爬虫与信息提取》在线作业答案1_第3页
南开21春学期1703-2103年级《网络爬虫与信息提取》在线作业答案1_第4页
南开21春学期1703-2103年级《网络爬虫与信息提取》在线作业答案1_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

[南开]21春学期1703-2103年级《网络爬虫与信息提取》在线作业阅读提示:本文为2021年南开大学春季学期,课程辅导资料,本文内容仅供参考!!一、单选题(共20道试题,共40分)1.下列说法错误的是()-A-.小程序的请求极其简单,基本上没有验证信息-B-.用Python来请求小程序的后台接口从而获取数据,比请求异步加载网页的后台接口要复杂很多。-C-.如果目标网站有微信小程序,那么一定要优先调查能否通过小程序的接口来抓取数据。-D-.小程序的反爬虫能力比网页版的低很多。使用小程序的接口来爬数据,能极大提高爬虫的开发效率。【-参考选项-】:B2.()是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。-A-.meta-B-.head-C-.header-D-.body【-参考选项-】:A3.启动MongoDB使用命令mongod--()usr/local/etc/mongo-D-.conf-A-.config-B-.install-C-.start-D-.begin【-参考选项-】:A4.HTTP常用状态码表明服务器不允许访问那个资源的是()-A-.500-B-.503-C-.403-D-.405【-参考选项-】:C5.Python正则表达式模块的findall方法如果没有匹配到结果,则返回结果为()-A-.空-B-.空列表-C-.空元组-D-.不返回【-参考选项-】:B6.Scrapy中使用Xpath获得的结果调用了.extract方法,结果以()形式生成-A-.列表-B-.元组-C-.字典-D-.集合【-参考选项-】:A7.在Scrapy的目录下,哪个文件负责数据抓取以后的处理工作?()-A-.spiders文件夹-B-.item.py-C-.pipeline.py-D-.settings.py【-参考选项-】:C8.Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题-A-.s-B-.c-C-.d-D-.r【-参考选项-】:D9.python中可以用来将图片中的文字转换为文本的第三方类库是-A-.lxml-B-.requests-C-.beautifulsoup-D-.pytesseract【-参考选项-】:D10.在Linux中哪个命令是添加权限的()-A-.chmod-B-.sudo-C-.cp-D-.mkdir【-参考选项-】:A11.使用python定制mitmproxy,下面的语句请求的是()。{req.headers["User-Agent"]}-A-.headers-B-.文本内容-C-.目标网站-D-.user-agent【-参考选项-】:D12.PyMongo中逻辑查询表示小于等于的符号是()-A-.$gt-B-.$lt-C-.$gte$$lte【-参考选项-】:C13.Python中若定义object=[1,2,3,4,5],则print(object[-4])输出()-A-.NULL-B-.2-C-.4-D-.程序报错【-参考选项-】:B14.Python中Object={'obj_1':'1','obj_2':'2'},则Objcet.get('boj_3','3')是()-A-.1-B-.2-C-.3-D-.无输出【-参考选项-】:C15.PyMongo中的查找方法的参数是哪种数据结构()-A-.列表-B-.元组-C-.字典-D-.集合【-参考选项-】:C16.Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()-A-.列表-B-.元组-C-.字典-D-.集合【-参考选项-】:B17.Redis是一个开源的使用()语言编写-A-.ANSIC-B-.C++-C-.JAVA-D-.Py

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论