奥鹏22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业答卷非免费答案_第1页
奥鹏22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业答卷非免费答案_第2页
奥鹏22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业答卷非免费答案_第3页
奥鹏22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业答卷非免费答案_第4页
奥鹏22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业答卷非免费答案_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

答案来源:22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业-00003试卷总分:100

得分:100一、单选题(共20道试题,共40分)Scrapy自带的待爬队列是()dequequeuelistlqueue答案:2.Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()列表元组字典集合答案:3.Redis是一个开源的使用()语言编写ANSICC++JAVAPython答案:4.Python写CSV文件需要哪个方法()CSVWriterCsvWriterDictWriterFileWriter答案:5.使用Xpath构造属性值包含相同字符串的路径采用()方法containcontainsincludeincludes答案:6.以下关于Charles的说法正确的是()Charles是一个跨平台的HTTP抓包工具,可以截取HTTP或者HTTPS请求的数据包Charles有Windows32/64版和Linux64版,但是目前还没有对MacOS进行有效的支持。Charles上面滚动的数据就是目前计算机发起的数据包。单击工具栏上面的黄色笤帚图标,可以清停止抓包。在Charles启动时,系统自带浏览器的部分HTTP流量不会经过Charles。答案:7.Redis中写数据到列表中,使用关键字()pushappendlpushlappend答案:8.打开终端,输入(),屏幕上会出现Python的路径pythonpathpathpythonwhichpythonpythonwhich答案:9.Python中跳过本次循环应用关键字()breakcontinueexitreturn答案:10.Chrome的开发者工具中哪个选项可以查找到cookiesElementsSourcesNetworkPeformance答案:11.下列哪项不是HTTP的请求类型()GETPOSTPUTSET答案:12.通常使用()工具来模拟浏览器进行爬虫请求SeleniumChromeChromeDriverWebDriver答案:13.chrome默认打开开发者工具的快捷是F5F11F12F2答案:14.Python中专门用来处理图像的第三方库是lxmlPillowbeautifulsouppytesseract答案:15.要想让Scrapy结合Redis,应该对Scrapy爬虫请求的调度算法进行修改,以下哪种修改不能完成这一任务?()队列栈上锁优先级队列答案:16.以下表示请求资源重定向的HTTP状态码为200301404500答案:17.请问按哪个键可以打开Chrome自带的开发者工具()F10F1F11F12答案:18.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个()列表元组字典集合答案:19.执行下面代码,结果为():name_list=[]ifname_listandname_list[100]=='张三':print('OK')程序报错OKNULL无输出答案:20.使用UIAutomatorr判断元素是否存在的操作是得到相应控件后使用命令()existexistsisnullcontains答案:二、多选题(共10道试题,共20分)21.为了解决爬虫代码本身的错误引起的异常,可以采用下列哪些方法仔细检查代码开发爬虫中间件开发下载器中间件等待答案:22.使用BeautifulSoup对象后可以使用()来查找内容find_allfindsearchsearch_all答案:23.MongoDB中获取名字为set1的集合的语句为()database.set1database('set1')database['set1']database{'set1'}答案:C24.以下哪些可以独立成为Python编译器()PycharmIDLEEclipseVisualStudio2010答案:25.使用Selennium获取网页中元素的方法有find_element_by_namefind_element_by_idfind_elements_by_namefind_elements_by_id答案:CD26.下列关于在IOS上配置charles的说法正确的是()不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。手机和电脑需要在同一个局域网下。HTTP代理可以使用"自动"选项。安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动答案:27.网络爬虫的用途有()收集数据尽职调查提高流量攻击服务器答案:C28.PyMongo删除操作有()deletedelete_alldelete_onedelete_many答案:29.PyMongo更新操作有()updateupdate_allupdate_oneupdate_many答案:30.BS4可以用来从()中提取数据HTMLXML数据库JSON答案:三、答案来源:雅宝题库网()(共20道试题,共40分)31.在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。答案:错误32.使用UIAutomatorr操作实体键的命令为device.press.实体按键名称()答案:正确33.代理中间件的可用代理列表一定要写在settings.py里面答案:错误34.引用中间件时后面的数字代表的是中间件的执行顺序,例如'AdvanceSpider.middlewares.ProxyMiddleware':543中的543答案:正确35.如果把网络上发送与接收的数据包理解为快递包裹,那么在快递运输的过程中取出查看更改里面的内容,就是类似抓包的过程答案:错误36.对Charles设置代理时,Ip可以设置为,端口为8888.答案:正确37.Scrapy每一次发起请求之前都会在这里检查网址是否重复。因此如果确实需要再一次爬取数据,在Redis中把这个Key删除即可。答案:正确38.使用异步加载技术的网站,被加载的内容可以在源代码中找到答案:错误39."curlhttp://爬虫服务器IP地址:6800/cancel.json-dproject=工程名-djob=爬虫JOBID"该命令的作用是启动爬虫答案:错误40.Redis中使用lrange读取数据后数据也会删除答案:错误41.在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exeredis.windows.conf启动Redis答案:错误42.需要登录的网站一般通过GET请求就可以实现登录。答案:错误43.爬虫中间件的激活需要另外写一个文件来进行答案:错误44.requests中post请求方法的使用为requests.post('网址',data=data)答案:正确45.数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击答案:正确46.数据在MongoDB中是按照"库(Database)"-"集合(Collections)"-"文档(Document)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论