网络爬虫开发（杨凌职业技术学院）知到智慧树答案

上传人：z*** IP属地：贵州上传时间：2024-12-19 格式：DOCX 页数：12 大小：24.33KB 积分：6 举报 版权申诉

已阅读5页，还剩7页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

项目一单元测试项目二单元测试项目三单元测试项目四单元测试项目五单元测试项目六单元测试项目七单元测试项目八单元测试1【单选题】(2分)下列不属于常见爬虫类型的是（）。正确答案：CA.增量式网络爬虫B.通用网络爬虫C.浅层网络爬虫D.聚焦网络爬虫2【单选题】(2分)下列不属于聚焦网络爬虫的常用策略的是（）。正确答案：AA.基于深度优先的爬取策略B.基于内容评价的爬取策略C.基于语境图的爬取策略D.基于链接结构评价的爬取策略3【单选题】(2分)下列不属于常用反爬手段的是（）。正确答案：BA.账号权限B.人工筛选C.验证码校验D.反爬频度4【单选题】(2分)下列属于反爬虫目的的是（）。正确答案：DA.变换网页结构B.限制访问人数C.限制用户访问权限D.防止网站信息被竞争对手随意获取5【单选题】(2分)下列属关于Python爬虫库的功能描述不正确的是（）。正确答案：BA.通用爬虫库RequestsB.HTML/XML解析器pycurl`C.爬虫框架ScrapyD.通用爬虫库urllib36【判断题】(2分)搜索引擎使用了网络爬虫不停地从互联网抓取网站数据，并将网站镜像保存在本地。（）正确答案：BA.错B.对7【判断题】(2分)robots.txt文件中，User-agent后面跟的是爬虫的名称，Disallow后面跟着的是可以爬虫的网页。（）正确答案：BA.对B.错8【判断题】(2分)爬虫是手动请求万维网网站且提取网页数据的程序。（）正确答案：BA.对B.错9【判断题】(2分)每个网站都有robots.txt文件。（）正确答案：AA.错B.对10【判断题】(2分)爬虫爬取的是网站后台的数据。（）正确答案：AA.错B.对1【单选题】(2分)吉多设计Python的灵感来源于（）。正确答案：CA.UnixshellB.C语言C.ABC语言D.Java语言2【单选题】(4分)下列关于Python语言的特点说法中，错误的是（）。正确答案：CA.GoB.ANSICC.Python语言是非开源语言D.Python语言是跨平台语言3【单选题】(4分)Python源代码文件的后缀名是（）正确答案：CA.pdfB.docC.pyD.png4【单选题】(4分)列表list=[1,2,3,4,5]，下列选项中为空的是（）正确答案：BA.list[1:-1]B.ist[1:1]C.list[1:]D.list[:-2]5【单选题】(2分)Python语言中用来定义函数的关键字是（）正确答案：CA.classB.functionC.defD.return6【判断题】(2分)在安装Python时，需要根据已有的系统来选择相应的安装程序。安装后，也需要配置环境变量。（）正确答案：AA.对B.错7【判断题】(4分)elif语句可以单独使用。（）正确答案：BA.对B.错8【判断题】(4分)元组的元素不能修改。（）正确答案：BA.错B.对9【多选题】(4分)下列选项中，不能创建元组的语句是（）。正确答案：CDA.tup=(1,2,98)B.tup=tuple([1,2,3])C.tup=(2)D.tup=[1,2,3]1【单选题】(2分)如果站点服务器支持安全套接层(SSL)，那么连接到安全站点上的所有URL开头是()。正确答案：DA.SHTTPB.HTTPC.SSLD.HTTPS2【单选题】(2分)body元素用于背景颜色的属性是()。正确答案：BA.vlinkB.background-colorC.alinkD.color3【单选题】(2分)为了标识一个HTML文件开始应该使用的HTML标记是()。正确答案：AA.＜html＞B.＜body＞C.＜table＞D.＜a＞4【单选题】(2分)在HTML中，单元格的标记是()。正确答案：DA.＜span＞B.＜tr＞C.＜body＞D.＜td＞5【单选题】(2分)CSS中的选择器不包括包括（）正确答案：BA.ID选择器B.超文本标记选择器C.元素选择器D.类选择器6【单选题】(2分)()是网页与网页之间联系的纽带，也是网页的重要特色。正确答案：BA.表格B.超链接C.框架D.导航条7【单选题】(2分)在HTML中，下面是段落标签的是：（）。正确答案：DA.＜head＞＜/head＞B.＜html＞＜/html＞C.＜body＞＜/body＞D.＜p＞＜/p＞8【单选题】(2分)（）标签可以应用于〈head〉中。正确答案：AA.＜title＞B.＜html＞C.＜image＞D.＜body＞9【单选题】(2分)下列哪一项是css添加背景图片的正确语法构成？（）正确答案：BA.background-colorB.background-imageC.background-positionD.background-size10【单选题】(2分)在HTML开发中,制作网站时首先需要考虑内容是()正确答案：DA.文字字体B.图片色彩C.页面内容D.页面布局1【单选题】(2分)HTTPError是URLError的子类，专门用来处理HTTP请求错误，比如认证请求失败等。它有3个属性，下列选项哪一个不是它的属性（）。正确答案：AA.ResponseB.codeC.reasonD.headers2【单选题】(2分)下列属于HTTP必须实现的请求方法的是（）。正确答案：AA.GET与HEADB.OPTIONS和CONNECTC.POST与DELED.TRACE和OPTIONS3【单选题】(2分)下列关于HTTP状态码类型描述错误的是（）。正确答案：AA.1XX表示请求已被服务器接受，无须后续处理B.4XX表示客户端可能发生错误C.3XX表示客户端的请求需采取进一步操作D.5XX表示服务器可能发生错误4【单选题】(2分)通过加入特定的____，可以将爬虫发出的请求伪装成浏览器。（）正确答案：CA.HeadersB.RequestC.User_AgentD.opener5【判断题】(2分)urlopen方法中的data参数可以不是bytes类型。（）正确答案：BA.对B.错6【判断题】(2分)requests库中的requests.get(url)方法是请求目标网站，类型是一个HTTPresponse类型。（）正确答案：BA.错B.对7【判断题】(2分)如果访问某网站的频率太高，则这个网站可能会禁止访问。（）正确答案：AA.对B.错8【判断题】(2分)requests库中的requests.get(url)方法中包括两个（对象）请求，其中一个为Request请求，即向服务器请求资源的request对象，第二个是Response请求，即包含从服务器返回的所有资源。（）正确答案：BA.错B.对9【判断题】(2分)Response类用于动态地响应客户端的请求，控制发送给用户的信息，并且将动态地生成响应，包括状态码、网页的内容等。（）正确答案：BA.错B.对1【单选题】(2分)下列不属于HTTP请求过程的是（）。正确答案：CA.超时设置B.生成请求C.搜索文档D.请求重定向2【单选题】(2分)下列关于Chrome开发者工具描述错误的是（）正确答案：AA.网络面板无法查看HTML源码B.网络面板可查看HTTP头部信息C.元素面板可查看元素在页面的对应位置D.源代码面板可查看HTML源码3【单选题】(2分)下列关于Xpah中功能函数描述错误的是（）正确答案：BA.text函数可提取节点文本内容B.contains方法可用于选取以指定值开头的节点C.text函数可用于选取包含指定文本内容的节点D.and方法可用于选取同时包含两种指定值的节点4【单选题】(2分)下列关于Beautifulsoup中对象类型描述错误的是（）正确答案：BA.string方法可获取Tag对象中的文本字符串内容B.attrs方法可获取Tag对象的HTML属性，返回值为列表形式C.name方法可以获取及修改Tag对象名称D.NavigableString对象无法被编辑，但可以进行替换5【单选题】(2分)下列选项中，属于非结构化数据的是：（）正确答案：BA.HTMLB.图像C.JSOND.XML6【判断题】(2分)对服务器端来说，它返回给客户端的数据格式可分为非结构化和结构化两种。（）正确答案：AA.对B.错7【判断题】(2分)网页中的非结构化数据是指数据结构不规则或不完整，没有预定义的数据模型，不方便使用数据库二维逻辑来表现的数据，包括所有格式的办公文档、文本、图像等。（）正确答案：AA.对B.错8【判断题】(2分)结构化数据就是能够用数据或统一的结构加以表示，具有模式的数据，包括HTML、XML和JSON等。（）正确答案：BA.错B.对9【判断题】(2分)正则表达式、XPath和BeautifulSoup都是基于HTML/XML文档的层次结构来确定到达指定节点的路径。（）正确答案：BA.对B.错10【判断题】(2分)XPath是一门在XML文档中查找信息的语言。XPath可用来在XML文档中对元素和属性进行遍历。（）正确答案：AA.对B.错1【单选题】(2分)使用以下哪个函数可以打开一个已经存在的文件？()正确答案：DA.readB.fileC.closeD.open2【单选题】(2分)文件访问的默认模式为()。正确答案：AA.rB.wC.aD.ab3【单选题】(2分)以二进制格式打开一个文件用于追加的访问模式为()。正确答案：CA.r+B.wC.abD.r4【单选题】(2分)改变文件目录所用的方法是()。正确答案：AA.chdir()B.remove()C.rename()D.read()5【单选题】(2分)文件删除所用的方法是（）正确答案：AA.remove()B.read()C.rename()D.readlines()6【判断题】(2分)使用withas语法。在with控制块结束时，文件会自动关闭（）。正确答案：BA.错B.对7【判断题】(2分)JSON也就是JavaScript对象标记（）。正确答案：AA.对B.错8【判断题】(2分)使调用dumps()方法将JSON字符串转化为对象()。正确答案：BA.对B.错9【判断题】(2分)使用readines（）方法不可以把整个文件中的内容进行一次性读取（）。正确答案：BA.对B.错10【判断题】(2分)向文件中写入数据，需要使用write方法()。正确答案：AA.对B.错1【单选题】(2分)以下哪个技术不是Ajax技术体系的组成部分？()正确答案：CA.DOMB.XMLHttpRequestC.DHTMLD.CSS2【单选题】(2分)下列哪些方法或属性是Web标准中规定的？()正确答案：DA.innerHTMLB.all()C.innerTextD.getElementsByTagName()3【单选题】(2分)下列selenium库的方法中，通过元素名称定位的是()。正确答案：AA.find_element_by_nameB.find_element_by_tag_nameC.find_element_by_class_nameD.find_element_by_id4【单选题】(2分)下面方法中，进行浏览器页面前进的方法是()。正确答案：AA.driver.forward()B.driver.go()C.driver.back()D.driver.refresh()5【单选题】(2分)关闭当前页面的方法是（）正确答案：CA.driver.forward()B.driver.quit()C.driver.close()D.driver.back()6【判断题】(2分)Ajax不能实现页面的交互（）。正确答案：BA.对B.错7【判断题】(2分)可以使用request向服务器发送请求，然后得到响应（）。正确答案：AA.对B.错8【判断题】(2分)使用driver.get()方法可以得到网页窗口的位置()。正确答案：AA.错B.对9【判断题】(2分)使用Ajax解析内容时，得到响应后，触发onreadystatechange属性对应的方法（）。正确答案：BA.错B.对10【判断题】(2分)DOM操作，即对Document网页文档进行操作，如更改、删除等()。正确答案：AA.对B.错1【单选题】(2分)下列不属于Scrapy框架的基本组成部分的是（）正确答案：BA.解析中间件B.引擎与调度器C.下载器与SpidersD.ItemPipelines2【单选题】(2分)下列对于Scrapy数据流向描述错误的是（）正确答案：CA.调度器返回下一个要爬取的URL给引擎，引擎将URL通过下载器中间件（请求方向）转发给下载器DownloadB.一旦网页下载完毕,下载器会生成一个该网页的响应,并将其通过下载器中间件（返回响应方向）发送给引擎C.Spiders处理响应并返同爬取到的Items及(跟进的)新的请求给引擎解析中间件D.引擎仅负责打开一个网站，并找到该网站的Spiders，并向该Spiders请求第一个要爬取的URL3【单选题】(2分)下列对于Scrapy常用命令及其作用描述正确的是（）正确答案：CA.List是一个全局命令，主要用于列出项目中所有可用的爬虫B.crawl是一个项目命令，主要用于启动限虫C.startproject是一个全局命令，主要用于运行一个独立的爬虫D.genspider是一个项目命令，主要用于创建爬虫模板4【单选题】(2分)下列对于Scrapy虫项目目录说法错误的是（）。正确答案：AA.items脚本定义了一个Item类，能够存储爬取的数据B.pipelines

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

网络爬虫开发（杨凌职业技术学院）知到智慧树答案

文档简介

温馨提示

最新文档

评论

网络爬虫开发（杨凌职业技术学院）知到智慧树答案

文档简介

温馨提示

最新文档

评论

相关文档