数据采集1+x中级习题库及参考答案_第1页
数据采集1+x中级习题库及参考答案_第2页
数据采集1+x中级习题库及参考答案_第3页
数据采集1+x中级习题库及参考答案_第4页
数据采集1+x中级习题库及参考答案_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x中级习题库及参考答案一、单选题(共63题,每题1分,共63分)1.JSON模块的哪个方法可以将Python内置类型序列化为json对象后写入文件A、dumps()B、load()C、loads()D、dump()正确答案:D2.以下描述不正确是()A、$(".intro)是获取所有class="intro"的元素B、$("#intro")获取id="intro"的元素C、$(this)是获取当前的HTML元素D、以上都不对正确答案:D3.NoSQL数据库的特点不包括()。A、分布式B、不基ACIDC、支持严格事务D、易拓展正确答案:C4.外链和反链的区别,说法正确的是()A、外链是指外部的网站指向本网站,反链则是指向本页面的内部或外部链接B、两者含义相同,只是不同名字而已C、外链对SEO有帮助,反链没有任何帮助D、外链是对于全站而言,反链只是指首页的链接正确答案:C5.哪个可以匹配正数、负数、和小数?A、^(-|+)?d+(.d+)?$B、^(-|+)?d+(.d+)?C、^(-|+)?d+(d+)?$D、^(-|+)?d+(.d+)$正确答案:A6.以下可用于日志数据数据分析和存储的工具是()。A、八爪鱼采集器B、filebeatC、WiresharkD、logstash正确答案:D7.关于赋值语句,以下选项中描述错误的是:()A、赋值语句采用符号“=”表示B、a.点b.c=b点c.a是不合法的C、赋值与二元操作符可以组合,例如&=D、a.b=b点a可以实现a和b值的互换正确答案:D8.FTP的主要特点不包括()。A、只提供文件传送的一些基本的服务B、可减少或消除在不同操作系统下处理文件的不兼容性C、使用客户服务器方式,可同时为多个客户进程提供服务D、使用UDP的运输服务正确答案:D9.filebeat的默认配置文件名称为()A、filebeat.configB、filebeatC、filebeat.ymlD、filebeat.cfg正确答案:C10.若要在基本表S中增加一列CN(课程名),可用A、ADDTABLESALTER(CNCHAR(8))B、ALTERTABLESADD(CNCHAR(8))C、ADDTABLES(CNCHAR(8))D、ALTERTABLES(ADDCNCHAR(8))正确答案:B11.()又称全网爬虫,爬行对象由一批种子URL扩充至整个Web,主要为门户站点、搜索引擎和大型Web服务提供商采集数据。A、增量式网络爬虫B、通用网络爬虫C、聚焦网络爬虫D、深层页面爬虫正确答案:B12.哪个轴可以选取当前节点?A、ancestorB、ancestor-or-selfC、selfD、以上都不对正确答案:C13.使用XPath选取名为lang的所有属性,表达式是()A、//@langB、//langC、langD、@lang正确答案:A14.echo$?的输出为()时,表示上一条命令执行成功。A、0B、大于1的正整数C、1D、-1正确答案:A15.以下不属于jQuery选择器的是()。A、.class选择器B、css选择器C、元素选择器D、#id选择器正确答案:B16.Python中,下面代码的输出结果是()print(0.1+0.2==0.3)A、falseB、TrueC、FalseD、true正确答案:C17.在xpath中,选取当前节点的所有先辈(父、祖父等)通过哪个轴()来实现?A、ancestorB、ancestor-or-selfC、ancestor-orD、以上都可以正确答案:A18.把对关系SC的属性GRADE的修改权授予用户ZHAO的SQL语句是A、GRANTGRADEONSCTOZHAOB、GRANTUPDATEONSCTOZHAOC、GRANTUPDATE(GRADE)ONSCTOZHAOD、GRANTUPDATE(GRADE)ONSCTOZHAO正确答案:C19.Python中,设s="HappyNewYear.则s[3:8]的值为():"A、"pyNew"B、"ppyN"C、"pyNe"D、"ppyNe正确答案:C20.在Xpath中,XML文档是被作为()来对待的?A、谓语B、属性C、节点D、节点树正确答案:D21.下面关于信息安全说法正确的是A、信息的泄露在信息传输和信息存储过程中都会发生B、信息的泄露只在信息存储过程中发生C、信息的泄露只在信息传输过程中发生D、信息的泄露在信息传输和信息存储过程中都不会发生正确答案:A22.Scrapy中,用于对Item进行清理、验证,并定义其输出的是A、ItemB、piplineC、settingsD、Spider正确答案:B23.简单网络管理协议缩写SNMP,是属于TCP/IP五层协议中的哪一层协议A、应用层B、网络层C、接口层D、传输层正确答案:A24.()是一种专业的网络文件存储设备,它基于LAN.按照TCP/IP协议进行通信,以文件的I/O方式进行数据传输。A、NASB、NAC、NASSD、NS正确答案:A25.jQuery中操作DOM时,以下哪个方法可以删除所有匹配的元素()A、removeAll()B、remove()C、empty()D、delete()正确答案:B26.Android开发中,以下哪个属性不用于表格布局()A、android:layout_rowB、android:shrinkColumnsC、android:stretchColumnsD、android:layout_column正确答案:A27.系统管理员常用的二进制命令文件,一般放置在()目录下。A、/bootB、/sbinC、/rootD、/usr/sbin正确答案:B28.关于数据采集特点,描述正确的是()A、采集的数据内容相对单一B、主要进行抽样采集方式C、数据采集以自动化采集手段为主要方式D、只采集基本数据正确答案:C29.将一个使用GBK编码的字节序列解码为字符串格式,应使用的方法是A、encode("utf-8)B、decode("utf-8")C、encode("gbk")D、decode("gbk")正确答案:D30.Logstash主要由三部分组成,不包含下列哪一项()。A、处理数据B、数据输出C、数据存储D、数据输入正确答案:C31.关于Python内存管理,下列说法错误的是()A、变量不必事先声明B、变量无须指定类型C、变量无须先创建和赋值而直接使用D、可以使用del释放资源正确答案:C32.以下可用于日志数据采集的工具是()。A、WiresharkB、filebeatC、八爪鱼采集器D、logstash正确答案:B33.Logstash中,哪个插件具有对基础类型数据处理的能力,包括重命名、删除、替换和修改日志事件中的字段等A、geoipB、mutateC、grokD、parse正确答案:B34.盒子模型具备的属性有几个()A、2B、1C、4D、3正确答案:C35.对表结构的修改可以通过执行SQL语句()来实现。A、droptableB、altertableC、selecttableD、updatetable正确答案:B36.数据库系统的核心是()。A、数据库B、数据模型C、数据库管理系统D、软件工具正确答案:C37.以下不是正则表达式元字符的是()A、&B、^C、$D、.正确答案:A38.Apache的安装在linux下使用命令()A、setB、installC、yumD、unset正确答案:C39.关于Python语句P=–P,以下选项中描述正确的是A、P和P的绝对值相等B、P的值为0C、P和P的负数相等D、给P赋值为它的负数正确答案:D40.HBase虚拟分布式模式须要()个节点?A、1B、2C、3D、最少3个正确答案:A41.以下哪种类型的网络容易遭受攻击()。A、无线网络B、租用专线网络C、宽带网络D、拨号网络正确答案:A42.哪个是中文字符的正则表达式?A、[u4e00-u9fa5]B、[u4e0-u9fa5]C、[4e00-u9fa5]D、[u4e00-u9fa5]正确答案:D43.“ab”+”c”*2结果是:()A、abccB、abcabcC、ababccD、abc2正确答案:A44.下列语句中查询姓李的学生的语句是()。A、select*from表名where姓名=‘李’B、select*from表名where姓名like‘李%’C、select*from表名where姓名like‘%李%’D、select*from表名where姓名like‘李’正确答案:B45.Apache服务器运行后会生成的日志文件,在()目录中A、/etc/httpd/logs1/B、/etc/httpd/log/C、/etc/httpd/logs/D、httpd/logs/正确答案:C46.CSS3中,无法将样式表加入到网页中的是()A、嵌入外部样式表B、链接外部样式表C、定义内部样式D、索引方式正确答案:D47.公司中有多个部门和多名职员,每个职员只能属于一个部门,一个部门可以有多名职员,从部门到职员的联系类型是()A、多对一B、一对多C、一对一D、多对多正确答案:B48.用于解析域名的协议是A、HTTPB、DNSC、FTPD、SMTP正确答案:B49.检索所有比“王华”年龄大的学生姓名、年龄和性别。正确的SELECT语句是A、SELECTSN,AGE,SEXFROMSWHEREAGE>(SELECTAGEFROMSWHERESN=“王华”)B、SELECTSN,AGE,SEXFROMSWHERESN=“王华”C、SELECTSN,AGE,SEXFROMSWHEREAGE>(SELECTAGEWHERESN=“王华”)D、SELECTSN,AGE,SEXFROMSWHEREAGE>王华.AGE正确答案:A50.CSS中通过哪个属性设定元素的背景图像()。A、imageB、background-imageC、background-positionD、background-attachment正确答案:B51.以下选项中不符合Python语言变量命名规则的是A、IB、3_1C、_AID、TempStr正确答案:B52.下列哪种说法是错误的()A、除字典类型外,所有标准对象均可以用于布尔测试B、空字符串的布尔值是FalseC、空列表对象的布尔值是FalseD、值为0的任何数字对象的布尔值是False正确答案:A53.下列Python标识符中哪个是合法的?()A、3QB、_C、i'mD、for正确答案:B54.以下关于数据采集特点的描述,不正确的是A、编写python程序可以爬取任意网站的任意数据B、以自动化手段为主,摆脱人工录入的方式C、涵盖了全量采集、增量采集,不对数据进行采样D、采集方式多样化、内容丰富化正确答案:A55."[^a-z]表示"A、匹配所有小写字母中的一个B、匹配所有非小写字母中的一个C、匹配以小写字母"a为开头的字符串D、匹配以非小写字母"a"为开头的字符串正确答案:B56.在OSI的七层参考模型中,工作在第三层上的网络设备是()A、网关B、交换机C、路由器D、集线器正确答案:C57.网络层上信息传输的基本单位称为()A、帧B、段C、数据报D、位正确答案:C58.数据库操作中,deletefromemployee语句的作用是()A、删除当前数据库中整个employee表,包括表结构B、删除当前数据库中employee表内的所有行C、由于没有where子句,因此不删除任何数据D、删除当前数据库中employee表内的当前行正确答案:B59.数据加工内容不包括()A、数据挖掘B、数据拆分C、数据过滤D、数据去噪正确答案:A60.Windows事件日志的事件类型,不包括()A、信息事件B、警告事件C、失败审核事件D、调试事件正确答案:D61.以下哪种方式可以将外部CSS样式文件嵌入网页()A、<linktype="text/cssrel="stylesheet"src="外部样式表的文件名称">B、<linktype="text/css"rel="stylesheet"href="外部样式表的文件名称">C、<linkhref="外部样式表的文件名称">D、<linksrc="外部样式表的文件名称">正确答案:B62.Apache服务器是实现()网络协议的服务器。A、FTPB、DHCPC、HTTPDD、HTTP正确答案:D63.下面哪类友情链接可以进行交换A、有跳转的链接B、隐藏看不到的链接C、导出链接比较少的链接D、带有nofollow的链接正确答案:C二、多选题(共17题,每题1分,共17分)1.下列哪种说法是错误的()。A、除字典类型外,所有标准对象均可以用于布尔测试B、空字符串的布尔值是TrueC、空列表对象的布尔值是FalseD、值为0的任何数字对象的布尔值是False正确答案:AB2.爬取网页数据时,以下是正确使用requests库的方法的是()。A、requests.delete('网址')B、requests.head('网址')C、requests.get('网址')D、requests.post('网址'.data=data)正确答案:ABCD3.以下属于数据采集范畴的是()。A、业务系统日志数据B、数据库数据C、互联网应用数据D、容器日志数据正确答案:ABCD4.正则表达式中,下列哪些可以匹配非负整数()?A、^d+$B、^[1-9]d*|0$C、^[1-9]d*$D、以上都对正确答案:BC5.以下属于HTTP请求消息头中的内容的是A、User-AgentB、RefererC、AcceptD、Accept-Encoding正确答案:ABCD6.以下是正确使用requests库的方法的是A、requests.get('网址')B、requests.post('网址'.data=data)C、requests.delete('网址')D、requests.head('网址')正确答案:ABCD7.下面所列各项,哪些属于数据库技术的研究领域?A、数据库管理系统软件的研制B、数据库设计C、操作系统D、数据库理论正确答案:ABD8.Linux系统中,下列属于进程类命令的是()A、topB、killC、pstreeD、nice正确答案:ABCD9.以下属于position常用属性的是()A、staticB、fixedC、relativeD、absolute正确答案:ABCD10.XPath用于在XML文档中通过()和()进行导航?A、属性B、节点C、元素D、属性值正确答案:AC11.在XPath中,节点包括以下哪些类型()?A、元素B、命名空间C、属性D、文本正确答案:ABCD12.下列哪些函数属于聚合函数()。A、count()B、str()C、sum()D、min()正确答案:ACD13.以下哪几项是Notification的特点A、按住状态栏往下拉,可以查看系统的提示消息B、消息内容显示于手机的状态栏中C、提示形式包含闪烁、震动,发出声音等D、适用于某些信息不需要用户马上处理的场合正确答案:ABCD14.JSON模块中,能够将Python列表或字典转换为JSON字符串或JSON格式的文件的方法是A、dumpsB、loadC、loadsD、dump正确答案:AD15.互联网应用中,搜索引擎的主要任务()A、信息搜集B、信息查询C、信息删除D、信息处理正确答案:ABD16.爬虫的基本流程主要包括()。A、解析内容B、获取响应内容C、发起请求D、保存数据正确答案:ABCD17.以下属于半结构化数据的是A、MySQL中的数据表B、日志文件C、XML文档D、JSON格式文档正确答案:BCD三、判断题(共27题,每题1分,共27分)1.假如路径起始于正斜杠(/),则此路径始终代表到某元素的相对路径。A、正确B、错误正确答案:B2.查看数据表的结构信息,可以在指定的数据库中使用“describe表名;”语句,通常简写为“desc表名;”A、正确B、错误正确答案:A3.能够使用filebeat和logstash完成日志数据的采集A、正确B、错误正确答案:A4.在OSI/RM中能完成不同数据编码格式的转换,提供数据压缩、解压缩服务并对数据进行加密、解密的层次是传输层A、正确B、错误正确答案:A5.操作系统中,绝对路径名都是从根目录开始。A、正确B、错误正确答案:A6.数据采集,是利用一种装置或程序从系统外部采集数据并输入到系统内部的一个接口A、正确B、错误正确答案:A7.系统处于不安全状态时一定发生了死锁。A、正确B、错误正确答案:B8.Windows操作系统在其运行的生命周期中会记录其大量的日志信息,这些日志信息包括:Windows事件日志(EventLog),Windows服务器系统的IIS日志,FTP日志,ExchangeServer邮件服务,MSSQLServer数据库日志等。A、正确B、错误正确答案:A9.匹配中国邮政编码的是:[1-9]d{5}(?!d)(中国邮政编码为6位数字)A、正确B、错误正确答案:A10.Tomcat作为独立服务器:请求来自于web浏览器A、正确B、错误正确答案:A11.个人发现网络运营者违反法律、行政法规的规定或者双方的约定收集、使用其个人信息的,有权要求网络运营者删除其个人信息A、正确B、错误正确答案:A12.Description的作用只有一个:诱发搜索者点击你的网站链接,对排名没任何影响。A、正确B、错误正确答案:B13.正则表达式中,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论