




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据采集1+x中级练习题含答案一、单选题(共63题,每题1分,共63分)1.以下选项中,不符合Python语言变量命名规则的是A、keyword33_B、_33keywordC、keyword_33D、33_keyword正确答案:D2.在RedhatLinux中一般使用()命令查看网络接口状态。A、winipcfgB、ifconfigC、ipconfigD、ping正确答案:B3.关于Tomcat以下描述错误的是()A、是一个JSP/Servlet容器B、支持静态页,但效率没有Apache高C、一个Tomcat中可以配置多个虚拟主机,一个虚拟主机中可以配置多个web应用D、可以在TOMCAT_HOME/conf下的web.xml文件中修改其默认端口正确答案:D4.目前从Internet上下载文件的方法主要有3种,下列哪项不是A、通过FTP下载B、通过浏览器下载C、通过SMTP协议下载D、P2P下载正确答案:C5.关于python类,说法错误的是()A、类的实例方法必须创建对象前才可以调用B、类的类方法可以用对象和类名来调用C、类的静态属性可以用类名和对象来调用D、类的实例方法必须创建对象后才可以调用正确答案:A6.哪个表达式可以验证输入只能是汉字?A、^[u4e00-u9fa5]{0}$B、^[u4e00-u9fa5]{0.}C、^[u4e00-u9fa5]{0.}$D、以上都不对正确答案:C7.关键词分布中对SEO有危害的是A、锚节点B、标题C、左导航D、隐藏文字正确答案:D8.HBase是分布式列式存储系统,记录按什么()集中存放。A、列族B、列C、行D、不确定正确答案:A9.下列哪种行为符合使用计算机的道德规范()。A、删除自己计算机中不用的软件B、利用网络歪曲他人私人信息C、利用网络破坏他人计算机D、利用网络公布他人隐私正确答案:A10.哪个匹配非零开头的最多带两位小数的数字?A、^([1-9][0-9]*)+(.[0-9]{1.2})?B、^([1-9][0-9]*)+(.[0-9]{1.2})?$C、^([1-9][0-9]*)+(.[0-9]{1.2})$D、^([1-9][0-9]*)+([0-9]{1.2})?$正确答案:B11.选取第一个book的title?A、/bookstore/book[1]/titleB、/bookstore/book/titleC、bookstore/book[1]/titleD、/bookstore/book[0]/title正确答案:A12.下列哪种不是Python元组的定义方式()。A、(1.)B、(1.2.(3.4))C、(1.2)D、(1)正确答案:D13.以下代码的输出结果是s="helloworld.andyoupat=r"hello(w+).and(w+)"m=re.search(pat.s)print(m.group(2))"A、抛出异常B、youC、worldD、helloworld.andyou正确答案:B14.网络监测技术sFlow报文采用什么协议封装A、UDPB、IPC、TCPD、HTTP正确答案:A15.分层网络设计模型中的哪一层提供了将设备接入网络的途径并控制允许那些设备通过网络进行通信?A、分布层B、应用层C、核心层D、接入层E、网络层正确答案:D16.多个进程的实体能存在于同一内存中,在一段时间内都得到运行。这种性质称作进程的()A、并发性B、动态性C、异步性D、调度性正确答案:A17.Apache服务器运行后会生成两个日志文件,访问日志是哪个文件()A、access_logsB、access_logC、error_logD、errors_log正确答案:B18.设计表格时,以下配置可以让表格边框不显示的是()A、<tableborder=1></table>B、<tableborder="></table>C、<tableborder=0></table>D、<tableborder=-1></table>正确答案:C19.Python中,执行下列语句后的显示结果是什么?()>>>frommathimportsqrt>>>print(sqrt(3)*sqrt(3)==3)A、3B、sqrt(3)*sqrt(3)==3C、TrueD、False正确答案:D20.Logstash的运行需要什么基础环境A、JDKB、NetFrameworkC、ApacheD、Tomcat正确答案:A21.以下关于数据采集特点的描述,不正确的是A、采集方式多样化、内容丰富化B、以自动化手段为主,摆脱人工录入的方式C、涵盖了全量采集、增量采集,不对数据进行采样D、编写python程序可以爬取任意网站的任意数据正确答案:D22.《电信和互联网用户个人信息保护规定》中规定接受与用户个人信息保护有关的投诉,并自接到投诉之日起()内答复投诉人。A、二十日B、十五日C、三十日D、十日正确答案:B23.客户端首次查询HBase数据库时,首先需要从哪个()表开始查找。A、META.B、–ROOT-C、用户表D、信息表正确答案:B24.python中,导入模块的方式错误的是()A、importmfrommoB、importmoC、frommoimport*D、importmoasm正确答案:A25.Python中,关于字符串下列说法错误的是()A、在三引号字符串中可以包含换行回车等特殊字符B、字符应该视为长度为1的字符串C、字符串以标志字符串的结束D、既可以用单引号,也可以用双引号创建字符串正确答案:D26.下面对HBase的描述哪些是错误的?()。A、不是开源的B、是面向列的C、是分布式的D、是一种NoSQL数据库正确答案:A27.设置一个内联子窗口时,使用哪个标签()A、<fieldset>B、<iframe>C、<table>D、<noframe>正确答案:B28.正则表达式“[a-z_]”表示的含义是()A、取所有小写英文字母以及_中的任意多个。B、取“a、-、z、_”中的任意多个。C、取“a、-、z、_”中的任意一个。D、取所有小写英文字母以及_中的任意一个。正确答案:D29.关于“user-agent”(用户代理)的描述错误的是A、代表用户发起HTTP请求的客户端程序B、所有发布Web请求的应用程序都是HTTPAgent代理C、Web浏览器也是一种HTTPAgent代理D、网络爬虫只是一段程序,并不是代理正确答案:D30.水平子系统的线缆端与工作区的端接,另一端与楼层配线间的相连接。()A、垂直干线、配线架B、建筑外主干线缆、配线架C、信息插座、建筑外主干线缆D、信息插座、配线架正确答案:D31.对数据采集相关法律说法正确的是()A、明确数据信息收集主体的资格与责任B、不限定数据信息收集的对象与范围C、不规范数据信息收集的方式与要求D、不需要明确数据信息收集的政府责任正确答案:A32.以下()命令可正确显示shell环境变量PATH的值A、echoPATHB、echo$PATHC、catPATHD、cat$PATH正确答案:B33.为了得到所有的命令行输入的参数,我们可以使用变量()A、$#B、$!C、$0D、$*正确答案:D34.下列哪种行为符合使用计算机的道德规范A、利用网络公布他人隐私B、利用网络歪曲他人私人信息C、利用网络破坏他人计算机D、删除自己计算机中不用的软件正确答案:D35.定义类如下classHello():def__init__()=namedefshowInfo(self)print()下面代码能正常执行的()A、h=Helloh.showInfo()B、h=Hello(‘张三’)h.showInfo()C、h=Hello()h.showInfo(‘张三’)D、h=Hello(‘admin’)1.showInfo正确答案:B36.Logstash中,哪个插件可以通过正则解析文本,通过正则匹配将非结构化日志数据构建成结构化数据。A、geoipB、mutateC、grokD、parse正确答案:C37.关于赋值语句,以下选项中描述错误的是:()A、a.点b.c=b点c.a是不合法的B、赋值语句采用符号“=”表示C、赋值与二元操作符可以组合,例如&=D、a.b=b点a可以实现a和b值的互换正确答案:D38.在xpath中,选取当前节点的所有先辈(父、祖父等)通过哪个轴()来实现?A、ancestorB、ancestor-or-selfC、ancestor-orD、以上都可以正确答案:A39.在Windows中,对文件夹进行复制时,()A、只复制文件夹名,不复制其内容B、只复制文件夹名和其下的文件,不复制其下的文件夹C、复制文件夹名的其下所有的文件和子文件夹D、复制文件夹名和其下所有的文件和子文件夹,但不复制子文件夹下的文件正确答案:C40.数字法表示的权限中数字5代表()A、读写B、读运行C、读写运行D、写运行正确答案:B41.选取当前节点的所有后代元素(子、孙等)以及当前节点本身需要哪个轴?A、childB、descendant-or-selfC、parentD、descendant正确答案:B42.jQuery中,定义array的语法错误的是()A、newArray(size);B、newArray(ele0.ele1ele);C、newArray();D、newArray[];正确答案:D43.数据库管理系统是A、一种操作系统B、操作系统的一部分C、一种编译程序D、在操作系统支持下的系统软件正确答案:D44.数据包丢失一般是由网络()引起的A、拥塞B、断线C、安全D、死机正确答案:A45.数据采集中,数据加工内容不包括()A、数据挖掘B、数据过滤C、数据拆分D、数据去噪正确答案:A46.Mininet模拟真实网络的原理是使用Linux内核的什么机制A、directiveB、filespaceC、namespaceD、network正确答案:C47.关于JavaScript基本规范,描述不正确是是()A、使用=或!=来比较两个对象,返回true/falseB、switch必须带有default分支C、函数应该有返回值D、命名要有意义,使用驼峰命名法正确答案:A48.使用httpd命令查看Apache软件的安装版本信息,命令为()A、httpd-vB、httpd-versionC、httpdD、http正确答案:A49.HBase依靠()存储底层数据。A、HDFSB、HadoopC、MemoryD、MapReduce正确答案:A50.jQuery中,以下哪个中方式可以给input元素赋值()A、$("input").html("值")B、$("input").text("值")C、$("input).val("值")D、$("input").content("值")正确答案:C51.关于大数据的特征描述错误的是()A、数据处理速度要相对高效B、数据价值密度相对较高C、数据种类繁多D、对数据实时性要求相对较高正确答案:B52.下面哪类友情链接可以进行交换A、隐藏看不到的链接B、有跳转的链接C、带有nofollow的链接D、导出链接比较少的链接正确答案:D53.关于Python,type(1+2L*3.14)的结果是:()A、<type"long">B、<type"float">C、<type"str">D、<type"int>正确答案:B54.自由软件的含义是()A、只有软件作者才能向用户收费B、用户不需要付费C、软件发行商不能向用户收费D、软件可以自由修改和发布正确答案:D55.在计算机网络中,能将异种网络互连起来,实现不同网络协议相互转换的网络互连设备是()。A、交换机B、路由器C、中继器D、网关正确答案:B56.()又称全网爬虫,爬行对象由一批种子URL扩充至整个Web,主要为门户站点、搜索引擎和大型Web服务提供商采集数据。A、聚焦网络爬虫B、深层页面爬虫C、增量式网络爬虫D、通用网络爬虫正确答案:D57.公司中有多个部门和多名职员,每个职员只能属于一个部门,一个部门可以有多名职员,从部门到职员的联系类型是()A、一对多B、一对一C、多对一D、多对多正确答案:A58.使用scrapy命令创建的项目中,哪个文件用于定义爬取内容的输出A、middleware.pyB、items.pyC、pipelines.pyD、out.py正确答案:C59.哪个轴可以选取当前节点的所有命名空间节点?A、ancestorB、namespaceC、childD、parent正确答案:B60.以下哪个属性可以修饰HTML中单词换行()A、letter-spacingB、text-decorationC、word-breakD、text-transform正确答案:C61.有关行业组织建立健全本行业的网络安全保护规范和协作机制,加强对网络安全风险的分析评估,是哪个法律中规定的()A、《中华人民共和国网络安全法》B、《电信和互联网用户个人信息保护规定》C、《互联网用户个人信息保护规定》D、《民法总则》正确答案:A62.重新启动Apache服务命令为()A、ServicehttpdrestartB、ServicerestartC、ServiceHttprestartD、Httpdrestart正确答案:A63.Logstash主要由三部分组成,不包含下列哪一项()。A、数据存储B、处理数据C、数据输出D、数据输入正确答案:A二、多选题(共17题,每题1分,共17分)1.下列命令是主机信息类查询命令的是()A、unameB、cpunameC、hostnameD、host正确答案:AC2.业务系统中产生的两种数据是()。A、日志数据B、数据库数据C、图像数据D、文本快照正确答案:AB3.BeautifulSoup的解析器包括A、lxmlB、xmlC、html.parserD、html5lib正确答案:ABCD4.下列哪些列类型是数值型的数据()A、DOUBLEB、INTC、SETD、FLOAT正确答案:ABD5.关系数据库中,不是用来实现表与表之间联系的是()A、值域B、参照完整性规则C、实体完整性规则D、用户自定义的完整性规则正确答案:ACD6.正则表达式的特点?A、功能性B、复杂性C、逻辑性D、灵活性正确答案:ACD7.根据《中华人民共和国网络安全法》,下列说法正确的是()A、网络运营者在一定条件下可以泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息B、发现网络运营者收集、存储的其个人信息有错误的,有权要求网络运营者予以更正C、网络运营者应当采取技术措施和其他必要措施,确保其收集的个人信息安全,防止信息泄露、毁损、丢失D、第四十条网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度正确答案:BCD8.jQuery对DOM的操作,以下说法正确的是()A、$(A).append(B)表示将A追加到B中B、$(A).after(B)表示将A插入到B以后C、$(A).appendTo(B)表示把A追加到B中D、$(A).insertAfter(B)表示将A插入到B以后正确答案:CD9.Python中,以下选项中说法不正确的是()A、编译是将源代码逐条转换成目标代码同时逐条运行目标代码的过程B、Python语言是脚本语言C、静态语言采用解释方式执行,脚本语言采用编译方式执行D、解释是将源代码转换成目标代码的过程正确答案:ACD10.主要用来处理HTTP协议的Web服务器有哪些()。A、nginxB、IISC、apacheD、tomcat正确答案:ABCD11.Windows事件日志中的事件类型主要有信息事件和()。A、失败审核事件B、成功审核事件C、错误事件D、警告事件正确答案:ABCD12.在xpath中,基本值是()节点。A、有根B、无子C、没有根D、无父正确答案:BD13.按照数据发生的主体不同,数据采集范围主要包括()。A、感知设备数据采集B、系统日志采集C、数据库采集D、网络数据采集正确答案:ABCD14.节点是通过沿着()或者步()来选取的?A、属性B、路径C、步D、谓语正确答案:BC15.Linux体系结构一般有哪些部分()A、内核(kernel)B、命令解释层(Shell或其他操作环境)C、实用工具D、应用程序正确答案:ABC16.下列哪些可以匹配由26个英文字母组成的字符串?A、^[A-Z]+$B、^[a-z]+$C、^[A-Za-z]+$D、^[A-Za-z]正确答案:ABC17.关于形参和实参的描述,以下选项中错误的是()A、程序在调用时,将形参复制给函数的实参B、函数定义中参数列表里面的参数是实际参数,简称实参C、参数列表中给出要传入函数内部的参数,这类参数称为形式参数,简称形参D、函数调用时,实参默认采用按照位置顺序的方式传递给函数,Python也提供了按照形参名称输入实参的方式正确答案:ABC三、判断题(共27题,每题1分,共27分)1.RARP将IP地址转换到物理地址,而ARP相反A、正确B、错误正确答案:B2.使用Xpath需要从lxml库中导入etree模块,并使用HTML类对需要匹配的HTML对象进行初始化A、正确B、错误正确答案:A3.print()函数可同时输出一个或多个数据,在输出多个数据时,默认使用空格作为输出分隔符。A、正确B、错误正确答案:A4.正则表达式的关键之处在于确定你要搜索匹配的东西,如果没有这一概念,正则将毫无用处。每一个表达式都包含需要查找的指令。A、正确B、错误正确答案:A5.w与[0-9a-zA-Z]是等效的A、正确B、错误正确答案:B6.logstash只负责传输数据,不具备数据解析、验证、拆分功能A、正确B、错误正确答案:B7.HBase的底层存储为HDFS。A、正确B、错误正确答案:A8.在网络上爬虫抓取到的数据,可直接应用于商业交易,不必关系数据所有权属A、正确B、错误正确答案:B9.针对数据库操作,候选关键字中的属性称为复合属性。A、正确B、错误正确答案:B10.静态路由是手工添加,适用于小型网络,动态路由是自动生成路径,适用于大型网络。A、正确B、错误正确答案:A11.文件共享是指系统允许多个用户或者进程去共享同一个文件,文件共享只限于系统内共享。A、正确B、错误正确答案:B12.//@lang选取名为lang的一些属性。A、正确B、错
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 垃圾分类知识问答
- 八年级春季班级评优评先方案
- 四年级心理安全和情绪管理计划
- 建筑施工安全知识
- 小学科学课外拓展计划与实践
- 企业培训班班主任管理计划
- 公司内部审计与财务报告编制制度
- 外研版九年级英语上学期考试复习计划
- 纳章小学2025 学生心理健康小组活动计划
- 桥梁建设施工环保措施计划
- 人力资源任务清单及工作分解表
- 人教版八年级下册历史第一二单元复习课件
- 英语PET真题集标准版T2口语训练
- 神木市小保当二号煤矿矿山地质环境保护与土地复垦方案
- 中学数学解题研究课程教学大纲
- 中国脑卒中流行现状和发展趋势
- 【校企合作视角下民航专业人才培养机制探究(论文)】
- 造价咨询重点、难点及控制措施
- 小学英语湘少版三年级起点《Unit 10 He has two feet.》获奖教学设计-四年级英语教案
- 零基础的住宅和城市设计智慧树知到答案章节测试2023年同济大学
- 抗菌药物临床应用指导原则(2023年版)
评论
0/150
提交评论