数据采集1+x中级测试题(含答案)_第1页
数据采集1+x中级测试题(含答案)_第2页
数据采集1+x中级测试题(含答案)_第3页
数据采集1+x中级测试题(含答案)_第4页
数据采集1+x中级测试题(含答案)_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x中级测试题(含答案)一、单选题(共63题,每题1分,共63分)1.数字法表示的权限中数字5代表()A、读运行B、写运行C、读写D、读写运行正确答案:A2.解决死锁的途径是()A、立即关机排除故障B、立即关机再重新开机C、不要共享资源,增加独占资源D、设计预防死锁的方法,运行检测并恢复正确答案:D3.哪个匹配禁止输入含有~的字符?A、[^~\x22]+B、[^~x22]C、都可以D、[^~22]+正确答案:A4.盒子模型具备的属性有几个()A、1B、3C、2D、4正确答案:D5.在Xpath中,XML文档是被作为()来对待的?A、节点树B、节点C、属性D、谓语正确答案:A6.Logstash的INPUT数据输入配置中用于开发人员进行测试的方式是哪一种A、kafkaB、stdinC、fileD、filebeat正确答案:B7.()又称全网爬虫,爬行对象由一批种子URL扩充至整个Web,主要为门户站点、搜索引擎和大型Web服务提供商采集数据。A、增量式网络爬虫B、通用网络爬虫C、聚焦网络爬虫D、深层页面爬虫正确答案:B8.以下关于网络层次与主要设备对应关系的描述中,配对正确的是()A、传输层——路由器B、数据链路层——网桥C、会话层——防火墙D、网络层——集线器正确答案:B9.以下不属于jQuery选择器的是()。A、css选择器B、元素选择器C、#id选择器D、.class选择器正确答案:A10.HBase是分布式列式存储系统,记录按什么()集中存放。A、列族B、列C、行D、不确定正确答案:A11.下面哪个不是Python合法的标识符()A、int32B、40XLC、__name__D、self正确答案:B12.重新启动Apache服务命令为()A、ServicehttpdrestartB、ServicerestartC、ServiceHttprestartD、Httpdrestart正确答案:A13.在Python中,关于全局变量和局部变量,以下选项中描述不正确的是()A、全局变量不能和局部变量重名B、全局变量在程序执行的全过程有效C、一个程序中的变量包含两类:全局变量和局部变量D、全局变量一般没有缩进正确答案:A14.以下可用于日志数据采集的工具是()。A、filebeatB、WiresharkC、八爪鱼采集器D、logstash正确答案:A15.百度进行大更新的时间最多的是A、每周二B、每周四C、每周一D、每周三正确答案:B16.创建链接文件的命令为A、linkfileB、lnC、softlinkD、hardlink正确答案:B17.重新启动Apache服务命令为()A、ServicehttpdrestartB、ServicerestartC、ServiceHttprestartD、Httpdrestart正确答案:A18.使用Web浏览器访问FTP时A、既能上传文件,也能下载文件B、只能下载文件,不能上传文件C、只能上传文件,不能下载文件D、用b浏览根本无法访问TP正确答案:B19.在RedhatLinux中一般使用()命令查看网络接口状态。A、ifconfigB、winipcfgC、ipconfigD、ping正确答案:A20.httpd的MPM特性中的三种工作方式为()A、preforks、worker、B、preforks、worker、eventC、preforks、worker、threadD、prefork、worker、event正确答案:D21.以下代码的输出结果是s="helloworld.andyoupat=r"hello(w+).and(w+)"m=re.search(pat.s)print(m.group(2))"A、worldB、helloworld.andyouC、youD、抛出异常正确答案:C22.正则表达式"[0-9.]表示的含义是"A、匹配所有的数字,".中的任意一个B、匹配所有的数字,"."中的任意多个C、匹配所有的数字,""、"."中的任意一个D、匹配所有的数字,""、"."中的任意多个正确答案:A23.下述关于关系型数据库系统,正确叙述是()A、数据库系统比文件系统能管理更多的数据B、数据库系统中数据的一致性是指数据类型一致C、数据库系统避免了一切冗余D、数据库系统减少了数据冗余正确答案:D24.下列表达式的值为True的是()A、(3.2)<("a."b")B、3>2>2C、"abc">"xyz"D、5+4j>2-3j正确答案:A25.jQuery中被誉为工厂函数的是()。A、$()B、function()C、ready()D、以上都不对正确答案:A26.为方便用户,IE设置了()功能,用户可以把感兴趣的网址记录下来A、收藏夹B、脱机浏览C、设置不忘记页D、缓存正确答案:A27.Android系统因资源不足终止Activity前调用()函数,用以保存Activity的状态信息,供onRestoreInstanceState()或onCreate()恢复之用。A、onPauseB、onStopC、onDestroyD、onSaveInstanceState正确答案:D28.日志优先级别不包括()A、TRACEB、INFOC、DEBUGD、NORMAL正确答案:D29.某文件的权限为:drw-r--r--.用数值形式表示为A、644B、611C、622D、422正确答案:A30.哪个表达式可以验证输入只能是汉字?A、^[u4e00-u9fa5]{0}$B、^[u4e00-u9fa5]{0.}C、^[u4e00-u9fa5]{0.}$D、以上都不对正确答案:C31.设s=”HappyNewYear”.则s[3:8]的值为:A、‘ppyNe’B、‘pyNe’C、‘pyNew’D、‘ppyN’正确答案:B32.用令牌控制来协调控制各节点的发送的网络的拓扑结构是()A、点—点全连接结构B、星形结构C、环形结构D、层次结构正确答案:C33.deletefromemployee语句的作用是()A、删除当前数据库中整个employee表,包括表结构B、删除当前数据库中employee表内的所有行C、由于没有where子句,因此不删除任何数据D、删除当前数据库中employee表内的当前行正确答案:B34.EIA/TIA568B线序()A、白橙/橙/白绿/绿/白蓝/蓝/白棕/棕B、白橙/橙/白绿/蓝/白蓝/绿/白棕/棕C、白绿/绿/白橙/橙/白蓝/蓝/白棕/棕D、白绿/绿/白橙/蓝/白蓝/橙/白棕/棕正确答案:B35.关于Python的全局变量和局部变量,以下选项中描述错误的是A、全局变量指在函数之外定义的变量,一般没有缩进,在程序执行全过程有效B、局部变量指在函数内部使用的变量,当函数退出时,变量依然存在,下次函数调用可以继续使用C、使用global保留字声明简单数据类型变量后,该变量作为全局变量使用D、简单数据类型变量无论是否与全局变量重名,仅在函数内部创建和使用,函数退出后变量被释放正确答案:B36.以下中间件,用于进行数据采集的工具为()A、filebeatB、javaC、tomcatD、apache正确答案:A37.以下聚合函数中,用来统计平均值的函数为()A、countB、minC、avgD、sum正确答案:C38.以下关于数据采集特点的描述,不正确的是A、采集方式多样化、内容丰富化B、以自动化手段为主,摆脱人工录入的方式C、编写python程序可以爬取任意网站的任意数据D、涵盖了全量采集、增量采集,不对数据进行采样正确答案:C39.关于Python,算法是指()A、程序设计语言的语句序列B、对问题的精确描述C、数学的计算公式D、解决问题的精确步骤正确答案:D40.下列哪个表达式是求整数?A、^-d+$B、^-?d$C、^-?d+$D、^-?d+正确答案:C41.数据加工内容不包括()A、数据挖掘B、数据过滤C、数据去噪D、数据拆分正确答案:A42.外链和反链的区别,说法正确的是()A、两者含义相同,只是不同名字而已B、外链是对于全站而言,反链只是指首页的链接C、外链对SEO有帮助,反链没有任何帮助D、外链是指外部的网站指向本网站,反链则是指向本页面的内部或外部链接正确答案:C43.把对关系SC的属性GRADE的修改权授予用户ZHAO的SQL语句是A、GRANTGRADEONSCTOZHAOB、GRANTUPDATEONSCTOZHAOC、GRANTUPDATE(GRADE)ONSCTOZHAOD、GRANTUPDATE(GRADE)ONSCTOZHAO正确答案:C44.设置Apache安装目录代码为()A、ServerRoot"/usr/local/apacheB、SetServerRoot"/usr/local/apache"C、SetServerRootD、SetMyServerRoot"/usr/local/apache"正确答案:A45.HTTPS使用()协议对报文进行封装A、SSHB、SSLC、SHA-1D、SET正确答案:B46.Apache服务器的主配置文件A、http.confB、httpd.confC、httpd.cfgD、config.cfg正确答案:B47.关于Python的复数类型,以下选项中描述错误的是A、复数类型表示数学中的复数B、对于复数z,可以用z.real获得它的实数部分C、复数的虚数部分通过后缀“J”或者“j”来表示D、对于复数z,可以用z.imag获得它的实数部分正确答案:D48.选取价格高于35的price节点?A、/book[price>35]/priceB、/bookstore/book[price>35]C、/bookstore/book[price>35]/priceD、以上都可以正确答案:C49.Mininet模拟真实网络的原理是使用Linux内核的什么机制A、filespaceB、namespaceC、directiveD、network正确答案:B50.对于爬虫抓取所需数据的url地址,以下说法正确的是A、数据抓取的地址的确定,要从异步请求、服务器端重定向、JS等多方面分析B、URL请求序列中的第一个URL就是数据抓取的地址C、浏览器地址栏中的地址就是数据抓取的地址D、URL请求序列中的第一个URL有可能是数据抓取的地址,但并不确定,这要看是否是异步请求正确答案:A51.取出html页面中所有的src属性,xpath代码为A、//img/@srcB、//srcC、/img/srcD、//@src正确答案:D52.在权限允许的前提下,一次性删除多级目录(目录不确定是否为空)的命令是:()A、rm-rfB、rmC、rmdir-pD、rmdir-R正确答案:A53.网上共享的资源有A、通信子网、资源子网、信道B、硬件、软件、文件C、软件、数据、信道D、硬件、软件、数据正确答案:D54.HBase虚拟分布式模式须要()个节点?A、1B、2C、3D、最少3个正确答案:A55.以下不属于HTTP请求报文结构中数据组成部分的是A、请求行B、请求头C、分割行D、请求体正确答案:C56.Apache服务器运行后会生成两个日志文件,其中,()是记录Web服务器的所有访问活动的文件。A、error_log(错误日志)B、/usr/local/tomcat/logsC、access_log(访问日志)D、logs正确答案:C57.进行数据采集的工具为()A、tomcatB、filebeatC、javaD、apache正确答案:B58.可以将不同服务器上的日志收集汇总的工具方式有()。A、uploadlogB、collectlogC、sendlogD、syslog正确答案:D59.以下哪个是关系型数据库()。A、NoSqlB、HbaC、RedisD、MySQL正确答案:D60.关于大数据的特征描述错误的是()A、数据处理速度要相对高效B、对数据实时性要求相对较高C、数据价值密度相对较高D、数据种类繁多正确答案:C61.与Apache网络和系统相关的选项中,设置监听端口号为80代码为()A、Listener80B、Listen80C、Lis80D、Listene80正确答案:B62.哪个轴可以选取当前节点的所有后代元素(子、孙等)?A、parentB、descendantC、ancestorD、child正确答案:B63.“ab”+”c”*2结果是:()A、abc2B、abcabcC、abccD、ababcc正确答案:C二、多选题(共17题,每题1分,共17分)1.下列哪些列类型是数值型的数据()A、DOUBLEB、INTC、SETD、FLOAT正确答案:ABD2.Linux系统中,下列属于进程类命令的是()A、killB、pstreeC、topD、nice正确答案:ABCD3.Python中,关于文件的打开方式,以下选项中描述错误的是()。A、文件只能选择二进制打开B、所有文件都可能以二进制方式打开C、文本文件只能以文本方式打开D、所有文件都可能以文本方式打开正确答案:ACD4.C/S是一种()。A、游戏B、网络模型C、主从式网络模型D、客户机服务器模型正确答案:BCD5.正则表达式是对()和()操作的一种逻辑公式?A、元字符B、普通字符正确答案:AB6.关于文件的打开方式,以下选项中描述错误的是()A、文件只能选择二进制或文本方式打开B、所有文件都可能以二进制方式打开C、文本文件只能以文本方式打开D、所有文件都可能以文本方式打开正确答案:ACD7.下列属于数据操纵语言中典型的语句有()A、INSERTB、SELECTC、UPDATED、DELETE正确答案:ABCD8.基本值是()节点?A、没有根B、无父C、有根D、无子正确答案:BD9.linux中安装软件可使用命令()。A、setupB、rpmC、源代码安装D、yuminstall正确答案:BCD10.以下属于jQuery特点的是()A、可以方便的为网站提供ajax交互B、是一个轻量级JavaScript库C、容易扩展,插件丰富D、兼容各种浏览器正确答案:ABCD11.进程的基本状态有()。A、就绪态B、运行态C、阻塞态D、停止态正确答案:ABC12.以下关于ListView描述正确的是:()A、ListView能够通过适配器将数据和自身绑定,在有限的屏幕上提供大量内容供用户选择B、ListView比较适合显示文本的列表,无法用于图文并茂的样式。C、ListView支持点击事件处理,用户可以用少量的代码实现复杂的选择功能D、ListView是一种用于垂直显示的列表控件,如果显示内容过多,则会出现垂直滚动条正确答案:ACD13.以下属于半结构化数据的是A、MySQL中的数据表B、XML文档C、JSON格式文档D、日志文件正确答案:BCD14.Windows事件日志中的事件类型主要有信息事件和()。A、成功审核事件B、失败审核事件C、错误事件D、警告事件正确答案:ABCD15.关于Python语言的浮点数类型,以下选项中描述错误的是()A、Python语言要求所有浮点数必须带有小数部分B、浮点数类型与数学中实数的概念是不一致的C、小数部分不可以为0D、浮点数类型表示带有小数的类型正确答案:BC16./etc/passwd文件中包含的信息有()。A、用户主目录B、uidC、gidD、shell正确答案:ABCD17.下载的方式除了WEB外,还有以下几种方式()。A、文件传送(FTP)B、远程登陆(Telnet)C、专门用于下载的软件,如WINRAR等D、QQ下载正确答案:AB三、判断题(共27题,每题1分,共27分)1.MongoDB将文档存储在集合中,文档类似关系数据库中的表。A、正确B、错误正确答案:A2.filebeat可以在Windows环境或Linux下进行配置A、正确B、错误正确答案:A3.数据库操作中,创建表用createtable语句。A、正确B、错误正确答案:A4.微服务架构是围绕着微服务思想构建的一系列结果的简称,是一种在传统软件应用架构的基础上,按照功能拆分为更加细粒度的服务,拆分出的每个服务都是一个独立的应用。A、正确B、错误正确答案:A5.JavaScript定义变量时,必须先使用var进行声明。A、正确B、错误正确答案:B6.数据加密DES的保密性仅取决于对密钥的保密,而算法是公开的。A、正确B、错误正确答案:A7.$(“div”).css(“color”,"red)可以将一个表单的所有div元素都设置为红色"A、正确B、错误正确答案:A8.在关系A(S,SN,D)和B(D,CN,NM)中,A的主键是S,B的主键是D,则D在S中称为外键A、正确B、错误正确答案:A9.数据库操作中,WHERENAMEISNOTNULL可以查找条件为:姓名不是NULL的记录。A、正确B、错误正确答案:A10.一个网站获取的反向链接越多越好,说明被认同的范围越广,所以反向链接追求高数量,对质量要求低。A、正确B、错误正确答案:B11.操作系统是系统软件中的一种,在进行系统安装时可以先安装其它软件,然后再装操作系统。A、正确B、错误正确答案:B12.网络爬虫是针对网站页面数据的爬取,不包括终端APP上页面信息的爬取

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论