数据采集1+x中级练习题库_第1页
数据采集1+x中级练习题库_第2页
数据采集1+x中级练习题库_第3页
数据采集1+x中级练习题库_第4页
数据采集1+x中级练习题库_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x中级练习题库一、单选题(共70题,每题1分,共70分)1、关于HTTP的head消息“connection:keep-alive”,以下描述正确的是A、可以在每个HTTP连接中进行多次次请求和响应B、能够一直保持与服务器之间的连接C、仅适用于HTTP/1.1D、只能在每个HTTP连接中进行一次请求和响应正确答案:A2、以下关于网络层次与主要设备对应关系的描述中,配对正确的是()A、网络层——集线器B、传输层——路由器C、数据链路层——网桥D、会话层——防火墙正确答案:C3、任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能、窃取网络数据等危害网络安全的活动是在()法律中规定的A、《用户个人信息保护法》B、《民法总则》C、《电信和互联网用户个人信息保护规定》D、《中华人民共和国网络安全法》正确答案:D4、与Apache网络和系统相关的选项中,设置监听端口号为80代码为()A、Listener80B、Lis80C、Listen80D、Listene80正确答案:C5、在JavaEE应用中,通常采用三层架构模型,不包含下列哪个选项A、数据访问层(DAL)B、业务逻辑层(BLL)C、表现层(UI)D、存储层(DS)正确答案:D6、HBase的特点不包括()。A、列存储B、支持join操作C、容量巨大D、稀疏性正确答案:B7、可以将不同服务器上的日志收集汇总的工具方式有()。A、sendlogB、collectlogC、uploadlogD、syslog正确答案:D8、“ab”+”c”*2结果是:()A、abc2B、abcabcC、abccD、ababcc正确答案:C9、关于python类,说法错误的是()A、类的类方法可以用对象和类名来调用B、类的静态属性可以用类名和对象来调用C、类的实例方法必须创建对象前才可以调用D、类的实例方法必须创建对象后才可以调用正确答案:C10、数据库系统的核心是()。A、软件工具B、数据模型C、数据库管理系统D、数据库正确答案:C11、关于JavaScript基本规范,描述不正确是是()A、使用=或!=来比较两个对象,返回true/falseB、switch必须带有default分支C、命名要有意义,使用驼峰命名法D、函数应该有返回值正确答案:A12、取出html页面中所有的src属性,xpath代码为A、//img/@srcB、//srcC、/img/srcD、//@src正确答案:D13、以下选项中,不符合Python语言变量命名规则的是A、33_keywordB、_33keywordC、keyword_33D、keyword33_正确答案:A14、数据库恢复的基础是利用转储的冗余数据。这些转储的冗余数据包括A、数据字典、应用程序、审计档案、数据库后备副本B、数据字典、应用程序、日志文件、审计档案C、数据字典、应用程序、数据库后备副本D、日志文件、数据库后备副本正确答案:D15、Windows事件日志的事件类型,不包括()A、调试事件B、信息事件C、警告事件D、失败审核事件正确答案:A16、外链和反链的区别,说法正确的是()A、外链对SEO有帮助,反链没有任何帮助B、外链是对于全站而言,反链只是指首页的链接C、两者含义相同,只是不同名字而已D、外链是指外部的网站指向本网站,反链则是指向本页面的内部或外部链接正确答案:A17、正则表达式中,下列()表达式是求整数?A、^-?d+B、^-?d$C、^-?d+$D、^-d+$正确答案:C18、数据包丢失一般是由网络()引起的A、断线B、死机C、安全D、拥塞正确答案:D19、<inputid="jq1type="text"/>以下哪种可以隐藏该属性()"A、$("jq1).hide();B、$("#jq1").remove();C、$(#jq1).remove();D、$("#jq1").hide();正确答案:D20、以下对NoSQL特点描述中,错误的是()。A、支持SQL.用戸学习使用很方便B、当插入数据时,不需要预先定义其模式C、简单易部署,基本都是开源软件D、数据存储不需要固定的表结构.通常也不存在连接操作正确答案:A21、下述关于关系型数据库系统,正确叙述是()A、数据库系统中数据的一致性是指数据类型一致B、数据库系统减少了数据冗余C、数据库系统避免了一切冗余D、数据库系统比文件系统能管理更多的数据正确答案:B22、以下选项中说法不正确的是()?A、编译是将源代码转换成目标代码的过程B、解释是将源代码逐条转换成目标代码同时逐条运行目标代码的过程C、静态语言采用解释方式执行,脚本语言采用编译方式执行D、C语言是静态语言,Python语言是脚本语言正确答案:C23、盒子模型具备的属性有几个()A、3B、4C、1D、2正确答案:B24、系统管理员常用的二进制命令文件,一般放置在()目录下。A、/usr/sbinB、/bootC、/rootD、/sbin正确答案:D25、关于Python的全局变量和局部变量,以下选项中描述错误的是A、使用global保留字声明简单数据类型变量后,该变量作为全局变量使用B、简单数据类型变量无论是否与全局变量重名,仅在函数内部创建和使用,函数退出后变量被释放C、全局变量指在函数之外定义的变量,一般没有缩进,在程序执行全过程有效D、局部变量指在函数内部使用的变量,当函数退出时,变量依然存在,下次函数调用可以继续使用正确答案:D26、使用Web浏览器访问FTP时A、只能上传文件,不能下载文件B、用b浏览根本无法访问TPC、既能上传文件,也能下载文件D、只能下载文件,不能上传文件正确答案:D27、Python语言中用来定义函数的关键字是()A、funB、defineC、defD、function正确答案:C28、简单网络管理协议缩写SNMP,是属于TCP/IP五层协议中的哪一层协议A、接口层B、网络层C、应用层D、传输层正确答案:C29、数据采集是数据分析前的重要且首要环节,数据采集需要符合哪些特性()A、多维性、灵活性、高延迟B、低维度、高并发、高速率C、单一化、低维度、低并发D、全面性、多维性、高效性正确答案:D30、Apache服务器运行后会生成两个日志文件,访问日志是哪个文件()A、error_logB、errors_logC、access_logsD、access_log正确答案:D31、Apache服务器中检验配置是否有语法错误代码为()A、apachectlconfigtest01B、apachectlconfigtestC、testlogD、apachectl正确答案:B32、echo$?的输出为()时,表示上一条命令执行成功。A、大于1的正整数B、1C、-1D、0正确答案:D33、匹配m-n位的数字?A、^d{m.n}B、d{m.n}$C、^d{m.n}$D、^d{m.n}$正确答案:C34、哪个轴可以选取当前节点的所有子元素?A、parentB、以上都不对C、childD、childs正确答案:C35、test检查模式当中表示检查对象是否是个目录的选项是()A、-aB、-dC、-fD、-e正确答案:B36、下列不是手机操作系统的是?()A、Window?MobileB、AndroidC、WindowsVistaD、IOS正确答案:C37、Android系统是基于Linux操作系统开发的手机系统,因此在进行刷机、删除系统自带软件时需要获得管理员账户()的权限A、adminB、liveuserC、administratorD、root正确答案:D38、下面哪个HTTP状态码是搜索引擎返回的抓取正常的状态码A、500B、404C、200D、301正确答案:C39、在计算机网络中,能将异种网络互连起来,实现不同网络协议相互转换的网络互连设备是()A、路由器B、网关C、交换机D、中继器正确答案:A40、Python中,设s="HappyNewYear.则s[3:8]的值为():"A、"pyNe"B、"ppyN"C、"pyNew"D、"ppyNe正确答案:A41、重新启动Apache服务命令为()A、HttpdrestartB、ServicerestartC、ServiceHttprestartD、Servicehttpdrestart正确答案:D42、哪个轴可以选取文档中当前节点的结束标签之后的所有节点?A、selfB、childC、followingD、parent正确答案:C43、TCP/IP层的网络接口层对应OSI的A、网络层B、物理层和链路层C、物理层D、链路层正确答案:B44、以下代码的输出结果是s="helloworld.andyoupat=r"hello(w+).and(w+)"m=re.search(pat.s)print(m.group(2))"A、worldB、youC、抛出异常D、helloworld.andyou正确答案:B45、下列哪种不是Python元组的定义方式()。A、(1.2.(3.4))B、(1)C、(1.2)D、(1.)正确答案:B46、scrapy框架的运行流程中,()组件是scrapy框架的核心组件A、DownLoaderB、ScrapyEngineC、SchedulerD、Spiders正确答案:B47、logstash默认端口号为()。A、7070B、5044C、8080D、8089正确答案:B48、下面关于信息安全说法正确的是A、信息的泄露只在信息存储过程中发生B、信息的泄露只在信息传输过程中发生C、信息的泄露在信息传输和信息存储过程中都不会发生D、信息的泄露在信息传输和信息存储过程中都会发生正确答案:D49、通配符node()表示可以匹配()?A、任何属性节点B、任何元素节点C、任何类型的节点D、以上说法都不对正确答案:C50、将一个使用GBK编码的字节序列解码为字符串格式,应使用的方法是A、encode("gbk")B、decode("utf-8")C、encode("utf-8)D、decode("gbk")正确答案:D51、日志数据采集通常借用一些开源工具来完成,对于工具作用以下描述正确的是()A、可通过配置logstash,接收原始的日志数据并进行处理B、以上都正确C、可通过配置filebeat工具,完成日志数据的采集D、利用logstash将采集结果存入数据库或者文件正确答案:B52、关于Python语言的特点,以下选项描述正确的是A、Python语言是非跨平台语言B、Python语言是解释型语言C、Python语言不支持面向对象D、Python语言是编译型语言正确答案:B53、在xpath中,选取文档中当前节点的开始标签之前的所有节点是哪个轴()。A、parentB、preceding-siblingC、precedingD、self正确答案:C54、HBase依靠()存储底层数据。A、HadoopB、HDFSC、MemoryD、MapReduce正确答案:B55、scrapy的哪个命令可以测试爬取网页的整个过程A、scrapybenchB、scrapyfetchC、scrapyshellD、scrapyview正确答案:A56、数据采集相关法律中限定数据信息收集的对象与范围是哪个法律()A、《中华人民共和国网络安全法》B、《电信和互联网用户个人信息保护规定》C、《中华人民共和国安全法》D、《民法总则》正确答案:B57、数据加工内容不包括()A、数据过滤B、数据拆分C、数据去噪D、数据挖掘正确答案:D58、jQuery常用的选择器中,()选择器表示当前HTML元素。A、$(this)B、$("this")C、$(p)D、$("p)正确答案:A59、百度进行大更新的时间最多的是A、每周四B、每周二C、每周三D、每周一正确答案:A60、密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线)是哪个?A、^[a-zA-Z]w{6.18}$B、^[a-zA-Z]w{5.17}C、^[a-zA-Z]{5.17}$D、^[a-zA-Z]w{5.17}$正确答案:D61、以下选项中,不是Python语言保留字的是A、gotoB、continueC、whileD、for正确答案:A62、以下关于数据采集特点的描述,不正确的是A、编写python程序可以爬取任意网站的任意数据B、采集方式多样化、内容丰富化C、涵盖了全量采集、增量采集,不对数据进行采样D、以自动化手段为主,摆脱人工录入的方式正确答案:A63、若系统在运行过程中,由于某种硬件故障,使存储在外存上的数据部分损失或全部损失,这种情况称为A、系统故障B、事务故障C、介质故障D、运行故障正确答案:C64、以下哪个框架是一个分布式的爬虫框架,用户只需编写几个特定的函数,而无需关注分布式运行的细节,任务就会被自动分配到多台机器上A、BeautifulSoup框架B、Scrapy框架C、CoB框架D、Pyspider框架正确答案:C65、FTP的主要特点不包括()。A、可减少或消除在不同操作系统下处理文件的不兼容性B、使用UDP的运输服务C、只提供文件传送的一些基本的服务D、使用客户服务器方式,可同时为多个客户进程提供服务正确答案:B66、下面代码实现的功能描述的是()deffact(n):ifn==0:return1else:returnn*fact(n-1)num=eval(input("请输入一个整数:))print(fact(abs(int(num))))"A、接受用户输入的整数n,输出n的阶乘值B、接受用户输入的整数n,判断n是否是素数并输出结论C、接受用户输入的整数n,判断n是否是完数并输出结论D、接受用户输入的整数n,判断n是否是水仙花数正确答案:A67、对表结构的修改可以通过执行SQL语句()来实现。A、altertableB、updatetableC、selecttableD、droptable正确答案:A68、SQL语言中,删除一个视图的命令是()。A、DELETEB、CLEARC、REMOVED、DROP正确答案:D69、以下关于模块说法错误的是()A、运行时会从制定的目录搜索导入的模块,如果没有,会报错异常B、一个xx.py就是一个模块C、任何一个普通的xx.py文件可以作为模块导入D、模块文件的扩展名不一定是.py正确答案:D70、以下哪个HTTP头的作用是将爬虫伪装成正常的浏览器的A、User-AgentB、Accept-EncodingC、RefererD、Accept正确答案:A二、多选题(共20题,每题1分,共20分)1、以下属于CRM主要应用方面的是()。A、合同管理B、销售报表C、预测销售业绩D、客户档案有序管理正确答案:ABCD2、在XPath中,节点包括以下哪些类型()?A、属性B、元素C、命名空间D、文本正确答案:ABCD3、业务系统中产生的两种数据是()。A、日志数据B、数据库数据C、文本快照D、图像数据正确答案:AB4、业务系统中产生的数据会有两种保存方式:_(1)_和_(2)_。A、数据库数据B、文本快照C、图像数据D、日志数据正确答案:AD5、关于Python组合数据类型,以下选项中描述错误的是()A、Python组合数据类型能够将多个同类型或不同类型的数据组织起来,通过单一的表示使数据操作更有序、更容易B、序列类型是二维元素向量,元素之间存在先后关系,通过序号访问C、组合数据类型可以分为3类:序列类型、集合类型和映射类型D、Python的str、tuple和list类型不都属于序列类型正确答案:BD6、在当前目录(非根目录)下有一个test.sh脚本文件.以下哪些选项可以运行该脚本文件()A、bash/test.shB、shtest.shC、bashtest.shD、sh./test.sh正确答案:BCD7、vim文本编辑器有哪些模式()A、输入模式B、命令模式C、末行模式D、引用模式正确答案:ABC8、现在将/目录下的www文件权限改为只有主用户有执行的权限,其他用户没有执行权限()A、chmodu+x.g-x.o-x/wwwB、chmod100/wwwC、chmodo-x.g-x.u-x/wwwD、chmod001/www正确答案:AB9、下载的方式除了WEB外,还有以下几种方式()。A、文件传送(FTP)B、专门用于下载的软件,如WINRAR等C、QQ下载D、远程登陆(Telnet)正确答案:AD10、Tomcat是一个开源的小型的轻量级应用服务,且具有()特点。A、支持负载平衡B、占用系统资源少C、邮件服务D、扩展性好正确答案:ABCD11、若当前目录中只有一个名为file的文件,下列那些命令可以创建一个名为newfile新文件()。A、catnewfileB、vimnewfileC、cpfilenewfileD、catfile>newfile正确答案:BCD12、数据库操作中,针对模糊查询正确的是()A、匹配多个字符使用”_”B、使用关键字likeC、匹配单个字符使用”_”D、匹配多个字符使用”%”正确答案:BCD13、根据网页内容获取方式不同.可以将网页分为()。A、标记型网页B、专业型网页C、动态页面D、静态页面正确答案:CD14、节点是通过沿着()或者步()来选取的?A、步B、谓语C、属性D、路径正确答案:AD15、计算机网络通信威胁行为中属于主动攻击行为的是()A、whileTrue:passB、截获C、篡改D、恶意程序E、拒绝服务正确答案:CDE16、SQL数据模型有三种类型,分别是()A、概念数据模型B、物理数据模型C、动态数据模型D、逻辑数据模型正确答案:ABC17、下列哪些是《电信和互联网用户个人信息保护规定》中规定的直接面向

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论