数据采集1+x初级测试题含答案_第1页
数据采集1+x初级测试题含答案_第2页
数据采集1+x初级测试题含答案_第3页
数据采集1+x初级测试题含答案_第4页
数据采集1+x初级测试题含答案_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x初级测试题含答案一、单选题(共41题,每题1分,共41分)1.以下对Python程序缩进格式描述错误的选项是:A、缩进是用来格式美化Python程序的B、严格的缩进可以约束程序结构,可以多层缩进C、不需要缩进的代码顶行写,前面不能留空白D、缩进可以用tab键实现,也可以用多个空格实现正确答案:A2.Apache服务器运行后会生成两个日志文件,访问日志是哪个文件()A、access_logsB、access_logC、error_logD、errors_log正确答案:B3.以下关于浏览器与服务器之间进行消息传递的描述正确的是A、浏览器请求的所有资源会在一个请求和响应过程内完成B、浏览器请求的所有资源可能会在多个请求和响应过程内完成C、浏览器的一个请求对应多个服务器的响应D、浏览器的多个请求对应一个服务器的响应正确答案:B4.Apache中日志路径为()A、/var/logsB、/var/log/httpdC、/log/logsD、logs正确答案:B5.以下哪项用来分组A、ORDERBYB、ORDEREDBYC、GROUPBYD、GROUPEDBY正确答案:D6.下列语句中查询姓李的学生的语句是()。A、select*from表名where姓名like‘%李%’B、select*from表名where姓名=‘李’C、select*from表名where姓名like‘李%’D、select*from表名where姓名like‘李’正确答案:C7.关于HTTP的head消息“connection:keep-alive”,以下描述正确的是A、可以在每个HTTP连接中进行多次次请求和响应B、只能在每个HTTP连接中进行一次请求和响应C、仅适用于HTTP/1.1D、能够一直保持与服务器之间的连接正确答案:A8.Log4j定义的日志概念里不包含哪个()A、LoggerB、writerC、AppenderD、Level正确答案:B9.数据库管理系统(DBMS)的主要功能是A、修改数据库B、定义数据库C、应用数据库D、保护数据库正确答案:B10.能够实现数据链路层的互联设备有()A、中继器B、网管C、路由D、网桥正确答案:D11.在Linux环境下的Apache容器数据的采集中,启动apache服务代码是()。A、httpdB、startup.batC、filebeatD、logstash正确答案:A12.将网络认为局域网、城域网、广域网三种,是按照哪种方式进行分类的A、按使用范围分B、按地理范围分C、按传输技术分D、按拓扑结构分正确答案:B13.数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作的数据库语言称为()A、数据定义语言(DDL)B、数据管理语言C、数据操纵语言(DML)D、数据控制语言正确答案:C14.在MySQL中,创建完数据表之后,如果需要查看该表是否已经成功创建,可以在指定的数据库中使用()命令查看表。A、updatetable;B、showtable;C、selecttable;D、showtables;正确答案:D15.XPath是一门在()文档中查找信息的语言?A、HTMLB、JAVAC、ORACLED、XML正确答案:D16.Java应用系统中常用的日志框架不包括()A、LogbackB、Log4j2C、Log4jD、loguru正确答案:D17.盒子模型具备的属性有几个()A、1B、2C、4D、3正确答案:C18.IPv6地址由()位二进制数值组成。A、128B、32C、64D、16正确答案:A19.网页前端设计中,()语言作用是浏览器端组织和显示网页信息(文本、图片、视频等)。A、CSSB、JavaScriptC、HTMLD、JSP正确答案:C20."给出如下代码,下述代码的输出结果是()s="Alice"print(s[::–1])"A、ALICEB、ecilAC、AlicD、Alice正确答案:B21.日志优先级别不包括()A、TRACEB、INFOC、DEBUGD、NORMAL正确答案:D22.TCP/IP协议将整个通信功能划分为四个层次,处于最底层的是()A、数据链路层B、网络接口层C、物理层D、网络层正确答案:B23.服务器端响应状态码中,表示“NOTMODIFIED文档未修改”的是A、302B、404C、304D、200正确答案:C24.运行scrapy框架生成的spider程序,使用以下哪个命令A、runB、startspiderC、crawlD、runspider正确答案:C25.JavaScript核心对象中.()用于处理日期和时间。A、Array对象B、Data对象C、Date对象D、String对象正确答案:C26.Scrapy中,用于运行项目中的爬虫的命令是()。A、runspiderB、genspiderC、crawlD、以上全是正确答案:C27.re模块的常用方法中按照能够匹配的字符串作为分隔符,将字符串分割后返回一个列表的是()。A、matchB、searchC、splitD、compile正确答案:C28.通过在路径表达式中使用()运算符,您可以选取若干个路径?A、空白B、/C、.D、|正确答案:B29.CSS中通过哪个属性设定元素的背景颜色()。A、background-colorB、background-imageC、back-colorD、bg-color正确答案:A30.Python中,下列标识符中哪个是合法的?()A、_B、i'mC、forD、3Q正确答案:A31.Android系统是基于Linux操作系统开发的手机系统,因此在进行刷机、删除系统自带软件时需要获得管理员账户()的权限A、administratorB、rootC、adminD、liveuser正确答案:B32.数据库结构的描述和定义是DBMS运行的基本依据,它们存储于()A、封锁表B、数据字典C、索引D、日志正确答案:B33.HTTPS协议的默认端口号是A、80B、443C、88D、8080正确答案:B34.以下数据中,非结构化数据不包括()A、图像B、音频C、日志文件D、图片正确答案:C35.在Linux环境下的Tomcat容器数据的采集中,启动Tomcat容器的代码是()。A、httpdB、startup.shC、filebeatD、logstash正确答案:B36.以下不属于数据采集工具的是()A、FilebeatB、FlumeC、MySQLD、八爪鱼采集器正确答案:C37.以下哪种爬虫又称为主题网络爬虫,是指选择性的爬行那些与预先定义好的主题相关页面的网络爬虫A、通用网络爬虫B、深层页面爬虫C、聚焦网络爬虫D、增量式网络爬虫正确答案:C38.以下不属于用户数据报协议UDP特点的是()。A、UDP发送数据前,需要首先建立连接,它是有连接服务B、UDP使用尽最大努力交付,即不保证可靠交付,同时也不使用拥塞控制C、UDP是面向报文的D、UDP支持一对一、一对多、多对一和多对多的交互通信正确答案:A39.在Windows操作系统中,()命令可以释放全部(或指定)适配器的由DHCP分配的动态IP地址。A、ipconfig/renewB、ipconfig/releaseC、ipconfig/flushdnsD、ipconfig/all正确答案:B40.下列哪些属于()规范数据信息收集的方式与要求A、自然人的个人信息受法律保护B、未经用户同意,电信业务经营者、互联网信息服务提供者不得收集、使用用户个人信息C、发现网络运营者收集、存储的其个人信息有错误的,有权要求网络运营者予以更正D、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度正确答案:A41.在select语句的where子句中,使用正则表达式过滤数据的关键字是()A、regexpB、matchC、likeD、against正确答案:A二、多选题(共21题,每题1分,共21分)1.下列哪些函数属于聚合函数()A、max()B、sum()C、str()D、count()正确答案:ABD2.日志主要包括哪几种()A、安全日志B、攻击日志C、系统日志D、应用程序日志正确答案:ACD3.sql语言分为以下()几类A、DCLB、DDLC、DMLD、DQL正确答案:ABCD4.关于socket编程,对于服务端编程的主要步骤包括()A、读写数据B、打开socketC、绑定到一个地址和端口D、监听客户端连接正确答案:ABCD5.以下是Python城市运行方式的是()A、通过程序调用B、图形操作C、文件式D、交互式正确答案:CD6.节点是通过沿着()或者步()来选取的?A、步B、谓语C、属性D、路径正确答案:AD7.以下属于半结构化数据的是A、日志文件B、MySQL中的数据表C、XML文档D、JSON格式文档正确答案:ACD8.数据采集,从网页或各业务系统中来抽取数据,并进行本地存储,其具体步骤包括()。A、清洗数据B、存储数据C、采集数据D、分析数据正确答案:ABC9.关于insert语句下列说法正确的有()A、insertinto表名values(字段名1对应的值,字段名2对应值);B、insertinto表名(字段名1)value(字段名1对应的值);C、insertinto表名(字段名1,字段名2)values(字段名1对应的值,字段名2对应值);D、insertinto表名values(字段名1对应的值);正确答案:AC10.以下选项中是操作系统的是()A、DOSB、Windows95C、MSWordD、Redhat正确答案:ABD11.数据完整性分为()A、域完整性B、实体完整性C、参照完整性D、用户自定义完整性正确答案:ABCD12.《民法总则》中规定自然人的个人信息受法律保护。任何组织和个人需要获取他人个人信息的,应当()A、可以任意公开他人信息B、不得非法买卖、提供或者公开他人个人信息C、依法取得并确保信息安全D、不得非法收集、使用、加工、传输他人个人信息正确答案:BCD13.CRM主要应用于哪些方面()A、客户档案有序管理B、合同管理C、销售报表D、外勤签到E、预测销售业绩正确答案:ABCDE14.按照数据发生的主体不同,数据采集范围主要包括()。A、数据库采集B、系统日志采集C、感知设备数据采集D、网络数据采集正确答案:ABCD15.下面哪个不是Python合法的标识符()A、int32B、__name__C、40XLD、3self正确答案:CD16.从采集数据的类型看,数据的类型是复杂多样的,包括以下哪些类型()。A、结构化B、全结构化C、半结构化D、非结构化正确答案:ACD17.衡量网络性能的主要指标包括()A、转发B、路由C、延迟D、带宽正确答案:CD18.以下属于Python保留字的是()A、yieldB、passC、finallyD、def正确答案:ABCD19.以下,属于Python语言应用领域的包括()A、Web开发B、科学计算C、自动化运维D、爬虫开发正确答案:ABCD20.在操作系统中,进程是指一个程序以及其数据在处理器上执行时发生的所有活动,是系统资源分配和调度的一个独立单位。以下属于进程特征的是()。A、异步性B、动态性C、并发性D、独立性正确答案:ABCD21.根据不同系统结构出现的时间不同分类,操作系统结构可以分为()。A、整体式结构B、微内核结构C、模块化结构D、层次结构正确答案:ABCD三、判断题(共37题,每题1分,共37分)1.Tomcat作为独立服务器,请求来自于web浏览器。A、正确B、错误正确答案:A2.网络爬虫是针对网站页面数据的爬取,不包括终端APP上页面信息的爬取。A、正确B、错误正确答案:B3.同一个VLAN之中的主机通信必须通过路由器进行信号转发。A、正确B、错误正确答案:B4.基本值是无父或无子的节点。A、正确B、错误正确答案:A5.不经用户同意,电信业务经营者、互联网信息服务提供者可以收集、使用用户个人信息A、正确B、错误正确答案:B6.vi命令模式中yy命令的作用为复制当前行到内存缓冲区。A、正确B、错误正确答案:A7.SQL语言中,删除某表中某个索引的命令是dropindex表名on索引名;A、正确B、错误正确答案:B8.Python中,元组的元素不能修改。A、正确B、错误正确答案:A9.python最具特色的就是使用缩进来表示代码块,不需要使用大括号{}。缩进的空格数是可变的,但是同一个代码块的语句不必包含相同的缩进空格数。A、正确B、错误正确答案:B10.*匹配0次的前面字符(相当于{0,})A、正确B、错误正确答案:B11.服务器群集技术将成为服务器主流。A、正确B、错误正确答案:B12.如果需要修改数据表的字段类型,其语法格式为:altertable表名modify字段名新数据类型;A、正确B、错误正确答案:A13.语句dictTest={[1,2,3]:“test”}可以创建一个字典赋值给dictTestA、正确B、错误正确答案:B14.系统处于不安全状态时一定发生了死锁。A、正确B、错误正确答案:B15.shell中while结构化语句必须以elihw作为语句的结束。A、正确B、错误正确答案:B16.RPM有5种基本操作模式:安装、删除、升级、查询和校验。A、正确B、错误正确答案:A17.Apache虚拟目录的位置与主目录的位置可以不在同一磁盘上A、正确B、错误正确答案:A18.Oracle是一种是NoSQL数据库。A、正确B、错误正确答案:B19.在传输层有两个性质不同的协议:TCP和UDP。A、正确B、错误正确答案:A20.在SELECT语句查询中,要去掉查询结果中的重复记录,可以使用DISTINCT关键字A、正确B、错误正确答案:A21.操作系统是系统软件中的一种,在进行系统安装时可以先安装其它软件,然后再装操作系统。A、正确B、错误正确答案:B22.大数据采集一般数据量大、数据面广,因此信息采集执行效率相对低效且获取数据不追求及时性A、正确B、错误正确答案:B23.连接各建筑物之间的传输介质和各种支持设备(硬件)组成一个建筑群综合布线系统。A、正确B、错误正确答案:A24.计数元字符用来控制一个匹配项可以在字符串中出现的次数,这样会使得表达式更加的灵活通用。A、正确B、错误正确答案:A25.Robots协议全称是“网络爬虫排除标准”,网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。A、正确B、错误正确答案:A26.数据采集,又称数据获取,是利用一种装置或程序从系统外部采集数据并输入到系统内部的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论