数据采集1+x初级试题与参考答案_第1页
数据采集1+x初级试题与参考答案_第2页
数据采集1+x初级试题与参考答案_第3页
数据采集1+x初级试题与参考答案_第4页
数据采集1+x初级试题与参考答案_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x初级试题与参考答案一、单选题(共42题,每题1分,共42分)1.哪个轴可以选取当前节点的所有属性?A、childB、attributeC、descendant正确答案:B2.在select语句的where子句中,使用正则表达式过滤数据的关键字是()A、regexpB、likeC、againstD、match正确答案:A3.关于数据采集的描述不正确的是()A、数据采集不在于掌握庞大的的数据信息,而在于对数据的智能处理,挖掘出有价值的信息B、数据采集来源广泛,类型也丰富多样,很看重数据处理的高效性和实时性C、数据采集,要注重数据质量和数据采集性能提升,为数据的准确分析打下基础D、以上描述都不正确正确答案:D4.以下属于应用层协议的是()A、IPB、UDPC、TCPD、FTP正确答案:D5.OpenSSH服务进程默认使用的端口号是()。A、25B、21C、24D、22正确答案:D6.HTTPS协议的默认端口号是A、80B、8080C、443D、88正确答案:C7.网页前端设计中,()语言作用是浏览器端组织和显示网页信息(文本、图片、视频等)。A、CSSB、JavaScriptC、HTMLD、JSP正确答案:C8.以下不属于常用的日志框架的是()A、Log4jB、vueC、LogbackD、Slf4j正确答案:B9.在所有正则表达式的元字符中,以下哪个元字符表示一位数字A、.B、dC、*D、空白正确答案:B10.操作系统中,系统管理员常用的二进制命令文件,一般放置在()目录下。A、/usr/sbinB、/bootC、/sbinD、/root正确答案:C11.如果需要在数据表中删除一个字段,其语法为()。A、altertable表名drop字段名;B、deletefrom表名where条件;C、altertable表名modify字段名新数据类型;D、deletefrom表名字段名;正确答案:A12.Tomcat容器运行的界面为()。A、phpB、cC、jspD、asp正确答案:C13.下列不属于ELK范畴的是()A、LuceneB、ElasticSearchC、LogstashD、Kibana正确答案:A14.删除用户账号命令是()A、DROPUSERB、DROPTABLEUSERC、DELETEUSERD、DELETEFROMUSER正确答案:A15.哪个符号匹配0次或者1次?A、。B、?C、*D、+正确答案:B16.XPath于1999年11月16日成为()标准?A、W3CB、XMLC、ROMCATD、以上都不对正确答案:A17.Xpath中的()可用来选取未知的XML元素?A、通配符B、属性C、节点D、表达式正确答案:A18.SEO的核心基础是A、结构、外链B、内容、外链C、内容正确答案:B19.半结构数据,是介于结构化数据与非结构化之间的数据,下面不属于半结构化数据的是()A、HTMLB、MPEG-1C、XMLD、JSON正确答案:B20.以下哪个不属于HTTP协议的请求方式A、GETB、PUSHC、POSTD、PUT正确答案:B21.关于“user-agent”(用户代理)的描述错误的是A、代表用户发起HTTP请求的客户端程序B、所有发布Web请求的应用程序都是HTTPAgent代理C、Web浏览器也是一种HTTPAgent代理D、网络爬虫只是一段程序,并不是代理正确答案:D22.下列关键字可以用于创建新表的是()A、DELETETABLEB、CREATETABLEC、DROPTABLED、UPDATETABLE正确答案:B23.在符合标准的网页设计中,以下哪一项不属于网页前端设计的3种基本语言之一()A、HTMLB、CSSC、jQueryD、JavaScript正确答案:C24.以下数据中,非结构化数据不包括()A、图片B、音频C、图像D、日志文件正确答案:D25.re模块中能够返回多个符合规则的字符串的方法是()A、matchB、findallC、searchD、finditer正确答案:B26.下面哪个不是Python合法的标识符()A、__name__B、int32C、selfD、40XL正确答案:D27.以下聚合函数中,用来统计平均值的函数为()A、avgB、sumC、minD、count正确答案:A28.Python语言提供的3个基本数字类型是A、整数类型、二进制类型、浮点数类型B、整数类型、浮点数类型、复数类型C、整数类型、二进制类型、浮点数类型D、整数类型、二进制类型、复数类型正确答案:B29.能够实现数据链路层的互联设备有()A、网桥B、路由C、网管D、中继器正确答案:A30.数据链路层上信息传输的基本单位称为()A、报文B、段C、位D、帧正确答案:D31.关于Python程序中与“缩进”有关的说法中,以下选项中正确的是()A、缩进统一为4个空格B、缩进是非强制性的,仅为了提高代码可读性C、缩进可以用在任何语句之后,表示语句间的包含关系D、缩进在程序中长度统一且强制使用正确答案:D32.在Python中,关于全局变量和局部变量,以下选项中描述不正确的是()A、一个程序中的变量包含两类:全局变量和局部变量B、全局变量不能和局部变量重名C、全局变量一般没有缩进D、全局变量在程序执行的全过程有效正确答案:B33.如果要在python中只用正则表达式,则需要引入哪个模块A、lxmlB、xmlC、etreeD、re正确答案:D34.以下哪项用来分组A、ORDERBYB、ORDEREDBYC、GROUPBYD、GROUPEDBY正确答案:D35.网络运营者收集、使用个人信息,应当遵循()的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意。A、不正当B、严格C、合法、正当、必要D、不用合法正确答案:C36.明知他人从事危害网络安全的活动的,不得为其提供广告推广、支付结算和()等帮助。A、网络推广B、拓展服务C、技术支持D、使用服务正确答案:C37.Apache服务器运行后会生成两个日志文件,其中,()是记录Web服务器的所有访问活动的文件。A、error_log(错误日志)B、/usr/local/tomcat/logsC、access_log(访问日志)D、logs正确答案:C38.删除数据表文件的命令是()A、DELETETABLEB、DROPTABLEC、DROPD、DELETE正确答案:B39.什么是正则表达式?A、从Python字典中快速获取数据的一种算法B、程序员经常使用的编程语言表达式的集合C、用来匹配文本字符串(如特定字符、单词或字符模式)的一种工具D、任何在Python中可能的正确表达式正确答案:C40.()不是用来查询、添加、修改和删除数据库中数据的语句A、SELECTB、INSERTC、UPDATED、DROP正确答案:D41.层次型、网状型和关系型数据库划分原则是()A、数据之间的联系B、联系的复杂程度C、文件的大小D、记录长度正确答案:A42.修改数据库表结构用以下哪一项A、UPDATEB、CREATEC、UPDATEDD、ALTER正确答案:D二、多选题(共21题,每题1分,共21分)1.在操作系统中,进程是指一个程序以及其数据在处理器上执行时发生的所有活动,是系统资源分配和调度的一个独立单位。以下属于进程特征的是()。A、独立性B、并发性C、异步性D、动态性正确答案:ABCD2.requests模块向服务器发送请求的方法有()A、deleteB、putC、postD、get正确答案:ABCD3.常见的URL分隔符包括()A、/(反斜杠)B、_(下划线)C、$(美元符号)D、*(星)正确答案:AB4.Windows事件日志中的事件类型主要有信息事件和()。A、警告事件B、错误事件C、成功审核事件D、失败审核事件正确答案:ABCD5.现在将/目录下的www文件权限改为只有主用户有执行的权限,其他用户没有执行权限()A、chmodo-x.g-x.u-x/wwwB、chmodu+x.g-x.o-x/wwwC、chmod001/wwwD、chmod100/www正确答案:BD6.进程的基本状态有()。A、停止态B、就绪态C、运行态D、阻塞态正确答案:BCD7.下列说法正确的是()A、网络运营者未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外B、未经用户同意,电信业务经营者、互联网信息服务提供者不得收集、使用用户个人信息C、国家网信部门应当统筹协调有关部门加强网络安全信息收集、分析和通报工作,按照规定统一发布网络安全监测预警信息D、自然人的个人信息受法律保护正确答案:ABCD8.数据完整性分为()A、实体完整性B、参照完整性C、用户自定义完整性D、域完整性正确答案:ABCD9.Python中,以下属于数字类型的包括()A、intB、complexC、boolD、float正确答案:ABCD10.Scrapy中,Linkextractor的常见属性包括()等。A、allowB、restrict_textC、denyD、restrict_xpaths正确答案:ABCD11.Python中函数是对象,描述正确的是()A、函数可以赋值给一个变量B、函数可以作为元素添加到集合对象中C、函数可以作为参数值传递给其他函数D、函数可以当作函数的返回值正确答案:ABCD12.以下属于常用的日志框架的是()。A、LogbackB、Slf4jC、VUED、Log4j正确答案:ABD13.数据库操作中,下列哪些列类型是数值型的数据()。A、DOUBLEB、INTC、SETD、FLOAT正确答案:ABD14.下列哪些函数属于聚合函数()。A、str()B、sum()C、min()D、count()正确答案:BCD15.对于日志类型的数据采集,常用的采集工具有A、scrapyB、logstashC、beautifulSoupD、filebeat正确答案:BD16.()是用来查询、添加、修改和删除数据库中数据的语句A、SELECTB、INSERTC、UPDATED、DELETE正确答案:ABCD17.关于insert语句下列说法正确的有()A、insertinto表名values(字段名1对应的值,字段名2对应值);B、insertinto表名(字段名1)value(字段名1对应的值);C、insertinto表名(字段名1,字段名2)values(字段名1对应的值,字段名2对应值);D、insertinto表名values(字段名1对应的值);正确答案:AC18.以下属于半结构化数据的是A、日志文件B、JSON格式文档C、XML文档D、MySQL中的数据表正确答案:ABC19.Python中,关于list和tuple描述正确的是()A、列表的数据项不需要具有相同的类型B、元组的不可变指的是元组所指向的内存中的内容不可变C、元组的元素不能修改D、列表是可变的正确答案:ABCD20.业务系统中产生的数据会有两种保存方式:_(1)_和_(2)_。A、数据库数据B、文本快照C、图像数据D、日志数据正确答案:AD21.以下哪几项是设计手机用户界面时应注意的问题A、设计风格保持一致B、能够合理利用较小的屏幕显示空间,构造出符合人机交互规律的用户界面C、界面设计与程序逻辑的分离D、根据不同型号手机的屏幕解析度、尺寸和纵横比各不相同,自动调整界面上部分控件的位置和尺寸,避免因为屏幕信息的变化而出现显示错误正确答案:ABCD三、判断题(共37题,每题1分,共37分)1.select语句的groupby参数用于指定将查询结果根据什么字段进行分组。A、正确B、错误正确答案:A2.优先级是进程调度的重要依据,一旦确定不能改变。A、正确B、错误正确答案:B3.$nnn在shell里为定义一个变量nnn的作用。A、正确B、错误正确答案:B4.HTTP的head消息“referer”的作用是告知服务器是从哪个资源转到当前资源上来的。A、正确B、错误正确答案:A5.企业业务系统是解决企业的外部问题,与解决企业内部问题的组织系统相辅相成。A、正确B、错误正确答案:A6.虽然不需要在使用之前显式地声明变量及其类型,但是Python仍属于强类型编程语言,Python解释器会根据赋值或运算来自动推断变量类型。A、正确B、错误正确答案:A7.ARP协议可以通过IP地址获取对应主机的物理地址,是网络层协议。A、正确B、错误正确答案:A8.BeautifulSoup是一个可以从HTML或XML文件中提取数据的Python库。A、正确B、错误正确答案:A9.Xpath通配符不可以用来选取未知的XML元素。A、正确B、错误正确答案:B10.HBase是基于Python语言开发的,它提供了这种语言的API接口来管理和操作数据库。A、正确B、错误正确答案:B11.HTTP请求报文结构包含请求行、请求头部、空行和请求数据4部分。A、正确B、错误正确答案:A12.不经用户同意,电信业务经营者、互联网信息服务提供者可以收集、使用用户个人信息A、正确B、错误正确答案:B13.Linux系统中有一个文件的文件名为aaa.txt,那么这个文件的扩展名为txt。A、正确B、错误正确答案:B14.正则表达式只能处理字符串数据A、正确B、错误正确答案:A15.传输层是通过建立物理连接来进行数据传输的A、正确B、错误正确答案:B16.决定局域网特性的主要技术是传输介质、拓扑结构和介质访问控制方法,其中最重要的是传输介质A、正确B、错误正确答案:B17.事务的结束并提交能使用rollback命令A、正确B、错误正确答案:B18.altertableempremoveaddcolumn能够删除一列A、正确B、错误正确答案:B19.在Python中,为了使用XPath,需要安装一个第三方库:lxmlA、正确B、错误正确答案:A20.防火墙可以完全控制外部用户对Intranet的入侵与破坏A、正确B、错误正确答案:B21.HTTP协议是以TCP协议为基础的,因此浏览器与服务器会建立持久连接A、正确B、错误正确答案:B22.开发过程中,异常是因为程序执行过程中出错时出现的,语法错误和逻辑错误都属于异常A、正确B、错误正确答案:B23.一个网站获取的反向链接越多越好,说明被认同的范围越广,所以反向链接追求高数量,对质量要求低A、正确B、错误正确答案:B24.视图是由一个或若干基表产生的数据集合,但视图不占存储空间。建立视图可以保护数据安全(仅让用户查询修改可以看见的一些行列)、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论