数据采集1+x初级测试题库及答案_第1页
数据采集1+x初级测试题库及答案_第2页
数据采集1+x初级测试题库及答案_第3页
数据采集1+x初级测试题库及答案_第4页
数据采集1+x初级测试题库及答案_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x初级测试题库及答案

1、下列哪个函数不属于聚合函数()

A、sum

B、count

C、max

D、str

答案:D

2、选择html页面上所有class属性为“cis”的div标签,Xpath代码为

()0

A、//divclass=,cis)]

B、〃div@class='cis']

C、/div@class-cis']

D、//div@class=cls]

答案:B

3、以下选项中符合Python语言变量命名规则的是

A、*i

B、3_1

C、AI!

D、Templist

答案:D

4、B类地址172.16.10.28的网络ID是()

A、172

B、172.16.

C、172.16.10

D、172.16.0.0

答案:D

5、在Windows中,对文件夹进行复制时会复制哪些内容

A、只复制文件夹名,不复制其内容

B、复制文件夹名的其下所有的文件和子文件夹

C、只复制文件夹名和其下的文件,不复制其下的文件夹

D、复制文件夹名和其下所有的文件和子文件夹,但不复制子文件夹下的文

答案:B

6、Apache服务器是实现()网络协议的服务器。

A、FTP

B、DHCP

C、HTTPD

D、HTTP

答案:D

7、requests库中,()对象可以实现跨请求保持数据

A、Request

B、Cookie

C、Session

D、Response

答案:c

8、使用xpath,选取属于body子节点下的最后一个div节点的表达式为

()

A、/html/body/divfirst]

B、/html/body/divlast]

C、/html/body/divpositon=last]

D、/html/body/divpositon=first]

答案:B

9、()是进行数据清洗的工具。

A、logstash

B^tomcat

C>apache

D>filebeat

答案:A

10、Tomcat容器数据采集中检查JDK的版本命令为()

A、java-version

B、javac

C、javaversion

D^checkversion

答案:A

11、服务器端响应状态码中,表示“NOTFOUND未找到”的是

A、302

B、404

C、304

D、200

答案:B

12、Xpath中的()可用来选取未知的XML元素?

A、节点

B、属性

C、表达式

D、通配符

答案:D

13、数据采集的类型包括。

A、结构化数据

B、半结构化数据

C、非结构化数据

D、以上都不属于数据采集的类型

答案:ABC

14、在操作系统中,进程是指一个程序以及其数据在处理器上执行时发生

的所有活动,是系统资源分配和调度的一个独立单位。以下属于进程特征的是

()o

A、动态性

B、并发性

C、独立性

D、异步性

答案:ABCD

15、在查询语句中,必不可少的关键字是()

A、select

B^from

C、where

D、join

答案:AB

16、日志主要包括哪几种()

A、系统日志

B、安全日志

C、攻击日志

D、应用程序日志

答案:ABD

17、Python中,关于re模块描述正确的是()

A、re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,

则匹配失败,函数返回None

B、re模块使Python语言拥有全部的正则表达式功能

C、re.search匹配整个字符串,直到找到一个匹配

D、以上描述都不正确

答案:ABC

18、数据采集的主要特点包括()o

A、以自动化采集手段为主,尽量不用人工方式

B、采集数据要明确采集内容,有针对性的采集局部精确数据

C、除采集基本数据外,采集方式和内容要更多样化、丰富化,

D、摆脱对数据进行采样的方式,采集内容以全量采集为主

答案:ACD

19、什么途径可以找到同行业的优质的友情链接

A、查找竞争对手的链接

B、站长论坛寻找

C、购买的链接

D、空白

答案:AB

20、vim文本编辑器有哪些模式0

A^命令模式

B、末行模式

C、引用模式

D、输入模式

答案:ABD

21、以下哪些是Python的保留字和关键字()。

A、class

B、import

C、Global

D、Def

答案:AB

22、计算机网络按照交换方式分类,可以分为0。

A、分组交换网

B、报文交换网

C、电路交换网

D、混合交换网

答案:ABCD

23、在xpath中,元素节点可有()个子节点。

A、零个

B、一个

C、多个

D^都不对

答案:ABC

24、业务系统中产生的两种数据是()o

A、数据库数据

B、日志数据

C、图像数据

D、文本快照

答案:AB

25、linux中安装软件可使用命令()。

A、setup

B、yuminstall

C、rpm

D、源代码安装

答案:BCD

26、以下属于DML语句的是()。

A、INSERT

B、ALTER

C、DROP

D、DELETE

答案:AD

27、CSS选择器主要包括0。

A、类选择器

B、标签选择器

C>ID选择器

D、父选择器

答案:ABC

28、下列查询姓张的学生的语句不正确的有()

A、select*from表名where姓名='%张%'

B、select*from表名where姓名like'张'

C、select*from表名where姓名like'张对

D、select*from表名where姓名='张'

答案:ABD

29、正则表达式可以用下列哪种方式匹配正整数?

A、*1-9]*1-9]0-9]*$

B、.0-9]*1-9]0-9]*$

C、"a-zA-Z]w{7.10}$

D、都可以

答案:AB

30、衡量网络性能的主要指标包括()

A、路由

B、转发

C、带宽

D、延迟

答案:CD

31、以下属于position常用属性的是()

A、fixed

B、absolute

C、relative

D、static

答案:ABCD

32、常见的URL分隔符包括。

A、*星

B、_下划线

C、$美元符号

D、/(反斜杠)

答案:BD

33、以下属于表单<form>常用属性的是()

A、action

B、method

C、name

D、size

答案:ABC

34、根据数据所属主体不同,以下属于数据采集范畴的是。

A、系统日志采集

B、数据库采集

C、网络数据采集

D、感知设备数据采集

答案:ABCD

35、XPath含有超过100个内建的函数,这些函数用于()?

A、字符串值

B、数值

C、日期

D、比较

答案:ABCD

36、计算机网络通信威胁行为中属于主动攻击行为的是()

A、篡改

B、拒绝服务

C、恶意程序

D、截获

答案:ABC

37、国家没有建立网络安全监测预警和信息通报制度

A、正确

B、错误

答案:B

385Tomcat是Apache软件基金会推出的一个收费的Servlet容器

A、正确

B、错误

答案:B

39、ls-a可以起到查询当前目录并显示隐藏文件的作用。

A、正确

B、错误

答案:A

40、Robots协议全称是“网络爬虫排除标准”,网站通过Robots协议告

诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。

A、正确

B、错误

答案:A

41、在Python中,为了使用XPath,需要安装一个第三方库:Ixml

A、正确

B、错误

答案:A

42、python中,重写父类的方法,可在子类中定义一个这样的方法,即

它与要重写的父类方法同名。

A、正确

B、错误

答案:A

43、管槽安装的基本要求包括走最短的路由。

A、正确

B、错误

答案:B

44、altertableempremoveaddcolumn能够删除一列

A、正确

B、错误

答案:B

45、catfilename,txt|more可实现分页地查看一个大文件的内容。

A、正确

B、错误

答案:A

46、Linux操作系统的特性有:开放性、多用户、多任务、良好的用户界

面等。

A、正确

B、错误

答案:A

47、设备控制器是计算机和中央处理器(CPU)之间的接口,它会接收CPU

的指令,然后去实现对设备的控制

A、正确

B、错误

答案:A

48、查看变量内存地址的Python内置函数是id()

A、正确

B、错误

答案:A

49、关系型数据库是将许多具有相关性的数据以一定方式组织存储在一起

形成的数据集合。

A、正确

B、错误

答案:A

50、isinstanceC123",str)返回值是True

A、正确

B、错误

答案:A

51、Python程序的运行方式有两种:交互式和文件式。文件式指Python

解释器逐行接收Python代码并即时响应;交互式也称批量式,指先将Python

代码保存,再启动Python解释器批量解释代码。

A、正确

B、错误

答案:B

52、删除表用droptable关键字

A、正确

B、错误

答案:A

53、ns(asp容器)不是web容器

A、正确

B、错误

答案:B

54、语句dictTest={[1,2,3]:“test”}可以创建一个字典赋值给

dictTest

A、正确

B、错误

答案:B

55、print。函数可同时输出一个或多个数据,在输出多个数据时,默认使

用空格作为输出分隔符。

A、正确

B、错误

答案:A

56、国家没有建立网络安全监测预警和信息通报制度

A、正确

B、错误

答案:B

57、关系模型就是一张二维表,一个关系型数据库就是若干个二维表的集

合。

A、正确

B、错误

答案:A

58、访问某个网站,可以直接通过域名进行访问,也可以通过服务的URL

进行访问

A、正确

B、错误

答案:A

59、在JavaScript中,使用构造函数Math()来创建Math对象。

A、正确

B、错误

答案:B

60、0SI参考模型共划分为7层,从下到上依次为:物理层、网络层、数

据链路层、传输层、表示层、会话层和应用层。

A、正确

B、错误

答案:B

61、在xpath中,基本值是无父或无子的节点。

A、正确

B、错误

答案:A

62、网络传输介质只可以是有形的,不可以是无形的

A、正确

B、错误

答案:B

63、在re模块中,避免产生错误的方法就是在符号之前加上一个斜杠,构

成转义字符。

A、正确

B、错误

答案:B

64、JavaScript语言不区分大小写。

A、正确

B、错误

答案:B

65、连接各建筑物之间的传输介质和各种支持设备(硬件)组成一个建筑

群综合布线系统。

A、正确

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论