大数据开发基础练习题及答案17-2023-背题版

上传人：灯*** IP属地：河北上传时间：2024-01-13 格式：PDF 页数：96 大小：10.83MB 积分：12 举报 版权申诉

已阅读5页，还剩91页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

试题说明

本套试题共包括1套试卷

每题均显示答案和解析

大数据开发基础练习题及答案17（500题）

大数据开发基础练习题及答案17

L［单选题］关于GES技术原理，下列错误的是哪一项？

A）基于ElasticSearch的索引机制，能根据素快速查问数据

B）基于Yarn的资源调度，可以并行执行多任务

C）基于Spak的分布式内存计算技术，支持数据快速导入D、基于HBase的分布式存储机制，能够处理

海量数据

答案:B

解析：

2.［单选题］根据《大数据风控平台项目操作手册》，在企业信用智能分析报告（含征信）查询记录

列表中，有O字段，用户可在该列查看到每期报告所含征信数据的时间。

A）人行征信报告数据状态

B）B.最新人行征信报告查询时间

C）C.最新人行征信报告编号

答案:B

解析：

3.［单选题］在MapReduce计算架构中，（）组件运行在DataNode上，具体管理本节点计算任务的执行

A）Client

B）JobTracker

C）TaskTracker

D）Task

答案:C

解析：

4.［单选题］在Oracle数据库中一个表的唯一标识称为（—兀

A）主键

B）ID

C）索引

D）key

答案:A

解析：

5.［单选题］写入数据到HDFS的Sink组件是（）。

A）Hive

B）HBase

OHDFS

D）Hadoop

答案:C

解析：

6.［单选题］下列处理方法能获得像素级标注的是（）。

A）图像分类

B）物体检测

C）图像去噪

D）语义分割

答案:D

解析:语义分割通过对每个像素进行密集的预测、推断标签来实现细粒度的推理，从而使每个像素都

被标记为其封闭对象矿石区域的类别，因此能够获得像素级标注。

7.［单选题］关于推进数据共享开放的描述，错误的是：（）

A）要改变政府职能部门“数据孤岛”现象，立足于数据资源的共享互换.设定相对明确的数据标准

,实现部门之间的数据对接与共享

B）要使不同省区市之间的数据实现对接与共享，解决数据“画地为牢”的问题，实现数据共享共用

C）在企业内部，破除“数据孤岛”，推进数据融合

D）不同企业之间，为了保护各自商业利益，不宜实现数据共享

答案：D

解析：

8.［单选题］如果线性回归模型中的随机误差存在异方差性，那么参数的0LS估讨量是（）

A）无偏的，有效的

B）无偏的，非有效的

C）有偏的，有效的

D）有偏的，非有效的

答案:B

解析：

9.［单选题］想要求出字符串元素个数，应使用（）

A）count

B）len

C）length

D）total

答案:B

解析：

10.［单选题］数据科学是一门以（）为主要研究任务的独立学科。

A）"数据驱动"｛（数据业务化""数据洞见""数据产品研友"和（或）"数据生态系统的建设"

B）数据研发

C）数据处理

D）数据洞见

答案：A

解析：

11.［单选题］查看一张表中数据的最后修改时间，正确的方法是：（）。

A）找管理员从后台查

B）DESC命令

OSH0WTABLES命令

D）SELECTLAST_MODIFY_TIMEFROMTABLE

答案:B

解析：

12.［单选题］在SELECT语句中，使用关键字（）可以把重复行屏蔽

A）TOP

B）ALL

C）UNION

D）DISTINCT

答案:D

解析：

13.［单选题］Spark集群的默认web管理页面端口（一）。

A）8090

B）1020

08010

D）8080

答案:D

解析：

14.［单选题］数据仓库是随着时间变化的，下面的描述不正确的是（）。

A）数据仓库随时间的变化不断增加新的数据内容

B）捕捉到的新数据会覆盖原来的快照

C）数据仓库随事件变化不断删去旧的数据内容

D）数据仓库中包含大量的综合数据，这些综合数据会随着时间的变化不断地进行重新综合

答案:C

解析：

15.［单选题］（）反映数据的精细化程度，越细化的数据，价值越高。

A）规模

B)活性

C)关联度

D)颗粒度

答案:D

解析：

16.［单选题］下列对大数据4V特征理解错误的是(一)。

A)数量大，随着信息技术的高速发展，数据开始爆发性增长，存储单位从过去的GB到TB,直至PB

B)广泛的数据来源，决定了大数据形式的多样性

C)大数据的交换和传播是通过互联网、云计算等方式实现的，远比传统媒介的信息交换和传播速度

快捷

D)现实世界所产生的数据中，有价值的数据所占比例很高，体现了大数据的价值性

答案:D

解析：

17.［单选题］OLTP是什么意思()

A)面向过程的实时处理系统

B)面向对象的实时处理系统

C)面向事务的实时处理系统

D)面向系统的实时处理系统

答案:C

解析：

18.［单选题］定义类如下：classA()：defa()：print(uan)classB()：defb()：

print("b")classC()：defc()：print(c)classD(A,C)：defd()：print("d")d=

D()d.a()d.b()d.d()以下程序能执行的结果是

A)a,b,d

B)a,d

Od.a

D)执行会报错

答案:D

解析：

19.［单选题］Hive中的解释器(compiler)优化器(optimizer),执行器(executor)组件用于H0L语句从

词法分析、语法分析、编译、优化以及查询计划生成。生成的查询计划将存储在在()中，并在随后由

()调用执行

A)HDFS、MapReduce

B)内存、MapReduce

C)HBase>Yarn

D)HDFS、Yarn

答案:A

解析：

20.［单选题］聚合函数COUNT用于（）

A）计算元组个数

B）计算属性的个数

C）对一列中的非空值计算个数

D）对一列中非空值和空值计算个数

答案:C

解析：

21.［单选题］DIKW金字塔模型中，顶层与底层的名称分别为（）。

A）智慧与数据

B）知识与数据

C）智慧与数值

D）知识与数值

答案:A

解析：DIKW金字塔（DIKWPyramid）模型揭示了数据（Data）与信息（Information）、知识

（Knowledge）,智慧（Wisdom）之间的区别与联系，自底向上分别为数据、信息、知识、智慧。

22.［单选题］在抽样估计中，随着样本容量的增大，样本统计量接近总体参数的概率就越大,这一性质

称为（）。

A）无偏性

B）有效性

C）及时性

D）一致性

答案：D

解析：一致性是指随着样本容量的增大，样本统计量接近总体参数的概率就越大。对于给定的偏差控

制水平，两者间偏差高于此控制水平的可能性越小。

23.［单选题］数据洞见强调的是如何将数据转换为（）的过程

A）增值数据

B）实际行动

C）智慧

D）数据产品

答案:B

解析：

24.［单选题］马尔可夫随机场是典型的马尔可夫网，这是一种著名的（_）模型。

A）无向图

B）有向图

C）树形图

D）环形图

答案:A

解析：

25.［单选题］关于Python的全局变量和局部变量，以下选项中描述错误的是

A）局部变量指在函数内部使用的变量，当函数退出时，变量依然存在，下次函数调用可以继续使用

B）使用global保留字声明简单数据类型变量后，该变量作为全局变量使用

C）简单数据类型变量无论是否与全局变量重名，仅在函数内部创建和使用，函数退出后变量被释放

D）全局变量指在函数之外定义的变量，一般没有缩进，在程序执行全过程有效

答案:A

解析：

26.［单选题］下列关于文本图的说法中，错误的是（）

A）文本图不适合展示数据太少的数据集

B）文本图不适用于展示无明显差异的数据集，因为无明显差异的数据集会使得出的文本图缺少关键词

，无法带来突出感

C）可以在文本图中添加标签以使可视化结果更为直观

D）文本图又可称为词云图

答案:C

解析：

27.［单选题］以下选项中，不属于MySQL特点的是（）。一

A）界面良好

B）跨平台

0体积小

D）速度快

答案:A

解析：

28.［单选题］matpltlib中绘制图形，通过更改绘图框的尺寸来设置相等的缩放比例的参数是（）。

A）scaled

B）equal

C）auto

D）normal

答案:A

解析：

29.［单选题］支持向量机的优化问题是最小化的平方，这实现了（_）。

A）几何间隔为1/的最大间隔超平面

B）几何间隔为的最大间隔超平面

0几何间隔为"的最小间隔超平面

D）几何间隔为的最小间隔超平面

答案:A

解析：

30.［单选题］在视图上不能完成的操作是（）

A）更新视图数据

B）在视图上定义新的基本表

C）在视图上定义新的视图

D）查询

答案:B

解析：

31.［单选题］下列不是SVM核函数的是

A）多项式核函数

B）logistic核函数

C）径向基核函数

D）Sigmoid核函数

答案:B

解析：

32.［单选题］HBase使用一个（）节点协调管理一个或多个RegionServer从属机。

A）NameNode

B）DataNode

C）lobTracker

D）Master

答案:D

解析：

33.［单选题］（）不是Spark服务层的功能。

A）SQL查询

B）实时处理

C）机器学习

D）内存计算

答案:D

解析：

34.［单选题］下列对MapReduceVersion1的描述不正确的是（__）0

A）JobTracker负载过重，存在单点故障

B）资源管理和计算调度强耦合，其他计算框架难以复用其资源管理

C）不同框架对济源不能全局管理

D）MapReduce1.0与MapReduce2.0在客户端的应用有很大的差别

答案:D

解析：

35.［单选题］Hadoop环境下HDFS系统中的NameNode实现的功能是（）。

A）管理文件系统的命名空间

B）管理存储空间

C）分配算力

D）调控算法

答案:A

解析:NameNode负责管理文件系统的命名空间。

36.［单选题］下面不属于数据科学中常用的开源技术统计工具的有（_）。

A）scipy

B）numpy

C）scalalab

D）sentry

答案:D

解析：

37.［单选题］例如数据库中有A表，包括学生，学科，成绩三个字段，数据库结构为学生学科成

绩张三语文80张三数学100李四语文70李四数学80李四英语80如何统计每个学科的最

高分（）

A）select学生，max（成绩）fromAgroupby学生；

B）select学生，max（成绩）fromAgroupby学科；

C）select学生，max（成绩）fromAorderby学生；

D）select学生，max（成绩）fromAgroupby成绩；

答案:B

解析：

38.［单选题］下列对MapReduce中的公平调度器描述正确的是（__）。

A）公平调度器的目标是让每个用户公平独享集群能力

B）如果只有一个作业在运行，就会得到集群的所有资源

C）提交作业数较多的用户，会获得更多的集群资源

D）公平调度器不支持抢占机制

答案:B

解析：

39.［单选题］朴素贝叶斯是一种简单但是非常强大的（）

A）线性分类器

B）分析器

C）逻辑分析器

D）以上说法都不对

答案:A

解析：

40.［单选题］现在有一亿条数据要插入Hbase,使用下列哪种方式最好？

A）shell端put命令

B）put方法

C）bulkload方法

D）insert方法

答案:C

解析：

41.［单选题］在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时，会大

大增加hash分桶数，严重影响性能。Fusioninsight中，针对小文件的场景通常采用答案：算子，来

对Table中的小文件生成的partition进行合并，减少partition数，从而避免在shuffle的时候

，生成过多的hash分桶，提升性能？

A）groupby

B）coalesce

C）connect

D）join

答案:D

解析：

42.［单选题］Dave于2012年发布（_）首次全面地刻画了当时快速发展的大数据技术体系。

A）大数据产业网络

B）大数据产业全景图

C）大数据产业

D）大数据网络

答案:B

解析：

43.［单选题］在留出法、交叉验证法和自助法三种评估方法中，（）更适用于数据集较小、难以划

分训练集和测试集的情况。

A）留出法

B）交叉验证法

0自助法

D）留一法

答案:C

解析：

44.［单选题］大数据的4V特性不包括

A）Volume（大量）

B）Velocity（高速）

C）Visual（可视）

D）Variety（多样）

答案:C

解析：

45.［单选题］SELECTINSERT('welcome',3,4,'HA')的执行结果为()。~

A)weHAe

B)welHAme

C)weHAome

D)welHAcome

答案:A

解析：

46.［单选题］for循环中，foriin,中不可以填写以下哪个？（）

A）列表

B）一个整型变量

0range生成的数字序列

D）字符串

答案:B

解析：

47.［单选题］Flume的输出叫做（）0

A）接收器

B）源

C）数据流

D）通道

答案:A

解析：

48.［单选题］绝对多数投票法的基本思想是（）

A）对于若干和弱学习器的输出进行平均得到最终的预测输出咱少数服从多数，数量最多的类别为最

终的分类类别

B）不光要求获得最高票，还要求票过半数

C）将训练集弱学习器的学习结果作为输入，

D）将训练集的输出作为输出，重新训练一个学习器来得到最终结果

答案:C

解析：

49.［单选题］所有预测模型在广义上都可称为一个或一组（_）。

A）公式

B）逻辑

C）命题

D）规则

答案：D

解析：

50.［单选题］MaxComputeGraph中的边（Edge）的表示方式为：（）。

AXID,Value,Halted>

BXID,Value,Halted,Edges>

C）<DestVertexID,Value>

D）<ID,,Values>

答案:C

解析：

51.［单选题］下列关于HBase系统分层架构叙述不正确的一项为（）。

A）HDFS提供了HBase的顶层物理存储结构

B）Hadoop平台提供了存储基础结构：Hadoop集群及系统软件

C）客户端：提供了数据库访问接口

D）RegionServer：管理多个regions并提供数据访问服务

答案:A

解析：

52.［单选题］请阅读下面一段程序：arr_2d=np.array（［［11,20,13］,［14,25,⑹，［27,18,

9］］）print（arr2d［1,：1］）执行上述程序后，最终输出的结果为（）

A）［14］

B）［25］

0:14,25］

D）［20,25］

答案:A

解析：

53.［单选题］YARN的基于标准调度，是对下列选项中的（）进行标签化。

A）AppMaster

B）ResourceManager

C）NodeManager

D）Container

答案:C

解析：

54.［单选题］LSTM中特有的三个门，下列哪一个不再其中？（）

A）输入门

B）输出门

C）循环门

D）遗忘门

答案:C

解析：

55.［单选题］Scikit-Learn中，（）可以实现整数分类值转化为独热向量。

A)OridinalEncoder

B)OneHotEncoder

C)LableEncoder

D)AutoEncoder

答案:B

解析：0neHot编码是将整数分类值转化为独热向量。

56.［单选题］我们建立一个5000个特征，100万数据的机器学习模型。我们怎么有效地应对这样的大数

据训练（）。

A）我们随机抽取一些样本，在这些少量样本之上训练

B）我们可以试用在线机器学习算法

C）我们应用PCA算法降维，减少特征数

D）以上答案都正确

答案:D

解析:样本数过多或者特征数过多，而不能单机完成训练，可以用小批量样本训练，或者在线累计式训

练，或者主成分PCA降维方式减少特征数量再进行训练。

57.［单选题］现阶段的大数据技术体系主要类型不包括0。

A）数据源与App

B）基础设施

C）Hadoop

D）数据资源

答案:C

解析：Speechpad的联合创始人DaveFeinleib于2012年发布大数据产业全景图（BigData

Landscape）,首次较为全面地刻画了当时快速发展中的大数据技术体系。后来，该图及其画法成为大

数据和数据科学的重要分析工具，得到广泛地应用和不断地更新。MattTurck等组织绘制了2017大数

据产业全景图（BigDataLandscape2017）»从2017大数据产业全景图看，现阶段的大数据技术体系

主要类型包括数据资源、数据源与App、开源工具、跨平台基础设施和分析工具、行业应用、企业应

用、基础设施和分析工具。

58.［单选题］下列哪一项不是大数据架构中需要考虑的要点？

A）业务分解

B）业务联动

C）持续发展

D）独立开发

答案:D

解析：

59.［单选题］以下可用于隐变量估计的方法是：

A）梯度下降法

B）EM法

C）牛顿法

D)支持向量机

答案:B

解析：

60.［单选题］下面哪项不属于循环神经网络的输出模式。()

A)、单输出

B)、多输出

C)、同步多输出

D)、异步多输出

答案:C

解析：

61.［单选题］pynlpir是一种常用的自然语言理解工具包，其中进行分词处理的函数是(—兀

A)open()

B)segment()

C)AddUserWord()

D)generate()

答案:B

解析：

62.［单选题］一个关系只有一个()

A)外码

B)候选码

C)超码

D)主码

答案：D

解析：

63.［单选题］根据《大数据风控平台项目操作手册》，在【大数据贷后预警处置】菜单中，用户选中

一个客户，点击()按钮，可以查看该客户的预警信号。

A)预警信号详情

B)B.查看客户信息

C)C.填写处置措施

D)D.影像操作

答案:A

解析：

64.［单选题］以下关于字符串类型的操作的描述，错误的是：

A)str.replace(x,y)方法把字符串str中所有的x子串都替换成y

B)想把一个字符串str所有的字符都大写，用str.upper()

C)想获取字符串str的长度，用字符串处理函数str.len()

D)设x='aa',则执行x*3的结果是'aaaaaa'

答案:c

解析：

65.［单选题］（_）是在不影响数据分析结果准确性的前提下，对原始数据进行一定的变换操作，对其

中的个人（组织）敏感数据进行替换或删除操作。

A）数据加工

B）数据保护

C）数据脱敏

D）数据清洗

答案:C

解析：

66.［单选题］下面关于"priceBETWEEN0AND、59”描述错误的是（）。—

A）判断的范围包括0

B）BETWEEN...AND用于设置比较区间

0判断的范围包括59

D）以上说法都不正确

答案:D

解析：

67.［单选题］下列哪个程序通常与NameNode在一个节点启动？

A）SecondaryNameNode

B）DataNode

C）TaskTracker

D）JobTracker

答案:D

解析：

68.［单选题］在HBase的专用过滤器中，TimestampsFilter是（）

A）时间戳过滤器

B）包含结束的过滤器

C）列计数过滤器

D）首次行键过滤器

答案:A

解析：

69.［单选题］关于脏数据和乱数据的区分，以下哪种不属于脏数据0。

A）含有缺失数据

B）冗余数据

C）噪声数据

D）不规则形态数据

答案:D

解析:在数据库技术中，脏数据在临时更新（脏读）中产生。事务A更新了某个数据项X,但是由于某种

原因，事务A出现了问题，于是要把A回滚。但是在回滚之前，另一个事务B读取了数据项X的值（A更新

后），A回滚了事务,数据项恢复了原值。事务B读取的是脏数据。

70.［单选题］根据《泛在电力物联网2019年建设方案》，在统筹组织、基层创新该项建设原则中指出

,公司研究确定的三类任务不包括（）

A）统一组织

B）专项试点

C）开放合作

D）创新探索

答案:C

解析：

71.［单选题］按粒度大小的顺序，Hive数据被分为：数据库、数据表、（）、桶？

A）元祖

B）栏

C）分区

D）行

答案:C

解析：

72.［单选题］下面对字典型数据的正确表示为（）

A）dic=［l：2,3：4,5：5］

B）dic={l,3,4,5,6}

C）dict={（l,2）,（4,5）,（2,4）}

D）dict={'a'：1,'b'：3,'c'：5}

答案:D

解析：

73.［单选题］如果线性回归模型中的随机误差存在异方差性，那么参数的OLS估计量是（一）。

A）无偏的，有效的

B）无偏的，非有效的

C）有偏的，有效的

D）有偏的，非有效的

答案：B

解析：

74.［单选题］下面描述错误的是：（）

A）数据挖掘的目标明确，先做假设，然后通过数据分析来验证假设是否正确，从而得到相应的结论

B）数据挖掘的重点在寻找未知的模式与规律

C）数据分析一般都是得到一个指标统计量结果，如总和、平均值等

D）数据挖掘则是输出模型或规则，并且可相应得到模型得分或标签

答案:A

解析：

75.［单选题］下列关于网络用户行为的说法中，错的是（）。

A）网络公司能够捕捉到用户在其网站上的所有行为

B）用户离散的交互痕迹能够为企业提升服务质量提供参考

C）数字轨迹用完即自动删除

D）用户的隐私安全很难得以规范保护

答案:C

解析：

76.［单选题］贝叶斯决策的最优分类面是（_）。

A）线性的

B）非线性的

C）不可构造的

D）不存在的

答案:A

解析：

77.［单选题］下列关于python面向对象编程，正确的是（）

A）Python在类中定义函数的第一个参数为this

B）_init_方法可以使定义的实例拥有类模板的属性

C）如果子类定义了父类中的同名方法，通过子类调用该方法时使用父类的方法

D）如果一个变量前带有可以直接从外部访问

答案：B

解析：

78.［单选题］已知x与y的关系如下表所示：表1x与y的关系xyx<0xlx=0xx>0x+1以下选项中，可

以正确地表达x与y之间关系的是（）

A）y=x+lifx>=0：ifx=0：y=xelse：y=x-1

B）y=x-lifx!=0：ifx>0：y=x+1else：y=x

C）ifx<=0：ifx<0：y=x-1else：y=xelse：y=x+1

D）y=xifx<=0：ifx<0：y=x-1else：y=x+1

答案:C

解析：

79.［单选题］（_）不是描述统计的基本类型。

A）集中趋势分析

B）无关分析

C）相关分析

D）离中趋势分析

答案:B

解析:

80.［单选题］以下哪个不是聚类方法：（）

A）GMM

B）LDA

ODBSCAN

D）TPLINK

答案：D

解析：

81.［单选题］业务部门梳理本专业（）,制定数据转换需求，提高数据可读性，丰富完善一手数据资

源。

A）原始数据

B）结构化数据

0非结构化数据

D）所有数据

答案:C

解析：

82.［单选题］下列关于可视化方法体系说法不正确的是（）。

A）通常采用视觉图形元素和视觉通道两个维度进行视觉编码

B）常用的共性方法有统计图表、图论方法、视觉隐喻和图形符号学等

C）领域方法在所属领域内其可视化的信度和效果往往低干基础方法的直接应用

D）视觉编码为其他数据可视化方法提供了方法学基础

答案:C

解析：领域方法在所属领域内其可视化的信度和效果高于基础方法的直接应用。

83.［单选题］下列关于RBM的说法，错误的是（）

A）学习过程很快

B）RBM训练可以看作对一个深层BP网络的网络权佳参数的初始化

C）RBM不用人工选择特征

D）RBM有标签样本集

答案:A

解析：

84.［单选题］如果想获取一个序列内的数据可以通过（）获取

A）索弓I

B）最大值

C）最小值

D）求和

答案:A

解析：

85.［单选题］以下关于公共安全行业专题分析与查询业务场景描述错误的选项是()o

A)适用标准SQL语句进行查询，根据查询结果筛选目标人群，侦办案件。

B)原始数据经过批处理后结果写入到指定的文件目录，供交互时查询。

C)临时交互式查询任务对数据进行精确或者模糊查询。

D)数据湖内多个数据源只能单独访问再呈现结果。

答案:D

解析：

86.［单选题］np.eye()的作用是(_)0

A)创建全零矩阵

B)创建全1矩阵

0创建对角全1的矩阵

D)显示矩阵

答案:C

解析：

87.［单选题］下面这条GaussDB200语句"calldbms_job.interval(1,'sysdate+1.0/24')；"的意

思是

A)修改Jobl的Interva为每隔24小时执行一次。

B)修改Jobl的Interval为每隔1小时执行一次。

C)修改Jobl的Interval为每隔1/24小时执行一次。

D)修改Jobl的Interval为每隔24分钟执行一次。

答案:B

解析：

88.［单选题］关于列表的说法，描述错误的是()

A)list是一个有序集合，没有固定大小

B)list可以存放任意类型的元素

C)使用list时，其下标可以是负数

D)list是不可变的数据类型

答案:D

解析：

89.［单选题］根据《承德银行大数据贷后风险预警信号管理办法(试行)》，承德辖区支行的黄色级

信号，支行管户客户经理应在接收到系统所推送信号2个工作日内联系客户完成贷后预警信号核实工

作，限期()个工作日内制定出针对性的处置措施。

A)1

B)B.3

C)C.5

D)D.10

答案:C

解析:

90.［单选题］当前传统关系型数据库主要面临的挑战是（

A）数据量爆炸式增长，要求数据处理平台具备弹性扩展能力。

B）数据处理时效性需求提高，要求数据处理平台速度够快。

C）多类型数据融合，要求数据处理平台功能更加强大。

D）以上全都正确。

答案：D

解析：

91.［单选题］按照“（）”的思路，以打造智慧能源综合服务体系为抓手，统一对外业务门户和人口

,实现“引流+赋能”，创新推动源网荷储协同服务，积极构建能源互联网生态圈，推动新兴业务

“百花齐放”，带动产业链上下游共同发展。

A）数据+应用

B）平台+生态

C）能源+业务

D）数据+业务

答案:B

解析：

92.［单选题］Elasticfearch是怎么实现Master选举的？

A）内部自行选举

B）借助ZooKeeper选举

C）随机生成

D）自行指定

答案:B

解析：

93.［单选题］各单位应对各域间边界、尤其是互联网边界的数据流量，建立健全数据监测、审计机制

及相关技防措施，审计日志应留存不少于（）个月

A）一

B）三

C）六

D）十二

答案:C

解析：

94.［单选题］下面关于matplotlib的介绍不正确的是。

A）matplotlib是一个python的2d和3d绘图库

B）matplotlib可以实现跨平台

Omatplotlib的操作是通过API实现的

D）matplotlib中函数接口实现的API易用性更好

答案:A

解析：

95.［单选题］应用人工智能和（）等新技术，实现区域自治、云边协同和能力开放。

A）云计算

B）能源生态

C）边缘计算

D）数据共享

答案:C

解析：

96.［单选题］在模型评估与度量的方法中，（_）直接将数据集划分为两个互斥的集合，一个作为训

练集，另一个作为测试集。

A）自助法

B）留出法

C）交叉验证法

D）错误率分析

答案:B

解析：

97.［单选题］（）是一个组织机构的数据管理的愿景、目标以及功能蓝图的统一管理。

A）数据治理

B）数据战略

C）数据加工

D）数据能力

答案:B

解析：数据战略（DataStrategy）是一个机构的数据管理的愿景、目标以及功能蓝图的统一管理。从

DMM模型可看出，数据战略是组织机构的数据管理工作的重要前提。

98.［单选题］Spark的集群管理模式不包含（）。

A）Standalone模式

B）Message模式

OYARN模式

D）Mesos模式

答案：B

解析：

99.［单选题］交叉表的横纵轴区域中，除了行维度、列维度外，另外一个是0

A）形状

B）风格

C）背景

D）指标

答案:D

解析：

100.［单选题］结构化程序设计中，下面对goto语句使用描述正确的是o

A）禁止使用goto语句

B）应避免滥用goto语句

C）goto语句最好用，不容易造成结构体程序混乱

D）使用goto语句程序效率高

答案：B

解析：

101.［单选题］以下关于选用Kafka等消息系统的原因描述错误的是（）。

A）解耦：消息系统在处理过程中插入一个隐含、基于数据的接口层。

B）同步通信：消息队列允许消息加入队列，等需要时再处理。

C）扩展性：消息队列解耦处理过程，容易扩展处理过程。

D）冗余：消息队列持久化，防止数据丢失

答案:D

解析：

102.［单选题］掌握智慧物联的发展重点，应用人工智能和（）等新技术，实现区域自治、云边协同和能

力开放。

A）云计算

B）能源生态

C）边缘计算

D）数据共享

答案:C

解析：

103.［单选题］获取指定字符串长度的函数是（）

A）Lefttrim

B）Length

C）Lower

D）NumberToString

答案:B

解析：

104.［单选题］Maxcompute表tl、t2都是分区表，分区键是pt,对于sql语句selecttl.idfromtl

leftouterjoint2ontl.id=t2.idwheretl.pt='20140101Tandt2.pt=,20140101）,（

）说法是正确的。

A）两张表都会进行分区裁剪

B）t2表会进行分区裁剪

C）tl表会进行分区裁剪

D）两张表都不会进行分区裁剪

答案:C

解析：

105.［单选题］在Hadoop中，下面哪个是默认的InputFormat类型，它将每行内容作为新值，而将字节

偏移量作为key（）

A）FilelnputFormat

B）TextlnputFormat

C）KeyValueTextlnputFormat

D）CombineTextlnputFormat

答案:B

解析：

106.［单选题］Numpy包中meshgrid（）函数实现的功能是（）。

A）数组拆分

B）数组乘法

C）数组除法

D）数组融合

答案:D

解析:np.meshgrid（）用于数组融合，在画等高线图时常用。

107.［单选题］下列关于存储过程中的变量说法正确的是（）?

A）声明变量时需要指定变量的初始值。

B）变量的作用域是全局。

C）变量必须先声明后使用.

D）声明变量时需要指定变量的数据类型。

答案:C

解析：

108.［单选题］对数据可视化的作用说法不正确的一项是（）

A）数据分析

B）数据过滤

C）信息记录

D）横纵对比

答案：B

解析：

109.［单选题］创建Loader作业时，可以在以下（）步骤中设置Map数。

A）输出

B）输入设置

C）转换

D）基本信息

答案:A

解析：

110.［单选题］根据《大数据风控平台项目操作手册》，在企业信用智能分析报告页面，点击左上角

【打印/下载】按钮，弹出打印机选择页面。用户在弹出的打印机选择页面，选择（）项，点击【打

印】按钮，选择保存路径，即可保存PDF版本企业信用智能分析报告文件到指定路径。

A）Fax

B）B.MicrosoftprinttoPDF

C）C.MicrosoftXPSDocumentWriter

D）D.OneNote

答案:B

解析：

111.［单选题］线性回归的基本假设不包括哪个？

A）随机误差项是一个期望值为0的随机变量

B）对于解释变量的所有观测值，随机误差项有相同的方差

C）随机误差项彼此相关

D）解释变量是确定性变量不是随机变量，与随机误差项之间相互独立

答案:C

解析：

112.［单选题］以下不属于数据科学家主要职责的是（—）。

A）制定“数据战略”

B）研发“数据产品”

C）构建“数据生态系统”

D）运用“数据领域知识”

答案:D

解析：

113.［单选题］下列不属于数据科学与统计学区别的是（）。

A）数据科学中的数据不仅仅是数值

B）数据科学关注的不仅仅是“单一学科”问题，超出了数学、统计学、计算机科学等单一学科的范

畴

C）数据科学不仅仅是理论研究，也不是纯领域实务知识，它关注和强调的是二者的结合

D）数据科学和统计学中的计算一样，仅仅是加减乘除

答案:D

解析:数据科学中的计算并不仅仅是加/减/乘/除等数学计算，而是包括数据的查询、挖掘、洞见

、分析、可视化等更多类型的计算。

114.［单选题］HBase的物理存储单元是什么？

A）Region

B）Columnfami1

C)Column

D)Row

答案：B

解析：

115.［单选题］在HBase的表的每个区域是由表中的(—)的子集构成。

A)行

B)列

C)单元

D)块

答案:A

解析：

116.［单选题］以下哪项不是深度学习最近火热的原因()

A)神经网络是一个全新的领域

B)需要处理的数据量急剧加大

C)计算能力的不断提升

D)深度学习在很多重要领域，例如语音识别和图像识别等方面取得了重大成就

答案:A

解析：

117.［单选题］如果在大型数据集上训练决策树。为了花费更少的时间来训练这个模型，下列哪种做法

是正确的()

A)增加树的深度

B)增加学习率

C)减小树的深度

D)减少树的数量

答案:C

解析：决策树深度越深，在训练集上误差会越小，准确率越高。但是容易造成过拟合，而且增加模型的

训练时问间。对决策树进行修剪，减小树的深度，能够提高模型的训练速度，有效避免过拟合。

118.［单选题］若要修改HBase表，下列API哪个最先被调用？

A)createConnection()

B)getTable()

C)getConnect()

D)getAdmin()

答案:D

解析：

119.［单选题］在线性回归中，(.)试图找到一条直线，使所有样本到直线上的欧氏距离之和最小。

A)最小二乘法

B)拉格朗日乘子法

C)欧氏距离

D)均方误差

答案:A

解析：

120.［单选题］关于Maxcompute中的运算符的说法，正确的是：()。

A)String类型可以和其他任意类型进行隐式转换：Boo1ean不行

B)除boolean外，其他类型不允许参与逻辑运算，也不允许其他类型的隐式类型转换

C)只有bigint、double才能参与算数运算：只有string、bigint、double和Decimal才能参与算术运

算

D)特殊的关系运算符rlike表示右侧开始匹配

答案:B

解析：

121.［单选题］对HDFS通信协议的理解错误的是().

A)客户端与数据节点的交互是通过RPC(RemoteProcedureCall)来实现的

B)客户端通过一个可配置的端口向名称节点主动发起TCP连接，并使用客户端协议与名称节点进行交

互

C)名称节点和数据节点之间则使用数据节点协议进行交互

D)HDFS通信协议都是构建在IoT协议基础之上的

答案:D

解析：

122.［单选题］Python对not、or、and求值的优先顺序是()。

A)andornot

B)notandor

C)orandnot

D)ornotand

答案：B

解析:详见对比符优先级。

123.［单选题］关于Sqoop的说法，不正确的是()。

A)主要设计目的是在Hadoop与传统数据库之间进行数据的ETL操作

B)数据导入导出通过MapReduce完成

C)Sqoop具备MapReduce的并行化和容错性

D)Sqoop的Reduce操作速度更快

答案:D

解析:Sqoop是一个强大的工具，主要用来处理大量的数据传输，并不会影响Reduce的操作速度。

124.［单选题］将python中的.py文件转换为.pyc文件的组件为()。

A)编辑器

B)编译器

C）虚拟机

D）解释器

答案：B

解析：

125.［单选题］查看HDFS的报告命令是（）

A）bin/hdfs

B）bin/hdfs

C）bin/hdfs

D）bin/hdfs

答案:A

解析：

126.［单选题］数据库设计中用关系模型表示实体和实体之间的联系。关系模型的结构是（一）。

A）层次结构

B）网状结构

C）封装结构

D）二维表结构

答案:D

解析：

127.［单选题］图灵奖获得者JimGray提出的科学研究的第四范式--数据密集型科学发现（Data-

intensiveScientificDiscovery）描述了数据科学的（）

A）三要素原则

B）数据复杂性原则

C）三世界原则

D）从简原则

答案:C

解析：

128.［单选题］关于贝叶斯网络,说法错误的是0

A）、是由有向有环图构成

B）、每个节点代表一个“事件”或者”随机变量”

C）、贝叶斯网络是基于概率推理的模型

D）、表示起因的假设和表示结果的数据均用结点表示

答案:A

解析：

129.［单选题］假如table中有一条记录，字段列coll值为空，下面（）条件会将此条记录查询出来

A)coll="

B)coll!="

C）collisnull

D）collisnotnull

答案:C

解析：

130.［单选题］（）不仅可用于多层前馈神经网络，还可用于其他类型的神经网络

A）感知机

B）神经元

C）神经系统

D）误差逆传播

答案:D

解析：

131.［单选题］正确导入日期模块的语句是（）。

A）importdate

B）importdatetime

C）importtime

D）importdatetime

答案：B

解析：导入日期模块的语句是importdatetime

132.［单选题］考虑某个具体问题时，你可能只有少量数据来解决这个问题不过幸运的是你有一个类

似问题已经预先训练好的神经网络可以利用这个预先训练好的网络的方法是（）

A）把除了最后一层外所有的层都冻住，重新训练最后一层

B）对新数据重新制1鲸整个模型

C）只对最后几层进行训练调参（直netune）

D）对每一层模型进行评估，选择其中的少数来用

答案:C

解析：

133.［单选题］根据《大数据风控平台项目操作手册》，担保圈链模块，连通路径指连接担保圈链中

各节点所产生的路径，一个节点只能在当前连通路径中出现（）次。

A）1

B）B.3

C）C.5

D）D.10

答案:A

解析：

134.［单选题］LasVegasWrapper是一种典型的（_）算法。

A）过滤式选择

B）嵌入式选择

C）包裹式选择

D）正则化

答案:C

解析：

135.［单选题］使用Pig语句实现条件查询，下列语句正确的是（__）o

A）SELECT*FROMtmp_tableWHEREage>18；

B）tmp_table_where=FILTERtmp_tableBYage>18；DUMPtmp_tab1e_where；

C）DUMPtmp_tableFILTERBYage>18：

D）FILTERtmp_tableBYage>18；

答案:B

解析：

136.［单选题］下面这条GaussDB200语句rtcalldbms_job.interval（1,'sysdate—1.0/24）：”的意思

是（）

A）修改Jobl的Interval为每24分钟执行一次

B）修改Jobl的Interval为每24小时执行一次

C）修改Jobl的Interval为每1/24小时执行一次

D）修改Jobl的Interval为每1小时执行次

答案:D

解析：

137.［单选题］下面关于词袋模型说法错误的是？

A）词袋模型即bagofwords（BOW）

B）词袋模型是常用的文本表示方式

C）词袋模型的词汇表采用字典顺序排列

D）词袋模型可以得到文本的二进制编码表示

答案:C

解析：

138.［单选题］Python变量作为实参时，它和对应的形参之间数据传递方式是（）。

A）由形参传给实参

B）由实参传给形参

C）由实参传给形参，再由形参传给实参

D）在用户干预情况下，实参形参能相互传递

答案:D

解析：

139.［单选题］scipy.stats模块中对随机变量进行随机取值的函数是什么？

A）rvs

B）pdf

Ocdf

D)sf

答案:A

解析：

140.［单选题］大数据计算服务(MaxCompute,原ODPS)中的客户表customer是一张非分区表，现在

想要清空表的内容然后重新上传数据，可以通过()将数据清空。

A)deletefromcustomer；

B)insertoverwritetablecustomerselect*fromcustomer；

C)truncatetablecustomer；

D)droptablecustomer；

答案:C

解析：

141.［单选题］关于云主机登录方式描述对的是()

A)Windows通过远程桌面(MSTSC)方式登录

B)Linux通过SSH方式登录

C)通过控制台方式(VNC)登录

D)以上描述均对

答案:D

解析：

142.［单选题］以下描述不正确的是(__)o

A)文本是半结构化数据

B)非结构化数据是数据科学与传统数据管理的主要区别

C)视频是非结构化数据

D)目前，非结构化数据占比最大

答案:A

解析：

143.［单选题］下列哪一个属于浮点型数据？

A)a=l

B)a=3.14

C)a='3.14'

D)a=True

答案：B

解析：

144.［单选题］有关Hive支持的数据类型，“Helloworld”可以使用下列那一个数据类型()

A)Int

B)Float

C)Double

D)String

答案:D

解析：

145.［单选题］以下程序的输出结果是：LI=［'abc',［,123,,,4561］］L2=［'1','2','3'］print(Ll

>L2)

A)False

B)TypeError：'>'notsupportedbetweeninstancesof'list'and'str'

D)True

答案：D

解析：

146.［单选题］MapReduce计算框架的输入数据结构是()。

A)key-value

B)input-output

C)map-reduce

D)key-column

答案:A

解析:MapReduce计算框架的输入是键值对，即key-value。

147.［单选题］构成状态空间的4个要素是：()o

A)开始状态、目标状态、规则与操作

B)初始状态、中间状态、目标状态与操作

C)空间、状态、规则与操作

D)开始状态、中间状态、结束状态与其他状态

答案:B

解析：

148.［单选题］np.sqrt(10)的结果是?

A)3.1622776601684

B)3

C)10

D)1

答案:A

解析：

149.［单选题］在统计抽样过程中，我们计算抽样误差的原因是()

A)追求精确。

B)追求效率。

C)寻求因果。

D)以误差为中心。

答案:A

解析：

150.［单选题］下列选项中，描述正确是()。

A)Series是一维数据结构，其索引在右，数据在左

B)DataFrame是二维数据结构，并且该结构具有行索引和列索引

OSeries结构中的数据不可以进行算术运算

D)sort_values()方法可以将Series或DataFrame中的数据按照索引排序

答案:B

解析：

151.［单选题］Saprk中默认的存储级别是()

A)MEMORY_ONLY

B)MEMORY_ONLY_SER

C)MEMORY_AND__DISK

D)MEMORY_AND_DISK_SER

答案:A

解析：

152.［单选题］FusioninsightHD系统中如果修改了服务的配置项，不进行服务重启，该服务的配置

状态是什么状态？

A)SYNCHRONIZED

B)EXPIRED

C)CONFIGURING

D)UNKNOWN

答案：B

解析：

153.［单选题］Hadoop中，Reducer的三个阶段是()。

A)Shuffle-Sort-Reduce

B)Shuffle-Reduce-Sort

C)Reduce-Shuff1e-Sort

D)Sort-Shuffile-Reduce

答案:A

解析：Reducer主要分为Shuffle洗牌、Sort排序和Reduce三个步骤。

154.［单选题］关于OTS中数据查询的说法正确的是：()。

A)查询时仅需要提供分片键即可

B)可以创建索引，然后基于索引列进行查询

C)查询时可以仅提供主键的一部分，但是和组成主键的列的顺序有关

D)单行查询必须提供主键

答案：D

解析：

155.［单选题］迪士尼MagicBand手环，体现了哪种大数据思维方式（）

A）我为人人，人人为我

B）全样而非抽样

C）效率而非精确

D）相关而非因果

答案:A

解析：

156.［单选题］下列哪个不属于CRF模型对于HMM和MEMM模型的优势

A）特征灵活

B）速度快

C）可容纳较多上下文信息

D）全局最优

答案:B

解析：

157.［单选题］从网络的原理上来看，结构最复杂的神经网络是（）

A）卷积神经网络

B）长短时记忆神经网络

OGRU

D）BP神经网络

答案:C

解析：

158.［单选题］txt=open（filename）返回的是（）0

A）变量

B）常数

C）文件内容

D）文件对象

答案:D

解析：

159.［单选题］让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能，就是。

A）有监督学习

B）全监督学习

C）无监督学习

D）半监督学习

答案:D

解析：

160.［单选题］（）算法可以用于特征选择。

A)朴素贝叶斯

B)感知器

C)支持向量机

D)决策树

答案:D

解析：使用决策树也可以计算每个特征的相对重要性。这些重要性能够辅助进行特征选择。

161.［单选题］Hadoop生态系统中，(—_)的主要设计目的是在Hadoop与传统数据库之间进行数据的

ETL操作。

A)HDFS

B)Flume

OHive

D)Sqoop

答案:D

解析：

162.［单选题］下列算法中属于图像锐化处理的是

A)低通滤波

B)加权平均法

C)高通滤波

D)中值滤波

答案:C

解析：

163.［单选题］()不是神经网络的代表。

A)卷积神经网络

B)递归神经网络

C)残差网络

D)xgboost算法

答案:D

解析：xgboost是boosting算法的代表。

164.［单选题］(_)实现了采用留一法进行交叉验证。

A)kf=KFold(n_splits=2)

B)kf=RepeatedKFold(n_splits=2,n_repeats=2,random_state=0)

C)Ipo=LeavePOut(p=2)

D)loo=LeaveOneOut()

答案:D

解析：

165.［单选题］MapReduce适用于()

A)任意应用程序

B）任意可以在Windows

C）可以串行处理的应用程序

D）可以并行处理的应用程序

答案:D

解析：

166.［单选题］图像灰度方差说明了图像哪一个属性

A）平均灰埋

B）图像对比度

C）图像整体亮度

D）图像细节

答案:B

解析：

167.［单选题］根据《大数据风控平台项目操作手册》，财务智能分析中的财务指标趋势分析模块

，点击（）可切换变化率的两种计算方式（选择该期财务指标的去年同比值或与今年年初的比较值

）O

A）合并/本部

B）B.按报告期/按年度切换

OC.同比变化率/比年初变化率

D）D.以上都不对

答案:C

解析：

168.［单选题］选项()可以令下面的代码输出结果为Truea=foo(2)b=foo(3)print(a<b)

A)classfoo：def_init_(self,x)：self,x=xdef_It_(self,other)：ifself,x<

other,x：returnFalseelse：returnTrue

B)classfoo：def_init(self,x)：self,x=xdef_less_(self,other)：ifself,x>

other,x：returnFalseelse：returnTrue

C)classfoo：def_init_(self,x)：self,x=xdef_It_(self,other)：ifself,x<

other,x：returnTrueelse：returnFalse

D)classfoo：def_init_(self,x)：self,x=xdef_less_(self,other)：ifself,x<

other,x：returnFalseelse：returnTrue

答案:C

解析：

169.［单选题］著名的C4.5决策树算法使用()来选择最优划分属性。

A)信息增益

B)增益率

C)基尼指数

D)均值

答案:B

解析:

170.［单选题］以下说法中正确的是()o

A)Python3.x完全兼容Python2.x0

B)在Windows平台上编写的Python程序无法在Unix平台运行。

C)不可以在同一台计算机上安装多个Python版本。

D)Python是跨平台的

答案：D

解析：

171.［单选题］对组织机构的数据管理成熟度等级划分中的已执行级的描述错误的是()。

A)在具体项目中，DMM关键过程域(KPA)中给出的关键过程已被执行，但随意性和临时性较大

B)DMM关键过程的执行不仅仅局限于特定业务范畴，存在跨越不同业务领域的关键过程

C)缺少针对DMM关键过程的反馈与优化

D)虽然有可能在特定业务过程中进行了基础性改进，但没有进行持续跟进，也未拓展到整个组织机构

答案:B

解析:DMM的执行级(PerformedLevel)：组织机构只在个别项目的范围之内"执行"了DMM给出的关键过

程，但缺乏机构层次的统筹与管理。主要特点如下:①在具体项目中，DMM关键过程域(KPA)中给出的关

键过程(KeyProcess)已被执行，但随意性和临时性较大。②DMM关键过程(KeyProcess)的执行往往

仅限于特定业务范畴，很少存在跨越不同业务领域的关键过程。③缺少针对DMM关键过程(Key

Process)的反馈与优化。以DMM关键过程(KeyProcess)中的"数据质量"为例，其数据管理工作可能过

于集中在一个特定业务，如"数据修复活动"，并没有扩散到整个的业务范围或并没有开展对数据修复

活动本身的反馈与优化工作;④虽然有可能在特定业务过程中已进行了基础性改进，但没有进行持续

跟进，也未拓展到整个组织机构；⑤)组织机构没有统筹其数据管理工作，而数据管理活动局限在具体

项目中，主要按照其具体项目的实施需求进行，如果一个具体项目中需要进行数据管理，可能会执行

DMM中给出的相关过程，反之亦然。

172.［单选题］MapReduce自定义排序规则需要重写下列那项方法()

A)readFields()

B)compareTo()

C)map()

D)reduce()

答案:B

解析：

173.［单选题］()负责组织制定电力监控系统数据安全保护方案，并对安全保护措施技术落实情况

进行检查。

A)国调中心

B)国网安质部

C)国网信通部

D)网络安全和信息化领导小组

答案:A

解析：

174.［单选题］Hbase中的Region是由：（）服务进程来管理的。

A）HRegionServer

B）Zookeeper

OHmaster

D）DataNode

答案:A

解析：

175.［单选题］（）不是RDD的缓存方法。

A）persist

B）cache

C）memory

D）以上答案都正确

答案:C

解析：

176.［单选题］Reduce阶段不包括以下哪一步？（）

A）排序

B）分区

C）分组

D）规约

答案:B

解析：

177.［单选题］Sklearn库中对数据进行预处理和规范化主要依靠（）模块。

A）neighbors模块

B）preprocessing模块

Opipeline模块

D）datasets模块

315

答案:B

解析：sklearn.preprocessing模块包括缩放、居中、归一化、二值化和插补方法，主要是对数据进

行预处理和规范化。

178.［单选题］业务中台是将具有（）特征的业务沉淀形成企业级共享服务中心，各业务系统不再单

独建设共性应用服务，直接调用业务中台服务。

A）共性

B）个性

C）统一

D）分散

答案:A

解析：

179.［单选题］Hive是基于Hadoop的数据仓库软件，最大可以查询和管理()级别的分布式数据。

A)TB

B)GB

C)PB

D)MB

答案:C

解析：

180.［单选题］如何禁用reduce阶段()

A)设置conf.setNumreduceTasks(0)

B)设置job.setNumreduceTasks(0)

C)设置job.setNumreduceTasks()=0

D)修改配置文件中NumreduceTasks=O

答案:B

解析：

181.［单选题］大数据计算服务(MaxCompute,原0DPS)中的用户表dim_user是一张非分区表，另外

有一部分新增用户的数据存在usejdelta表中，两张表的结构相同，为了在dim_user表中得到全量

的用户数据，可以采用()方式。

A)select*fromuser_deltaintodim_user；

B)insertintodim_userselect*fromuser_deltaunionallselect*fromdim_user

C)insertoverwritetabledim_userselect*fromuser_delta

D)insertintotabledimuserselect*fromuserdelta

答案:D

解析：

182.［单选题］FusioninsightHD的Loader在创建作业时，连接器(Connector)有什么作用

A)确定有哪些转换步骤

B)提供优化参数，提高数据导入导出性能

C)配置作业如何对外部数据源进行连接

D)配置作业如何与内部数据源进行连接

答案:C

解析：

183.［单选题］以下()组件负责接收来自应用的访问请求，并向客户端返回执行结果。

A)GTM

B)WLM

C)CN

D)DN

答案:c

解析：

184.［单选题］在著名管理学家Thomas.H.Davernport在《哈佛商业论坛》上发表的题为《第兰代分析

学（Analytics3.0）｝的经典论文中,Analytics3.0时代是指（）。

A）商务智能时代

B）唱大数据时代

C）数据富足供给时代

D）数据智能时代

答案:C

解析：

185.［单选题］逻辑回归是输出结果落在［0,1］区间内，下列哪个函数用于转换概率，使其落入

［0,1］?

A）Sigmoid

B）Mode

C）Square

D）Probit

答案:A

解析：

186.［单选题］一切以数据作为驱动或者核心的产品叫做（）

A）创新性产品

B）数据产品

C）风控产品

D）核心产品

答案:B

解析：

187.［单选题］数据库设计中，反映用户对数据要求的模式是

A）内模式

B）外模式

C）设计模式

D）概念模式

答案：B

解析：

188.［单选题］日前，多数NoSQL数据库是针对特定应用场景研发出来的，其设计遵循（原则，更强调

读写效率、数据容量以及系统可扩展性

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

大数据开发基础练习题及答案17-2023-背题版

文档简介

温馨提示

最新文档

评论

大数据开发基础练习题及答案17-2023-背题版

文档简介

温馨提示

最新文档

评论

相关文档