版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试题说明
本套试题共包括1套试卷
每题均显示答案和解析
大数据开发基础练习题及答案5(500题)
大数据开发基础练习题及答案5
L[单选题]HDFS有一个gzip文件大小75MB,客户端设置BloCk大小为64MB。当运行Hiapreduce任务读
取该文件时inputSPIit大小为?
A)64MB
B)75MB
C)一个map读取64MB,另夕I—个map读取IIMB
答案:B
解析:问inputSPIit输入拆分的话:gzip算法不支持SPIit,Izo压缩/解压支持SPIit(需要建索引
,文件修改后需要重新建索引)
2.[单选题]从已知事实出发,通过规则库求得结论的产生式系统的推理方式是O
A)正向推理
B)反向推理
C)双向推理
答案:A
解析:
3.[单选题IMapReduce框架提供了一种序列化机制,支持这种序列化的类能够在MaP和RedUCe过程中
充当键或值,以下说法错误的是?
A)实现Writable接口的类是值
B)实现WritabIeCOmParable接口的类可以是值或键
C)HadooP的基本类型TeXt并不实现WritableCOmParabIe接口
D)键和值的数据类型可以超出HadOoP自身支持的基本类型
答案:A
解析:
4.[单选题]以下哪一项属于非结构化数据。
A)企业ERP数据
B)财务系统数据
C)视频监控数据
D)日志数据
答案:C
解析:
5.[单选题]下列哪个HDFS命令可用于检测数据块的完整性
A)hdfsfsck/
B)hdfsfsck/-delete
C)hdfsdfsadmin-report
D)hdfsbalancer-thresheld1
答案:A
解析:
6.[单选题]以下代码的执行结果a,b,c分别是Oa=[[]]*5a[0].append(l)b=[[]foriin
range(5)]b[0].append(1)c=[□*5]c[0].append(1)
A)a:[[U,L],L],n,[]]b:[[1],LlL[1],[1L[l]]c[[1]J
B)a:[[1],Ll],[1],[1],[l]]b:[[1],□,□,□,[]]c[[ιu
C)a:LEU,[],L],E],L]]b:[[1],[1L[1],[1],[ι]]c[⑴,□,□,□,□]
D)a:[[1],[],[],□,[]]b:[[1].[1],[1],[1],[l]]c[[1],[1],[1],[1],[1]]
答案:B
解析:
7.[单选题]假设我们有由三次多项式回归产生的数据(三次多项式完美契合数据),下列说法哪些
是对的?L简单线性回归有高偏差和低方差2.简单线性回归有低偏差和高方差3.三次多项式有低偏
差和高方差4.三次多项式有低偏差和低方差
A)I和4
B)I和3
C)2和3
D)2和4
答案:A
解析:
8.[单选题]在MySQL中,建立数据库用()
A)CREATETABLE命令
B)CREATETRlGGER命令
OCREATEINDEX命令
D)CREATEDATABASE命令
答案:D
解析:
9.[单选题]()是指给目标用户产生的错误或不准确的视觉感知,而这种感知与数据可视化者的意图或
数据本身的真实情况不一致。
A)视觉假象
B)视觉认知
C)视觉感知
D)数据可视
答案:A
解析:视觉假象(ViSUalIlUSiOn)是数据可视化工作中不可忽略的特殊问题。视觉假象是指给目标用
户产生的错误或不准确的视觉感知,而这种感知与数据可视化者的意图或数据本身的真实情况不一致
10.[单选题]下列对于错误率的公式,解释正确的是(_)。
A)统计分类器预测出来的结果与真实结果不相同的个数,然后除以总的样例集D的个数。
B)先统计分类正确的样本数,然后除以总的样例集D的个数。
C)预测为正的样例中有多少是真正的正样例
D)样本中的正例有多少被预测正确
答案:A
解析:
IL[单选题]Redis中哪个命令是查看键的剩余生存时间?
A)ttl
B)expireat
C)persist
D)expire
答案:A
解析:
12.[单选题]SQL语法中内部关联的关键字是()
A)INNERJOIN
B)LEFTJOIN
OFULLJOIN
D)CROSSJOIN
答案:A
解析:
13.[单选题]下面描述错误是:()
A)“探针盒子”就是一款自动收集用户隐私的产品
B)许多顾客在使用WiFi之后会收到大量的广告信息,甚至自己的手机号码也会被当做信息进行多次
买卖
C)在免费上网的背后,其实也存在着不小的信息安全风险,或许8一不小心,就落入了电脑黑客们
设计的WiFi陷阱之中
D)免费WlFl都是安全的,可以放心使用
答案:D
解析:
14.[单选题]HDFS默认的当前工作目录是/user/$(JSER,fs.default,name的值需要在()配置文件内
说明。
A)mapred-site.xml
B)core-site,xml
C)hdfs-site.xml
D)以上均不是
答案:B
解析:
15.[单选题]大数据不是要教机器像人一样思考,相反,它是
A)把数学算法运用到海量的数据上来预测事情发生的可能性
B)被视为人工智能的一部分
C)被视为一种机器学习
D)预测与惩罚
答案:A
解析:
16.[单选题]scipy.stats()函数不能求()o
A)均值
B)方差
C)峰度
D)众数
答案:D
解析:stats作为一个函数可以返回均值、方差、(费舍尔)偏态、(费舍尔)峰度等值,不包括
众数等值。
17.[单选题]DataX是阿里集团发起的开源项目,是一种离线数据同步的工具,支持多种异构数据源
之间的高效数据同步,DataX任务配置文件使用()。
A)xml
B)java
C)bson
D)json
答案:D
解析:
18.[单选题]大数据平台Hadoop的组件中,提供分布式协作服务的组件是()
A)HBase
B)ZooKeeper
C)Sqoop
D)Hive
答案:B
解析:
19.[单选题]()是交叉验证法的一种特例
A)自助法
B)留一法
C)交叉验证法
D)错误率分析
答案:B
解析:
20.[单选题[StructuredStreaming不支持以下哪种计算时间?
A)处理时间
B)事件时间
C)结束时间
D)注入时间
答案:C
解析:
21.[单选题]hadoop中什么类提供了连接到HDFS系统并执行文件操作的基本功能()
A)FSDirectory
B)DFSClient
C)ClientProtocol
D)FSInputStream
答案:B
解析:A、FSDirectory【HDFS文件系统的整个命名空间是通过FSDireCtory类来管理的】
B、DFSCIientIDFSClient会连接到HDFS,对外提供管理文件/目录、读写文件以及管理与配置
HDFS系统等功能。】
C、ClientProtocol【这个接口中有两类方法,一是操纵命名空间的方法,二是操纵文件流的方法】
D、FSInPUtStreanl【在FSlnPUtStream类中,通过Seekable接口的seek()方法实现了
PoSitiOnedReadabIe接口中的read。方法】
22.[单选题]对数组中的某个元素进行修改时,计算机对其的操作是(_)。
A)复制该数组后再修改
B)直接在原数组中修改
C)修改该数组后再复制
D)删除该数组后,重新创建
答案:B
解析:
23.[单选题]下列关于数据整合和分组的说法不正确的是()。
A)数据连接可以用concat或merge函数
B)axis=l表示轴向连接
C)数据分组可以使用mean函数
D)使用agg可以自定义多个聚合函数
答案:C
解析:数据分组不可以使用mean函数,mean函数为求平均数函数。
24.[单选题]以下选项不包含在DlKW金字塔中的是()。
A)信息
B)数值
C)知识
D)智慧
答案:B
解析:
25.[单选题]()不是长短时记忆神经网络兰个门中的一个门
A)输入门
B)输出门
C)遗忘门
D)进化门
答案:D
解析:
26.[单选题]规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指
的是()。
A)大数据
B)贫数据
C)富数据
D)繁数据
答案:A
解析:
27.[单选题]大数据计算服务(MaxCompute,原ODPS)中的角色(Role)是一组访问权限的集合。
当需要读一组用户赋予相同的权限时,可以使用角色来授权。基于角色的授权可以大大简化授权流
程,降低授权管理成本,当需要对用户授权时,应当优先考虑是否应该使用角色来完成。关于角色
的说法中正确的是:()。
A)可以将OWner视为一个角色,赋给其他用户
B)Admin是项目空间自动创建的角色,可以为该角色添加权限
C)删除一个角色时,会先检查该角色内是否还存在其他用户。若存在,则删除该角色失败
D)创建完角色后,需要给角色添加权限,仅支持以AeL授权的方式添加
答案:C
解析:
28.[单选题]将内存引用赋值给另一个变量的操作叫(_)。
A)深拷贝
B)指针
C)参数实例化
D)浅拷贝
答案:D
解析:
29.[单选题]安装FusionInsightHD的Streaming组件是,Nimbus角色要求安装几个节点?
A)4
B)3
02
D)l
答案:C
解析:
30.[单选题]以下对VOIUme相关描述不正确的是()。
A)VoIUme是指数据量大
B)就目前而言,当数据量达到拍字节以上时,一般称为大数据
C)大数据时间分布是均匀的
D)数据量大是相对计算与存储能力而定的
答案:C
解析:
31.[单选题]关于OLAP和01:凹的区别描述,不正确的是()。
A)0LP主要是关于如何理解聚集的大量不同的数据,它与OTP应用程序不同
B)咱与OLP应用程序不同,OLTP应用程序包含大量相对简单的事务
OOLP的特点在于事务量大,但事务内容比较简单且重复率高
D)OLP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面
对的用户是相同的
答案:C
解析:
32.[单选题]在Python中,下面哪些对列表的描述是错误的?。
A)列表中的一项叫做元素。
B)列表被创建后,还可以修改其中的元素。
C)索引被用于标识某个元素在列表中的位置,列表的索引从0开始
D)列表是一系列元素组成的序列,在一个列表中,元素的类型必须相同。
答案:D
解析:
33.[单选题]大数据时代()
A)不允许不精确的数据
B)允许不精确的数据
C)为精确可以牺牲效率
D)只要因果数据
答案:B
解析:
34.[单选题]下列关于在回归分析中解释变量与非解释变量的说法正确的是()。
A)解释变量和被解释变量都是随机变量
B)解释变量为非随机变量,被解释变量为随机变量
C)解释变量和被解释变量都为非随机变量
D)解释变量为随机变量,被解释变量为非随机变量
答案:B
解析:在回归分析中,解释变量可以理解为自变量,具有确定性,因此为非随机变量;被解释变量
可以理解为因变量,具有随机性,因此为随机变量。
35.[单选题]关系型数据库最多可以创建。个只读实例
A)5
B)4
03
D)2
答案:A
解析:
36.[单选题]下列叙述正确的是()。
A)continue语句的作用是结束整个循环的执行
B)只能在循环体内使用break语句
C)在循环体内使用break语句或continue语句的作用相同
D)从多层循环嵌套中退出时,只能使用goto语句
252
答案:B
解析:eontinue语句可以跳过循环的当前一步,故AC错;Python没有goto语句。
37.[单选题]未来二十年就是()为王的时代。
A)文化
B)工业
C)数据
D)农业
答案:C
解析:
38.[单选题]执行以下代码段defdescribe_pet(animal_type,pet_name):print("Ihavea"+
animal_type+".")print("My"+animal_type+"'snameis"+pet_name.title()+
1
".")describepet(petname='harry,animaltype='hamster')时,输出为()o
A)Ihaveaharry.Myharry1snameisHarry.
B)Ihaveaharry.Myharry'snameisHamster.
C)Ihaveahamster.Myhamster'snameisHamster.
D)Ihaveahamster.Myhamster'snameisHarry.
答案:D
解析:
39.[单选题]S市A,B共有两个区,人口比例为3:5,据历史统计A的犯罪率为0.01%,B区为
0.015%,现有一起新案件发生在S市,那么案件发生在A区的可能性有多大?(—)
A)0.375
B)0.268
O0.286
D)0.261
答案:C
解析:
40.[单选题]大数据计算服务中,临时数据表tmp_item是一张非分区表,开发人员在建表时指定了
IifeCyCle属性为30,且使用一次后未再进行任何操作和访问。30天后这张表会()。
A)tmp_item会被自动重命名为deleted
B)tmpitem表会被自动删除掉
C)不会任何变更
D)tmpitem中的数据会被清空,表结构仍存在
答案:B
解析:
41.[单选题]数据中台定位于为各专业提供数据共享和分析应用服务,以。为基础,根据数据共享
和分析应用的需求,沉淀共性数据服务能力,通过数据服务满足各类需求,支撑前端应用和业务中
台服务构建。
A)业务中台
B)企业中台
C)全业务统一数据中心
D)物联管理平台
答案:C
解析:
42.[单选题]MapReduce对map()函数的返回值进行处理后再返回给自reduce()函数的目的是(
)。
A)减少map()函数和reduce()函数之间的数据传输
B)优化map()函数
C)优化reduce()函数
D)这一步骤并无必要
答案:A
解析:
43.[单选题]使用下面哪个命令来检查HDFS所有进程的状态()
A)jps
B)fsck
C)distcp
D)hadoop
答案:A
解析:
44.[单选题]()在训练的每一轮都要检查当前生成的基学习器是否满足基本条件。
A)支持向量机
B)Boosting算法
C)贝叶斯分类器
D)Bagging算法
答案:B
解析:
45.[单选题]下列关于聚类挖掘技术的说法中,错误的是()
A)不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B)嘈要求同类数据的内容相似度尽可能小
C)要求不同类数据的内容相似度尽可能小
D)与分类挖掘技术相似的是,都是要对数据进行分类处理
答案:B
解析:
46.[单选题]()提供的支撑技术,有效的解决了大数据分析、研发的问题,比如:虚拟化技术、
并行计算、海量存储及管理等。
A)点计算
B)云计算
C)面计算
D)线计算
答案:B
解析:
47.[单选题]下列哪一项是大数据技术领域的实施标准?
A)GoogleAPP
B)MapReduce
C)Hadoop
D)HDFS
答案:C
解析:
48.[单选题]如果想获取一个序列内最大数字会使用内置函数
A)min
B)max
C)Ien
D)for
答案:B
解析:
49.[单选题]表达式int('101',2)的值为()。
A)5
B)6
C)"10"
D)3
答案:A
解析:二进制101等于十进制5o
50.[单选题]根据《承德银行大数据贷后风险预警信号管理办法(试行)》,域外分行的黄色级信号
,辖内支行管户客户经理应在接收到系统所推送信号2个工作日内联系客户完成贷后预警信号核实工
作,限期O个工作日内制定出针对性的处置措施。
A)l
B)B.3
C)C.5
D)D.10
答案:C
解析:
51.[单选题]下面if语句统计“成绩(SCore)优秀的男生以及不及格的男生”的人数,正确的语句为。
O
A)If(gender=="男andscore=90):n+=l
B)If(gender=="男andscore=90):n+=l
C)If(gender=="男and(score=90)):n+=l
D)If(gender=="男orscore=90):n+=l
答案:C
解析:
52.[单选题]()不是神经网络的代表
A)卷积神经网络
B)递归神经网络
C)残差网络
D)XgbOoSt算法
答案:D
解析:
53.[单选题]在FUiSOnlnSightHD中,创建LOader作业的进行数据转换的正确步骤是?
A)输入设置,转换,输出
B)抽取,转换,输出
C)加载,转换,输出
D)加载,转换,抽取
答案:A
解析:
54.[单选题]()是指数据减去一个总括统计量或模型拟合值时的残余部分
A)极值
B)标准值
C)平均值
D)残值
答案:D
解析:残值在数理统计中是指实际观察值与估计值(拟合值)之间的差。
55.[单选题]()用于说明在父RDD上执行何种计算。
A)分区
B)算子
C)日志
D)数据块
答案:B
解析:
56.[单选题]在PythOn3中有六个标准的数据类型,下面哪个不属于?O
A)String(字符串)
B)Dictionary(字典)
C)Sets(集合)
D)Link(链表)
答案:D
解析:
57.[单选题]HBase的主HMaster是如何选举的?
A)由RegionServer进行裁决
B)HMaster为双主模式,不需要进行裁决
C)通过ZooKeeper进行裁决
D)随机选举
答案:C
解析:
58.[单选题]np.full_like()的作用是(一)。
A)创建形状一样但指定数值的矩阵
B)创建全1矩阵
C)创建对角矩阵
D)复制矩阵
答案:A
解析:
59.[单选题]以下哪些算法是基于规则的分类器(一)o
A)C4.5
B)KNN
OBayes
D)ANN
答案:A
解析:
60.[单选题]数据仓库的最终目的是()。
A)收集业务需求
B)建立数据仓库逻辑模型
C)开发数据仓库的应用分析
D)为用户和业务部门提供决策支持
答案:D
解析:
61.[单选题]下列关于数据科学流程与方法的描述中,错误的是()。
A)数据科学的基本流程包括数据化、数据加工(DataWrangling或DataMUnging)、数据规,整化、
探索性分析、数据分析与洞见、结果展现以及数据产品的提供
B)对于数据形态不符合要求的乱数据,要通过清洗成为规整数据
C)数据分析包括描述性分析、诊断性分析、预测性分析和规范性分析
D)数据可视,化会遇到视,觉假象问题,人眼对亮度和颜色的相对判断容易造成视觉假象
答案:B
解析:
62.[单选题IFusionInsightHD系统中,哪个方法不能查看Loader作业执行结果?
A)通过Ym任务管理查看
B)B通过LOaderUl界面查看
C)C通过manager的告警查看
D)D通过Nodemanager查看
答案:D
解析:
63.[单选题]AUC是衡量()模型优劣的一种评价指标
A)回归
B)分类
C)二分类
D)聚类
答案:c
解析:
64.[单选题]执行以下代码段defdescribe_pet(animal_type,pet_name):print("Ihavea"+
animal_type+".")print("My"+animal_type+"'snameis"+pet_name.title()+
".")describepet('harry','hamster')时,输出为()o
A)Ihaveaharry.Myharry1snameisHarry.
B)Ihaveaharry.Myharry'snameisHamster.
C)Ihaveahamster.Myhamster'snameisHamster.
D)Ihaveahamster.Myhamster'snameisHarry.
答案:B
解析:
65.[单选题]关于随机森林和AdaBOoSt说法不正确的是
A)和AdaBOOSt相比,随机森林对错误和离群点更鲁棒
B)随机森林准确率不依赖于个体分类器的实例和他们之间的依赖性
C)随机森林对每次划分所考虑的属性数很敏感
D)AdaBoOSt初始时每个训练元组被赋予相等的权重
答案:B
解析:
66.[单选题]Spark可以处理的数据任务包括()
A)数据批处理任务
B)准实时处理任务
C)图数据处理任务
D)A,B和C
答案:D
解析:
67.[单选题]()算法可以较好地避免样本的不平衡问题。
A)KNN
B)SVM
C)Bayes
D)神经网络
答案:A
解析:KNN只是取了最近的几个样本点做平均,离预测数据较远的训练数据对预测结
果不会造成影响,但是SVM,Bayes和KNN的每一个训练样本结果都会对预测结果产生影响。
68.[单选题]ADS创建普通表时,关于UPdateTyPe属性()说法是错误的。
A)合法的取值为realtime或者batch,该值不显式指定时,默认取batch
B)该值为realtime时,对应的表必须指定合法的主键并且必须指定二级分区
C)通过该属性指定数据的更新方式
D)该值为batch时,如果要支持增量导入,必须指定二级分区
答案:B
解析:
69.[单选题]对EIaStiCSearCh检索流程描述正确的是()。
A)分片节点汇总结果发送给客户端
B)检索节点汇总结果发送给客户端
C)检索节点不需要汇总结果直接把结果发送给客户端
D)分片节点不需要汇总结果直接把结果发送给客户端
答案:B
解析:
70.[单选题]关于“回归(Regression)”和"相关(COrrelatiOn)”,下列说法正确的是()。
A)回归和相关在自变量X和因变量y之间都是互为对称的
B)回归和相关在自变量X和因变量y之间都是非对称的
C)回归在自变量X和因变量y之间是非对称的,相关在自变量X和因变量y之间是互为对称的
D)回归在自变量X和因变量y之间是对称的,相关在自变量X和因变量y之间是非对称的
答案:C
解析:
71.[单选题]下列关于数据交易市场的说法错误的是()。
A)数据交易市场是大数据产业发展到一定程度的产物
B)商业化的数据交易活动催生了多方参与的第三方数据交易市场
C)数据交易市场通过生产、研发和分析数据,为数据交易提供帮助
D)数据交易市场是大数据资源化的必然产物
答案:C
解析:数据交易市场不生产数据。
72.[单选题]传统数据处理的数据规模的单位是?
A)TB
B)EB
OPB
D)GB
答案:D
解析:
73.[单选题]下列描述中不属于HDFS集群中的NameNode职责的是()。
A)维护HDFS集群的目录树结构
B)维护HDFS集群的所有数据块的分布、副本数和负载均衡
C)负责保存客户端上传的数据
D)响应客户端的所有读写数据请求
答案:C
解析:NameNode是HDFS的管理节点,DataNOde是HDFS集群的工作节点。所以用
户上传的数据是由DataNode进行保存的;NameNode负责保存用户上传的数据的元数据和维护
HDFS的抽象目录树结构,也会响应客户端的所有读写请求。
74.[单选题]对于SVM分类算法,待分样本集中的大部分样本不是支持向量,下列说法正确的是()。
A)需要将这些样本全部强制转换为支持向量
B)需要将这些样本中可以转化的样本转换为支持向量.不能转换的直接删除
C)移去或者减少这些样本对分类结果没有影响
D)以上都不对
答案:C
解析:支持向量机的一个重要性质:训练完成后,大部分的训练样本都不需保留,最终模型仅与支持向
量有关。
75.[单选题]Spark通过什么来划分不同的Stages?
A)Scheduler
B)Storage
C)RDD
D)Shuffle
答案:D
解析:
76.[单选题]Hive的查询语言HQL(HiveSQL)支持()标准,使得HQL非常类似SQL
A)SQL-90
B)SQL-91
C)SQL-92
D)SQL-93
答案:C
解析:
77.[单选题]大数据是指不用随机分析法这样的捷径,而采用()的方法。
A)所有数据
B)部分数据
C)少量数据
D)抽样数据
答案:A
解析:大数据的一种表现形式为接近其总体的"所有数据
78.[单选题]以下不属于马尔可夫随机场模型与条件随机场模型的差别的是(一)。
A)马尔可夫随机场与条件随机场都是无向图模型
B)马尔可夫随机场是生成式模型,条件随机场是判别式模型
C)马尔可夫随机场处理条件概率,条件随机场处理联合概率
D)马尔可夫随机场处理联合概率,条件随机场处理条件概率
答案:c
解析:
79.[单选题]下列哪个语句在PythOn中是非法的?
Λ)x=y=z=1
B)x=(y=z+1)
C)x,y=y,X
D)x+=y
答案:B
解析:
80.[单选题]以下图像分割方法中,属于基于图像灰度分布的阈值方法的是
A)区域合并、分裂法
B)最大类间、内方差比法
O已知形状的曲线检测
D)区域生长法
答案:B
解析:
81.[单选题]在HiVe的查询语句中,表示A按位取反正确的是()
A)#A
B)^A
C)#REF!
D)~A
答案:D
解析:
82.[单选题](__)在训练的每一轮都要检查当前生成的基学习器是否满足基本条件。
A)支持向量机
B)BOoSting算法
C)贝叶斯分类器
D)神经网络
答案:B
解析:
83.[单选题]查看kafka某TOPiC的partition详细信息时,使用如下那个命令?
A)bin/kakfa-topics.sh-create
B)bin/kakfa-topics,sh-delete
C)bin/kakfa-topics.sh-list
D)bin/kakfa-topics.sh-describe
答案:D
解析:
84.[单选题]线性模型中的权重W值可以看做各个属性X的(_)。
A)正则化系数
B)对最终决策结果的“贡献度”
C)高维映射
D)取值
答案:B
解析:
85.[单选题]HDFS默认BlockSiZe的大小是O。
A)32MB
B)64MB
C)128MB
D)256M
答案:B
解析:
86.[单选题]scipy.stats中,()表示泊松分布。
A)gamma
B)poisson
C)binom
D)uniform
答案:B
解析:poission表示泊松分布。
304
87.[单选题]下面哪个色彩空间最接近人的视觉系统的特点()。
A)RGB空间
B)CMY空间
C)CMYK空间
D)HSl空间
答案:D
解析:
88.[单选题]人工智能研究的一项基本内容是机器感知。以下列举中的。不属于机器感知的领域。
A)使机器具有视觉、听觉、触觉、味觉、嗅觉等感知能力。
B)让机器具有理解文字的能力。
C)使机器具有能够获取新知识、学习新技巧的能力。
D)使机器具有听懂人类语言的能力
答案:C
解析:
89.[单选题](_)是具有适应性的简单单元组成的广泛并行互联的网络。
A)神经系统
B)神经网络
C)神经元
D)感知机
答案:B
解析:
90.[单选题]数据清洗的方法不包括()
A)缺失值处理
B)噪声数据清除
C)一致性检查
D)重复数据记录处理
答案:D
解析:
91.[单选题]将一副图像进行分割后,分割出的区域彼此之间()重叠
A)可以
B)不可以
C)根据任务需要确定是否可以
D)根据分割方法确定是否可以
答案:B
解析:
92.[单选题]我们常见的二维码标签属于物联网架构中的哪一层?
A)感知层
B)网络层
C)处理层
D)应用层
答案:A
解析:
93.[单选题IKafkaClusterMirroring工具可以实现以下哪些功能?
A)Kafka跨集群数据同步方案
B)Kafka单集群内数据备份
OKafka但集群内数据恢复
D)以上全不正确
答案:A
解析:
94.[单选题]下列关于LSTM的说法错误的是()。
A)LSTM中存在sigmoid函数
B)LSTM中存在tanh函数
OLSTM又称长短时记忆网络
D)RNN是LSTM的变种
答案:D
解析:LSTM在RNN基础上进行了改进,能够学习到长期依赖关系,是RNN的一个变种。
95.[单选题]下面关于大数据安全问题,描述错误的是:。
A)大数据的价值并不单纯地来源于它的用途,而更多地源自其二次利用
B)对大数据的收集、处理、保存不当,会加剧数据信息泄露的风险
C)大数据成为国家之向博弈的新战场
D)大数据对于国家安全没有产生影响
答案:D
解析:
96.[单选题]处理文本数据,循环神经网络与前馈神经网络相比有()的优点。
A)不会梯度消失
B)训练结果不会发散
C)不需要激活函数
D)可以接受有序的输入序列
答案:D
解析:
97.[单选题]阅读下面程序:list_demo=[1,2,l,3]nums=set(list_demo)foriinnums:
Print(i,end="")执行的结果为()
A)1213
B)213
C)321
D)123
答案:D
解析:
98.[单选题]对分类任务来说,学习器从类别标记集合中预测出一个标记,最常见的结合策略是()
A)投票法
B)乎均法
C)学习法
D)排序法
答案:A
解析:
99.[单选题]以下语句不正确的是()
A)select*fromemp;
B)selectename,hiredate,salfromemp;
C)select*fromemporderdeptno;
D)select*fromwheredeptno=landsal<300;
答案:C
解析:
100.[单选题]将属性缩放到一个指定的最大和最小值之间,这种预处理方法的好处是(__)。
A)对于方差非常小的属性可以增强其稳定性
B)维持稀疏矩阵中为0的条目
C)便于理解
D)以上都是
答案:D
解析:
101.[单选题]如果要清空文件,需要使用的命令是(—)。
A)close()
B)seek(0)
C)truncate()
D)write('stuff')
答案:C
解析:
102.[单选题]HBase交互模式中,显示所有命名空间
A)show_namespace
B)showsnamespace
C)lists_namespace
D)listnamespace
答案:D
解析:
103.[单选题]下面关于数据产品开发相关描述正确的有(_)。
A)数据科学家的主要职责是“数据的管理”
B)数据科学家一定是科学家
C)“数据码农”可以胜任数据科学家
D)数据科学家是为解决现实世界中问题提供直接指导、依据或参考的高级专家
答案:D
解析:
104.[单选题]在SPark中,(—)是指RDD的每个分区都只被子RDD的一个分区所依赖。
A)子分区
B)父分区
C)宽依赖
D)窄依赖
答案:D
解析:
105.[单选题]下列哪个不属于k-means算法的终止条件()
A)没有(或最小数目)对象被重新分配给不同的聚类
B)没有聚类中心再发生变化
C)误差平方和局部最小
D)聚类中心聚集在一点
答案:D
解析:
106.[单选题]下面关于增强学习描述不正确的是(_)。
A)增强学习主要研究如何协助自治Agent的学习活动
B)增强学习基本思路是当Agent在环境中做出每个动作时,施教者会提供奖赏或者惩罚信息,以表示
结果状态的正确与否
C)增强学习中的Agent需要具备环境交互能力和自治能力
D)基于马尔可夫决策不属于增强学习
答案:D
解析:
107.[单选题]关于SeCOndaryNameNOde下面哪项是正确的()。
A)它是NameNOde的热备
B)它对内存没有要求
C)它的目的是帮助NameNode合并编辑日志,减少NanIeNOde启动时间
D)SecondaryNameNode应与NameNOde部署到一个节点
答案:C
解析:
108.[单选题]有如下程序:y=6z=lambdax:x*yprint(z(8))程序的输出结果是()。
A)14
B)24
048
D)64
答案:C
解析:
109.[单选题]长短时记忆神经网络被设计用来解决的问题是()
A)传统RNN存在的梯皮消失/爆炸问题
B)传统RNN计算量大的问题
C)传统RNN速度较慢的问题
D)传统RNN容易过过拟合的问题
答案:A
解析:
110∙[单选题]()在训练的每一轮都要检查当前生成的基学习器是否满足基本条件
A)支持向量机
B)BOoSting算法
C)贝叶斯分类器
D)Bagging算法
答案:B
解析:
IlL[单选题]YARN中默认的资源调度器是:()。
A)FlFO调度器
B)容量调度器
C)Fair调度器
D)以上全部是
答案:B
解析:
112.[单选题]以下哪个不是Storm的特点:()
A)可扩展性
B)可靠的消息处理
C)支持各种编程语言
D)复杂的APl
答案:D
解析:
113.[单选题]以下属于PythonWeb开发框架第三方库的是:
A)Django
B)Wheel
C)Pygame
D)WeRoBot
答案:A
解析:
114.[单选题]为数据表创建索引的目的是()
A)提高查询的检索性能
B)归类
C)创建唯一索引
D)创建主键
答案:A
解析:
115.[单选题]假负率是指()
A)正样本预剧结果数/正样本实际数
B)被预测为负的正样本结果数/正样本实际数
C)被预测为正的负样本结果数/负样本实际数
D)负样本预测结果数/负样本实际数
答案:B
解析:
116.[单选题]下列关于云数据库的描述,哪个是错误的?()
A)云数据库是部署和虚拟化在云计算环境中的数据库
B)云数据库是在云计算的大背景下发展起来的一种新兴的共享基础架构的方法
C)云数据库价格不菲,维护费用极其昂贵
D)云数据库具有高可扩展性、高可用性、采用多租形式和支持资源有发等特点
答案:C
解析:
117.[单选题]线性模型中的权重W值可以看做各个属性X的O。
A)正则化系数
B)对最终决策结果的贡献度
C)高维映射
D)取值
答案:B
解析:
118.[单选题]数据被称为信息时代的“石油”,正在成为企业的核心资产。下列说法不正确的是
OO
A)企业应更加重视大数据技术应用推广
B)企业需要培养和引进数据应用人才
C)可以未经许可任意使用其它企业的数据
D)核心数据必须通过加密备份等严密保护
答案:C
解析:
119.[单选题]下列哪一项关于极大似然估计(MLE)的说法是正确的?LMLE并不总是存在2.MLE一直
存在3.如果MLE存在,它可能不特异4.如果MLE存在,它一定是特异的
A)1和4
B)2和3
C)I和3
D)2和4
答案:C
解析:
120.[单选题]用机器代码表示的数据库模式称为()
A)物理模式
B)逻辑模式
C)源模式
D)目标模式
答案:D
解析:
121.[单选题]任何一个核函数都隐式地定义了一个()空间
A)希尔伯特空间
B)再生希尔伯特空间
C)再生按希尔伯特空间
D)欧式空间
答案:C
解析:
122.[单选题]ndarry对象的SiZe属性表示(—)。
A)数组占用空间大小
B)数组每一维度的数量
C)数组中包含的元素个数
D)数组中的最大元素值
答案:C
解析:
123.[单选题]构造了一个词表:{1.“小明”2.“喜欢”3.“踢"4.“看"5.“足球”6.“篮
球”7.“电影”},利用上述词表的索引号,文档{小明喜欢踢足球}可以用一个7维向量表示
[(—)]ŋ
A)l101001
B)l111111
OIIIIIOO
D)l110100
答案:D
解析:
124.[单选题]以下描述错误的是:
A)在终极的分析中,一切知识都是历史
B)在抽象的意义下,一切科学都是数学
C)在理性的基础上,所有的判断都是统计学
D)在数据角度上,一切决策都是随机的
答案:D
解析:
125.[单选题]不属于判别式模型的是(
A)决策树
B)BP神经网络
C)支持向量机
D)贝叶斯
答案:D
解析:
126.[单选题]Numpy是由谁开发的?
A)中国
B)美国
C)开源组织
D)日本
答案:C
解析:
127.[单选题]大数据参考架构的水平轴和垂直轴分别为()。
A)信息(活动)价值链和信息技术价值链
B)信息技术价值链和信息(活动)价值链
C)信息交互价值链和信息技术价值链
D)信息(活动)价值链和信息交互价值链
答案:A
解析:
128.[单选题]执行np.concatenated[[123][234]],[[345]]],axis=。)得到的结果是?
A)[[123][234][345]]
B)[[123345][234]]
C)[[123][234345]]
D)[[l23]L234]]
答案:A
解析:
129.[单选题]在有关数据仓库测试,下列说法不正确的是:
A)在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统
测试
B)当数据仓库的每个单独组件完成后,就需要对他们进行单元测试
C)系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试
D)在测试之前没必要制定详细的测试计划
答案:D
解析:
130.[单选题IHashShuffleMagnage是(_)之前版本的默认模式
A)Sparkl.1
B)Sparkl.2
C)Sparkl.3
D)Sparkl.4
答案:B
解析:
131.[单选题]银行进行客户购买力分析.首先获取客户历史账单,确定其中各项商品的计算权重,得
出每位客户的购买力评分并存储记录。最后将结果以图表显示。请问该过程对应于以下哪个项目数
据流程设计。
A)数据可视化->数据源->数据落地->数据处理
B)数据源->数据落地->数据处理->数据可视化
C)数据源->数据处理->数据落地->数据可视化
D)数据可视化->数据源->数据处理>数据荷地
答案:C
解析:
132.[单选题]下列哪个选项对批量数据处理组件的描述是不正确的?
A)HiVe:传统SQL批处理引擎,用于处理SQL类批处理作业,使用广泛海量数据下表现稳定,但是处理
速度较慢。
B)MaPRedUCe:传统批处理引擎,用于处理非SQL类,尤其是数据挖掘和机器学习类批处理作业,使用
广泛,海量数据下表现不稳定,但是处理速度较快。
OSparkSQL:新型SQL批处理引擎,用于处理SQL类批处理作业,适合海量数据.处理速度高效。
D)Spark:新型批处理引擎,可以用于处理非SQL类,尤其是数据挖掘和机器学习类批处理作业,适
合海量数据,处理速度高效。
答案:B
解析:
133.[单选题]下列关于计算机存储容量单位的说法中,错误的是
A)1KB<1MB<1GB
B)基本单位是字节(Byte)
C)一个汉字需要一个字节的存储空间
D)一个字节能够容纳一个英文字符
答案:C
解析:
134.[单选题]机械思维强调的是()
A)世界是确定的
B)世界是不确定的
C)世界是机械的
D)世界是智能的
答案:A
解析:
135.[单选题]根据《大数据风控平台项目操作手册》,财务智能分析中的国资委行业标准值比对模
块,通过选择O期次,用户可对企业财务报表进行切换,选择需要与国资委绩效标准值对比的财
务报表期次。
A)报表
B)B.对比企业规模
C)C.财务科目
D)D.财务指标
答案:A
解析:
136.[单选题]下列关于数据仓库随时间变化的描述不正确的是()。
A)数据仓库随时间的变化不断增加新的数据内容
B)捕捉到的新数据会覆盖原来的快照
C)数据仓库随时间变化不断删去旧的数据内容
D)数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合
答案:C
解析:一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的
查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
137.[单选题]关于Hive建表基本操作,描述正确的是
A)一旦表建好,不可再修改表名
B)一旦表建好,不可再增加新列
C)创建外部表时需要制定external关键字
D)一旦表创建好,不可再修改列名
答案:C
解析:
138.[单选题]Python标示注释使用符号是以下哪个?
A)@
B)&
C)#
D)0
答案:C
解析:
139.[单选题](_)是将数据转换为产品的艺术。
A)数据柔术
B)数据处理
C)数据加工
D)数据设计
答案:A
解析:
140.[单选题]()操作属于预剪枝
A)信息增益
B)计算最好的特征切分点
C)巳限制树模型的深度
D)可视,化树模型
答案:C
解析:
141.[单选题]下列关于MaP/Reduce并行计算模型叙述正确的一项为O0
A)MaP/Reduce把待处理的数据集分割成许多大的数据块
B)大数据块经MaP()函数并行处理后输出新的中间结果
C)reduce()函数把多任务处理后的中间结果进行汇总
D)reduce阶段的作用接受来自输出列表的迭代器
答案:C
解析:
142.[单选题]在HadOoP生态系统中,()可以将结构化的数据文件映射成一张数据库表,并提供简单的
查询语言。
A)Pig
B)HBase
OHive
D)MapReduce
答案:C
解析:在HadoOP生态系统中,Hive可以将结构化的数据文件映射成一张数据库表,并提供简单的查询语
143.[单选题](„)是交叉验证法的一种特例。
A)自助法
B)留一法
C)交叉验证法
D)错误率分析
答案:B
解析:
144.[单选题]根据《大数据风控平台项目操作手册》,系统在【客户信息管理】一级菜单下增加【
征信报告查询管理】二级菜单,用户可在此菜单下的O节点查看征信报告。
A)待处理的征信报告
B)B.审批中的征信报告
OC.审批批准
D)D.审批否决
答案:C
解析:
145.[单选题]()认为,大数据时代的数据管理目标不一定理想和完美,一致性、可用性和分区容
错性中的任何两个特征的保证(争取)可能导致另一个特征的损失(放弃)。
A)CAP理论
B)BASE原则
C)数据一致性理论
D)大数据法则
答案:A
解析:
146.[单选题]假如使用一个较复杂的回归模型来拟合样本数据,使用Ridge回归,调试正则化参数
入,来降低模型复杂度若入较大时,关于偏差(bias)和方差(VarianCe),下列说法正确的是()
A)若λ较大时,偏差减小,方差减小
B)若λ较大时,偏差减小,方差增大
C)若λ较太时,偏差增大,方差减小
D)若人较大时,偏差增大,方差增大
答案:C
解析:
147.[单选题]下列关于关键词提取的说法错误的是()。
A)关键词提取是指借用自然语言处理方法提取文章关键词
B)TF-IDF模型是关键词提取的经典方法
C)文本中出现次数最多的词最能代表文本的主题
D)这个问题涉及数据挖掘、文本处理、信息检索等领域
答案:C
解析:只依靠文本中出现次数即词频所得到的关键词有很大的不确定性,对于长度比较长的文本,这
个方法会有很大的噪声,虽然它在文本中出现的次数最多,但它很可能在语料库中出现的次数也很
高,所以单凭文本中出现次数最多这一个特性并不能准确的代表文本的主题,所以C错误,选Co
148.[单选题]HDFS采用了什么模型?
A)分层模型
B)主从结构模型
C)管道-过滤器模型
D)点对点模型
答案:B
解析:
149.[单选题]大数据的本质是()。
A)洞察
B)采集
C)统计
D)联系
答案:A
解析:
150.[单选题]我行《大数据应用推动考核办法》从O开始实施。
A)20170101
B)20170801
020180101
D)20180801
答案:D
解析:
151.[单选题]HBase来源于哪一项?O
A)TheGoogleFileSystem
B)MapReduce
OBigTable
D)Chubby
答案:C
解析:
152.[单选题]()指从“数据视角”提出问题、在“数据层次”上分析问题、”以数据为中心”解
决问题,以及将“数据”当作决策制定的决定因素,提高决策制定的信度与效度。
A)、模型驱动型决策支持
B)、数据驱动型决策支持
C)、任务驱动型决策支持
D)、算法驱动型决策支持
答案:B
解析:
153.[单选题]()模式的变化意味着数据科学中所关注的数据计算的常见瓶颈、关注焦点、主要
矛盾和思维模式发生了根本性变化。
A)数据计算
B)、数据管理
C)、数据分析
D)、数据获取
答案:A
解析:
154.[单选题]Hive查看数据库命令是()
A)looktable;
B)showtable;
C)lookdatabases;
D)showdatabases;
答案:D
解析:
155.[单选题]以下不属于数据治理工作的主要内容的有(_)。
A)理解自己的数据
B)数据部门的建立
C)有效监督与动态优化
D)岗位工资的定义
答案:D
解析:
156.[单选题]对于HBaSeKeyVaIUe存储模型描述不正确的是?
A)同一个Key值只能关联个value
B)拥有时间戳类型等关键信息
C)KeyValUe具有特定的格式
D)时间戳来区分多个记录版本
答案:A
解析:
157.[单选题IMaxCompute表中的列,不支持()数据类型。
A)Bigint
B)Double
OBoolean
D)Varchar
答案:D
解析:
158.[单选题]下列基本活动中不属于数据产品开发工作之中需要特别注意的是()。
A)创造性设计
B)数据洞见
C)虚拟化
D)个性化描述
答案:D
解析:数据产品开发工作之中需要注意有创造性设计、数据洞见、虚拟化等基本活动。
159.[单选题]商品的()用于在搜索和浏览列表时更准确的找到该商品。-
A)关键词
B)描述
C)提示
D)详情
答案:A
解析:
160.[单选题]对arr=np.arange(9).reshape(3,3),反转二维数组arr的行进行的操作是
()O
A)arrL::-1]
B)arr[::-2]
C)arr[::1]
D)arr[::0]
答案:A
解析:使用arr[::-1]进行反转,当只有一个参数代表索引行,若反转列应使用
ArrL:,::-11o
161.[单选题]int('12',16)的结果是(—)。
A)10
B)12
016
D)18
答案:D
解析:
162.[单选题]关于虚拟私有云(VPe)描述不对的是()
A)VPC支持专线接入
B)VPC的多个子网可以创建在同一Region内的不同AZ中
C)可以通过安全组实现不同VPC之间的云主机互通
D)每个用户可以创建多个VPC及子网
答案:C
解析:
163.[单选题]在下列算法中,对于缺失值敏感的模型为(—)。
A)随机森林
B)逻辑回归
C)C5.0
D)朴素贝叶斯
答案:B
解析:
164.[单选题]ZooKeePer的特点描述错误的是()。
A)复杂性
B)自我复制
C)顺序访问
D)高速读取
答案:A
解析:ZooKeePer的设计目标和特点包括简单性、自我复制、顺序访问和高速读取。
165.[单选题]()采用概率模型来表达聚类原型。
A)K均值算法
B)学习向量量化
C)高斯混合聚类
D)密度聚类
答案:C
解析:
166.[单选题]下面组件哪个是数据挖掘库:O
A)Zookeeper
B)Mahout
OMySQL
D)HBase
答案:B
解析:
167.[单选题]以下哪项属于FIUme的基本数据单位?
A)Object
B)Subject
C)Topic
D)Event
答案:D
解析:
168.[单选题]数据库利用()进行死锁检测。
A)DAG
B)RPC
OWFG
D)DLC
答案:C
解析:
169.[单选题]在实验集群的master节点使用jps命令查看进程时,终端出现以下哪项能说明
Hadoop主节点启动成功?()
A)Namenode,Datanode,TaskTracker
B)Namenode,Datanode,SecondaryNameNode
C)Namenode,Datanode,HMaster
D)Namenode,JobTracker,SecondaryNameNode
答案:D
解析:
170.[单选题]matplotIib中的Iegend函数作用是什么()
A)设置标签文本
B)绘制网格线
C)标示不同图形的文本标签图例
D)设置X轴的数值显示范围
答案:C
解析:
171.[单选题]下列关于气泡图的说法中,错误的是()
A)气泡图中气泡的颜色是系统统一设置的,无法人为调整
B)气泡大小的不同意味着所代表的的数值的不同
C)气泡图中的图形形状不一定是圆形
D)可以为每个气泡打上标签使其展示的数值更加直观化
答案:A
解析:
172.[单选题]在MaPRedUCe中,下面哪个数据流的顺序是正确的O
A)InputFormat
B)Mapper
C)Combiner
D)Reducer
答案:A
解析:
173.[单选题]一切皆可连,任何数据之间逻辑上都有可能存在联系,这体现了大数据思维维度中的(
)。
A)定量思维
B)相关思维
C)因果思维
D)检验思维
答案:B
解析:《我们的大数据时代》一切皆可连,任何数据之间逻辑上都有可能存在联系,这体现了大数据思
维维度中的相关思维。
174.[单选题]下列论据中,体现“冷眼”看大数据的观点是()
A)互联网金融打破了传统的观念和行为
B)大数据医疗正在走进平民百姓
C)数据资产型企业前景光明
D)个人隐私泄露与信息安全担忧
答案:D
解析:
175.[单选题]下列关于Numpy的简单介绍不正确的是()。
A)Numpy(NumericalPython)是Python语言的一个扩展程序库
B)支持大量的维度数组与矩阵运算
C)针对数组运算提供大量的数学函数库
D)Numpy不开放源代码
答案:D
解析:NUmPy是开源代码库。
278
176.[单选题]下面算法中属于图像锐化处理的是:Oo
A)低通滤波
B)加权平均法
C)高通滤波
D)中值滤波
答案:C
解析:
177.[单选题]当需要将一个数组改变形状时,应使用numPy的哪个属性?
A)shape()
B)reshape()
C)arrange()
D)array()
答案:B
解析:
178.[单选题]哪个产品适应于OLAP场景?
A)PostgressQL
B)SQLServero
OMysQL
D)GaussDB200
答案:D
解析:
179.[单选题]从网络的原理上来看,结构最复杂的神经网络是()。
A)卷积神经网络
B)长短时记忆神经网络
OGRU
D)BP神经网络
答案:B
解析:
180.[单选题]以下关于HDFS适合做什么描述正确的是
A)低延迟读取
B)大文件存储
C)大量小文件存储
D)随机写入
答案:B
解析:
181.[单选题]下列不属于HiVe记录中默认分隔符()
A)∖n
B)^A
C)^B
D)∖r∖n
答案:D
解析:
182.[单选题]()是Spark中的抽象数据模型。
A)RDD
B)Scheduler
C)Storage
D)Shuffle
答案:A
解析:RDD(ReSilientDiStribUtedDataSet)是Spark的抽象数据模型。Scheduler,Storage和
Shufle是Spark的关键技术。
183.[单选题]下面与HDFS类似的框架是O?
Λ)NTFS
B)FAT32
OGFS
D)EXT3
答案:C
解析:
184.[单选题]Hadoop的作者是下面哪一位()。
A)MartinFowler
B)Dougcutting
C)KentBeck
D)GraceHopper
答案:B
解析:
185.[单选题]最早被提出的循环神经网络门控算法是什么
A)长短期记忆网络
B)门控循环单元网络
C)堆叠循环神经网络
D)双向循环神经网络
答案:A
解析:
186.[单选题]多分类学习中,最经典的三种拆分策略不包括()。
A)一对一
B)一对其余
C)一对多
D)多对多
答案:A
解析:多分类学习中,最经典的三种拆分策略包括一对多、多对多、一对其余。
187.[单选题]在MaXCOmPUteSQL中,用于执行显示类型转换的函数是:()。
A)CAST
B)CONCAT
c)τo
D)LIKE
答案:A
解析:
188.[单选题]以下关于HDFS适合做什么描述不正确的是?
A)流式数据读取
B)大文件存储与访问
C)大数据量吞吐
D)低延迟读取
答案:D
解析:
189.[单选题]求以下程序结果正确的是()L=CGoogle','Python','Taobao')print(L[-2])
print(L[l:])
A)Python',('Python','Taobao')
B)Google',CPython','Taobao')
C)Google''Python,
D),Taobao''Python,
答案:A
解析:
190∙[单选题]SELECT语句的完整语法较复杂,但至少包括的部分是()
A)仅SELECT
B)SELECT,FROM
C)SELECT,GROUP
D)SELECT,INTO
答案:B
解析:
191.[单选题]python中,while的中止的关键字是O
A)continue
B)broken
C)break
D)plug
答案:C
解析:
192.[单选题]基于大数据的谷歌广告体现的大数据思维方式是()
A)全样而非抽样
B)效率而非精确
C)相关而非因果
D)以数据为中心
答案:D
解析:
193.[单选题]下列关于数据重组的说法中,错误的是()。
A)数据重组是数据的重新生产和重新采集
B)数据重组能够使数据焕发新的光芒
C)数据重纽实现的关键在于多源数据融合和数据集成
D)数据重组有利于实现新颖的数据模式创新
答案:A
解析:
194.[单选题]如果PythOn程序中包括零运算,解释器将在运行时抛出()错误信息。O
A)NameError
B)FiIeNotFoundError
C)SyntaxError
D)ZeroDivisionError
答案:D
解析:
195.[单选题]在Hadoo
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版屋面防水工程承包合同(含屋顶绿化植物养护服务)3篇
- 2025版外贸信用保险合同范本英文版3篇
- 《我的家乡》课件
- 2025年度美容院美容院员工福利保障合同4篇
- 2025年个人房产抵押合同修订版
- 二零二五年度铁路施工挖机作业安全与保障合同3篇
- 二零二五版绿色环保民房物业管理合同4篇
- 2025版宅基地买卖转让合同含农村土地整治及补偿协议3篇
- 二零二五版幕墙工程节能评估与认证合同4篇
- 孤残儿童关爱意识提升策略研究与实践考核试卷
- 消防产品目录(2025年修订本)
- 地方性分异规律下的植被演替课件高三地理二轮专题复习
- 光伏项目风险控制与安全方案
- 9.2提高防护能力教学设计 2024-2025学年统编版道德与法治七年级上册
- 催收培训制度
- 练习20连加连减
- 五四制青岛版数学五年级上册期末测试题及答案(共3套)
- 商法题库(含答案)
- 钢结构用高强度大六角头螺栓连接副 编制说明
- 沟通与谈判PPT完整全套教学课件
- 移动商务内容运营(吴洪贵)项目四 移动商务运营内容的传播
评论
0/150
提交评论