![大数据开发基础练习题及答案5-2023练习版_第1页](http://file4.renrendoc.com/view10/M00/1D/3B/wKhkGWXuOaCAE2S1AAIlk9qyWZA886.jpg)
![大数据开发基础练习题及答案5-2023练习版_第2页](http://file4.renrendoc.com/view10/M00/1D/3B/wKhkGWXuOaCAE2S1AAIlk9qyWZA8862.jpg)
![大数据开发基础练习题及答案5-2023练习版_第3页](http://file4.renrendoc.com/view10/M00/1D/3B/wKhkGWXuOaCAE2S1AAIlk9qyWZA8863.jpg)
![大数据开发基础练习题及答案5-2023练习版_第4页](http://file4.renrendoc.com/view10/M00/1D/3B/wKhkGWXuOaCAE2S1AAIlk9qyWZA8864.jpg)
![大数据开发基础练习题及答案5-2023练习版_第5页](http://file4.renrendoc.com/view10/M00/1D/3B/wKhkGWXuOaCAE2S1AAIlk9qyWZA8865.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试题说明
本套试题共包括1套试卷
答案和解析在每套试卷后
大数据开发基础练习题及答案5(500题)
大数据开发基础练习题及答案5
L[单选题]HDFS有一个gzip文件大小75MB,客户端设置BloCk大小为64MB。当运行Hiapreduce任务读
取该文件时inputSPIit大小为?
A)64MB
B)75MB
C)一个map读取64MB,另夕I—个map读取IIMB
2.[单选题]从已知事实出发,通过规则库求得结论的产生式系统的推理方式是()
A)正向推理
B)反向推理
C)双向推理
3.[单选题]MapReduce框架提供了一种序列化机制,支持这种序列化的类能够在MaP和RedUCe过程中
充当键或值,以下说法错误的是?
A)实现WritabIe接口的类是值
B)实现WritableCOmParabIe接口的类可以是值或键
C)Hadoop的基本类型TeXt并不实现WritableComparabIe接口
D)键和值的数据类型可以超出HadooP自身支持的基本类型
4.[单选题]以下哪一项属于非结构化数据。
A)企业ERP数据
B)财务系统数据
C)视频监控数据
D)日志数据
5.[单选题]下列哪个HDFS命令可用于检测数据块的完整性
A)hdfsfsck/
B)hdfsfsck/-delete
C)hdfsdfsadmin-report
D)hdfsbalancer-thresheld1
6.[单选题]以下代码的执行结果a,b,c分别是Oa=[[]]*5a[0].append(1)b=[[]foriin
range(5)]b[0].append(1)c=L[]*5]c[0].append(1)
A)a:[[1],[],[],[],[]]b:[[1],[1],[1],[1],[l]]c:[[1]]
B)a:[[1],[1],[1],[1LEl]]b:[[1],□,[],□,[]]c:[[1]]
C)a:[[1],□,□,□,[]]b:[[1],[1],[1],[1],[l]]c:[[1],
D)a:LEU,□,[],[],[]]b:[[U,[1L[ι].[1L[ι]]c:[[ι],[1L[U,LiL[ι]]
7.[单选题]假设我们有由三次多项式回归产生的数据(三次多项式完美契合数据),下列说法哪些
是对的?L简单线性回归有高偏差和低方差2.简单线性回归有低偏差和高方差3.三次多项式有低偏
差和高方差4.三次多项式有低偏差和低方差
A)1和4
B)I和3
C)2和3
D)2和4
8.[单选题]在MySQL中,建立数据库用()
A)CREATETABLE命令
B)CREATETRlGGER命令
OCREATEINDEX命令
D)CREATEDATABASE命令
9.[单选题]()是指给目标用户产生的错误或不准确的视觉感知,而这种感知与数据可视化者的意图或
数据本身的真实情况不一致。
A)视觉假象
B)视觉认知
C)视觉感知
D)数据可视
10.[单选题]下列对于错误率的公式,解释正确的是(_)。
A)统计分类器预测出来的结果与真实结果不相同的个数,然后除以总的样例集D的个数。
B)先统计分类正确的样本数,然后除以总的样例集D的个数。
C)预测为正的样例中有多少是真正的正样例
D)样本中的正例有多少被预测正确
11.[单选题]Redis中哪个命令是查看键的剩余生存时间?
A)ttl
B)expireat
Opersist
D)expire
12.[单选题]SQL语法中内部关联的关键字是()
A)INNERJOIN
B)LEFTJOIN
C)FULLJOIN
D)CROSSJOIN
13.[单选题]下面描述错误是:()
A)“探针盒子”就是一款自动收集用户隐私的产品
B)许多顾客在使用WiFi之后会收到大量的广告信息,甚至自己的手机号码也会被当做信息进行多次
买卖
C)在免费上网的背后,其实也存在着不小的信息安全风险,或许8一不小心,就落入了电脑黑客们
设计的WiFi陷阱之中
D)免费町Fl都是安全的,可以放心使用
14.[单选题]HDFS默认的当前工作目录是/user/$USER,fs.default,name的值需要在()配置文件内
说明。
A)mapred-site.xml
B)core-site,xml
C)hdfs-site.xml
D)以上均不是
15.[单选题]大数据不是要教机器像人一样思考,相反,它是
A)把数学算法运用到海量的数据上来预测事情发生的可能性
B)被视为人工智能的一部分
C)被视为一种机器学习
D)预测与惩罚
16.[单选题]scipy.stats()函数不能求()。
A)均值
B)方差
C)峰度
D)众数
17.[单选题]DataX是阿里集团发起的开源项目,是一种离线数据同步的工具,支持多种异构数据源
之间的高效数据同步,DataX任务配置文件使用()。
A)xml
B)java
Obson
D)json
18.[单选题]大数据平台Hadoop的组件中,提供分布式协作服务的组件是()
A)HBase
B)ZooKeeper
C)Sqoop
D)Hive
19.[单选题]()是交叉验证法的一种特例
A)自助法
B)留一法
C)交叉验证法
D)错误率分析
20.[单选题[StructuredStreaming不支持以下哪种计算时间?
A)处理时间
B)事件时间
C)结束时间
D)注入时间
21.[单选题]hadoop中什么类提供了连接到HDFS系统并执行文件操作的基本功能()
Λ)FSDirectory
B)DFSClient
C)ClientProtocol
D)FSInputStream
22.[单选题]对数组中的某个元素进行修改时,计算机对其的操作是(_)。
A)复制该数组后再修改
B)直接在原数组中修改
C)修改该数组后再复制
D)删除该数组后,重新创建
23.[单选题]下列关于数据整合和分组的说法不正确的是()。
A)数据连接可以用concat或merge函数
B)axis=l表示轴向连接
C)数据分组可以使用mean函数
D)使用agg可以自定义多个聚合函数
24.[单选题]以下选项不包含在DIKW金字塔中的是0。
A)信息
B)数值
C)知识
D)智慧
25.[单选题]()不是长短时记忆神经网络兰个门中的一个门
A)输入门
B)输出门
C)遗忘门
D)进化门
26.[单选题]规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指
的是OO
A)大数据
B)贫数据
C)富数据
D)繁数据
27.[单选题]大数据计算服务(MaxCompute,原ODPS)中的角色(Role)是一组访问权限的集合。
当需要读一组用户赋予相同的权限时,可以使用角色来授权。基于角色的授权可以大大简化授权流
程,降低授权管理成本,当需要对用户授权时,应当优先考虑是否应该使用角色来完成。关于角色
的说法中正确的是:()。
A)可以将OWner视为一个角色,赋给其他用户
B)Admin是项目空间自动创建的角色,可以为该角色添加权限
C)删除一个角色时,会先检查该角色内是否还存在其他用户。若存在,则删除该角色失败
D)创建完角色后,需要给角色添加权限,仅支持以AeL授权的方式添加
28.[单选题]将内存引用赋值给另一个变量的操作叫(_)。
A)深拷贝
B)指针
C)参数实例化
D)浅拷贝
29.[单选题]安装FusionInsightHD的Streaming组件是,Nimbus角色要求安装几个节点?
A)4
B)3
02
D)l
30.[单选题]以下对VOIUme相关描述不正确的是(__)。
A)VoIUme是指数据量大
B)就目前而言,当数据量达到拍字节以上时,一般称为大数据
C)大数据时间分布是均匀的
D)数据量大是相对计算与存储能力而定的
31.[单选题]关于OLAP和01:凹的区别描述,不正确的是()。
A)OLP主要是关于如何理解聚集的大量不同的数据,它与OTP应用程序不同
B)咱与OLP应用程序不同,OLTP应用程序包含大量相对简单的事务
OOLP的特点在于事务量大,但事务内容比较简单且重复率高
D)OLP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面
对的用户是相同的
32.[单选题]在PythOn中,下面哪些对列表的描述是错误的?。
A)列表中的一项叫做元素。
B)列表被创建后,还可以修改其中的元素。
C)索引被用于标识某个元素在列表中的位置,列表的索引从O开始
D)列表是一系列元素组成的序列,在一个列表中,元素的类型必须相同。
33.[单选题]大数据时代()
A)不允许不精确的数据
B)允许不精确的数据
C)为精确可以牺牲效率
D)只要因果数据
34.[单选题]下列关于在回归分析中解释变量与非解释变量的说法正确的是()。
A)解释变量和被解释变量都是随机变量
B)解释变量为非随机变量,被解释变量为随机变量
C)解释变量和被解释变量都为非随机变量
D)解释变量为随机变量,被解释变量为非随机变量
35.[单选题]关系型数据库最多可以创建()个只读实例
A)5
B)4
03
D)2
36.[单选题]下列叙述正确的是()。
A)continue语句的作用是结束整个循环的执行
B)只能在循环体内使用break语句
C)在循环体内使用break语句或continue语句的作用相同
D)从多层循环嵌套中退出时,只能使用goto语句
252
37.[单选题]未来二十年就是()为王的时代。
A)文化
B)工业
C)数据
D)农业
38.[单选题]执行以下代码段defdescribe_pet(animal_type,pet_name):print("Ihavea"+
animal_type+".")print("My"+animal_type+"'snameis"+pet_name.title()+
1
".")describepet(petname='harry,animaltype='hamster')时,输出为()o
A)Ihaveaharry.Myharry1snameisHarry.
B)Ihaveaharry.Myharry'snameisHamster.
C)Ihaveahamster.Myhamster'snameisHamster.
D)Ihaveahamster.Myhamster'snameisHarry.
39.[单选题]S市A,B共有两个区,人口比例为3:5,据历史统计A的犯罪率为0.01%,B区为
0.015%,现有一起新案件发生在S市,那么案件发生在A区的可能性有多大?(—)
A)0.375
B)0.268
O0.286
D)0.261
40.[单选题]大数据计算服务中,临时数据表tmp_item是一张非分区表,开发人员在建表时指定了
IifeCyCle属性为30,且使用一次后未再进行任何操作和访问。30天后这张表会()。
A)tmp_item会被自动重命名为deleted
B)tɪnpitem表会被自动删除掉
C)不会任何变更
D)tmp_item中的数据会被清空,表结构仍存在
41.[单选题]数据中台定位于为各专业提供数据共享和分析应用服务,以()为基础,根据数据共享
和分析应用的需求,沉淀共性数据服务能力,通过数据服务满足各类需求,支撑前端应用和业务中
台服务构建。
A)业务中台
B)企业中台
C)全业务统一数据中心
D)物联管理平台
42.[单选题]MapReduce对map()函数的返回值进行处理后再返回给自reduce()函数的目的是(
)。
A)减少map()函数和reduce()函数之间的数据传输
B)优化map()函数
C)优化reduce()函数
D)这一步骤并无必要
43.[单选题]使用下面哪个命令来检查HDFS所有进程的状态。
A)jps
B)fsck
C)distcp
D)hadoop
44.[单选题]()在训练的每一轮都要检查当前生成的基学习器是否满足基本条件。
A)支持向量机
B)Boosting算法
C)贝叶斯分类器
D)Bagging算法
45.[单选题]下列关于聚类挖掘技术的说法中,错误的是()
A)不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B)嘈要求同类数据的内容相似度尽可能小
C)要求不同类数据的内容相似度尽可能小
D)与分类挖掘技术相似的是,都是要对数据进行分类处理
46.[单选题]()提供的支撑技术,有效的解决了大数据分析、研发的问题,比如:虚拟化技术、
并行计算、海量存储及管理等。
A)点计算
B)云计算
C)面计算
D)线计算
47.[单选题]下列哪一项是大数据技术领域的实施标准?
A)GoogleAPP
B)MapReduce
C)Hadoop
D)HDFS
48.[单选题]如果想获取一个序列内最大数字会使用内置函数
ʌ)min
B)max
C)Ien
D)for
49.[单选题]表达式intClOl',2)的值为()。
A)5
B)6
C)"10"
D)3
50.[单选题]根据《承德银行大数据贷后风险预警信号管理办法(试行)》,域外分行的黄色级信号
,辖内支行管户客户经理应在接收到系统所推送信号2个工作日内联系客户完成贷后预警信号核实工
作,限期O个工作日内制定出针对性的处置措施。
A)l
B)B.3
C)C.5
D)D.10
51.[单选题]下面if语句统计“成绩(SCore)优秀的男生以及不及格的男生”的人数,正确的语句为。
O
A)If(gender=="男"andscore=90):n+=l
B)If(gender==,,男"andscore=90):n+=l
C)If(gender=="男"and(score=90)):n+=l
D)If(gender=="男"orscore=90):n+=l
52.[单选题]()不是神经网络的代表
A)卷积神经网络
B)递归神经网络
C)残差网络
D)XgbOOSt算法
53.[单选题]在FUiSonlnSightHD中,创建Loader作业的进行数据转换的正确步骤是?
A)输入设置,转换,输出
B)抽取,转换,输出
C)加载,转换,输出
D)加载,转换,抽取
54.[单选题]()是指数据减去一个总括统计量或模型拟合值时的残余部分
A)极值
B)标准值
C)平均值
D)残值
55.[单选题]()用于说明在父RDD上执行何种计算。
A)分区
B)算子
0日志
D)数据块
56.[单选题]在PythOn3中有六个标准的数据类型,下面哪个不属于?O
A)String(字符串)
B)Dictionary(字典)
C)Sets(集合)
D)Link(链表)
57.[单选题]HBase的主HMaster是如何选举的?
A)由RegionServer进行裁决
B)HMaster为双主模式,不需要进行裁决
C)通过ZooKeeper进行裁决
D)随机选举
58.[单选题]np.full_like()的作用是(一)。
A)创建形状一样但指定数值的矩阵
B)创建全1矩阵
C)创建对角矩阵
D)复制矩阵
59.[单选题]以下哪些算法是基于规则的分类器(一)o
A)C4.5
B)KNN
OBayes
D)ANN
60.[单选题]数据仓库的最终目的是()。
A)收集业务需求
B)建立数据仓库逻辑模型
C)开发数据仓库的应用分析
D)为用户和业务部门提供决策支持
61.[单选题]下列关于数据科学流程与方法的描述中,错误的是()。
A)数据科学的基本流程包括数据化、数据加工(DataWrangIing或DataMUnging)、数据规,整化、
探索性分析、数据分析与洞见、结果展现以及数据产品的提供
B)对于数据形态不符合要求的乱数据,要通过清洗成为规整数据
C)数据分析包括描述性分析、诊断性分析、预测性分析和规范性分析
D)数据可视,化会遇到视,觉假象问题,人眼对亮度和颜色的相对判断容易造成视觉假象
62.[单选题IFusionInsightHD系统中,哪个方法不能查看LOader作业执行结果?
A)通过Ym任务管理查看
B)B通过LOaderUl界面查看
C)C通过manager的告警查看
D)D通过Nodemanager查看
63.[单选题]AUC是衡量()模型优劣的一种评价指标
A)回归
B)分类
C)二分类
D)聚类
64.[单选题]执行以下代码段defdescribe_pet(animal_type,pet_name):print("Ihavea"+
animal_type+".")print("My"+animal_type+"'snameis"+pet_name.title()+
".")describepet('harry','hamster')时,输出为()o
A)Ihaveaharry.Myharry1snameisHarry.
B)Ihaveaharry.Myharry'snameisHamster.
C)Ihaveahamster.Myhamster'snameisHamster.
D)Ihaveahamster.Myhamster'snameisHarry.
65.[单选题]关于随机森林和AdaBOoSt说法不正确的是
A)和AdaBOOSt相比,随机森林对错误和离群点更鲁棒
B)随机森林准确率不依赖于个体分类器的实例和他们之间的依赖性
C)随机森林对每次划分所考虑的属性数很敏感
D)AdaBoOSt初始时每个训练元组被赋予相等的权重
66.[单选题]Spark可以处理的数据任务包括0
A)数据批处理任务
B)准实时处理任务
C)图数据处理任务
D)A,B和C
67.[单选题]()算法可以较好地避免样本的不平衡问题。
A)KNN
B)SVM
C)Bayes
D)神经网络
68.[单选题]ADS创建普通表时,关于UPdateTyPe属性()说法是错误的。
A)合法的取值为realtime或者batch,该值不显式指定时,默认取batch
B)该值为realtime时,对应的表必须指定合法的主键并且必须指定二级分区
C)通过该属性指定数据的更新方式
D)该值为batch时,如果要支持增量导入,必须指定二级分区
69.[单选题]对EIaStiCSearCh检索流程描述正确的是()。
A)分片节点汇总结果发送给客户端
B)检索节点汇总结果发送给客户端
C)检索节点不需要汇总结果直接把结果发送给客户端
D)分片节点不需要汇总结果直接把结果发送给客户端
70.[单选题]关于“回归(Regression)”和“相关(COrreIatiOn)”,下列说法正确的是()。
A)回归和相关在自变量X和因变量y之间都是互为对称的
B)回归和相关在自变量X和因变量y之间都是非对称的
C)回归在自变量X和因变量y之间是非对称的,相关在自变量X和因变量y之间是互为对称的
D)回归在自变量X和因变量y之间是对称的,相关在自变量X和因变量y之间是非对称的
71.[单选题]下列关于数据交易市场的说法错误的是()。
A)数据交易市场是大数据产业发展到一定程度的产物
B)商业化的数据交易活动催生了多方参与的第三方数据交易市场
C)数据交易市场通过生产、研发和分析数据,为数据交易提供帮助
D)数据交易市场是大数据资源化的必然产物
72.[单选题]传统数据处理的数据规模的单位是?
A)TB
B)EB
C)PB
D)GB
73.[单选题]下列描述中不属于HDFS集群中的NameNode职责的是()。
A)维护HDFS集群的目录树结构
B)维护HDFS集群的所有数据块的分布、副本数和负载均衡
C)负责保存客户端上传的数据
D)响应客户端的所有读写数据请求
74.[单选题]对于SVM分类算法,待分样本集中的大部分样本不是支持向量,下列说法正确的是()。
A)需要将这些样本全部强制转换为支持向量
B)需要将这些样本中可以转化的样本转换为支持向量.不能转换的直接删除
C)移去或者减少这些样本对分类结果没有影响
D)以上都不对
75.[单选题]Spark通过什么来划分不同的Stages?
A)Scheduler
B)Storage
C)RDD
D)Shuffle
76.[单选题]Hive的查询语言HQL(HiveSQL)支持()标准,使得HQL非常类似SQL
A)SQL-90
B)SQL-91
C)SQL-92
D)SQL-93
77.[单选题]大数据是指不用随机分析法这样的捷径,而采用()的方法。
A)所有数据
B)部分数据
C)少量数据
D)抽样数据
78.[单选题]以下不属于马尔可夫随机场模型与条件随机场模型的差别的是(一)。
A)马尔可夫随机场与条件随机场都是无向图模型
B)马尔可夫随机场是生成式模型,条件随机场是判别式模型
C)马尔可夫随机场处理条件概率,条件随机场处理联合概率
D)马尔可夫随机场处理联合概率,条件随机场处理条件概率
79.[单选题]下列哪个语句在PythOn中是非法的?
A)x=y=z=1
B)x=(y=z+1)
C)x,y=y,X
D)x+=y
80.[单选题]以下图像分割方法中,属于基于图像灰度分布的阈值方法的是
A)区域合并、分裂法
B)最大类间、内方差比法
C)已知形状的曲线检测
D)区域生长法
81.[单选题]在HiVe的查询语句中,表示A按位取反正确的是()
A)#A
B)^A
C)#REF!
D)~A
82.[单选题](_)在训练的每一轮都要检查当前生成的基学习器是否满足基本条件。
A)支持向量机
B)BOOSting算法
C)贝叶斯分类器
D)神经网络
83.[单选题]查看kafka某TOPiC的partition详细信息时,使用如下那个命令?
A)bin/kakfa-topics.sh-create
B)bin/kakfa-topics,sh-delete
C)bin/kakfa-topics.sh-list
D)bin/kakfa-topics.sh-describe
84.[单选题]线性模型中的权重W值可以看做各个属性X的(_)。
A)正则化系数
B)对最终决策结果的“贡献度”
C)高维映射
D)取值
85.[单选题]HDFS默认BlockSiZe的大小是Oo
A)32MB
B)64MB
C)128MB
D)256M
86.[单选题]scipy.stats中,()表示泊松分布。
A)gamma
B)poisson
C)binom
D)uniform
87.[单选题]下面哪个色彩空间最接近人的视觉系统的特点()。
A)RGB空间
B)CMY空间
C)CMYK空间
D)HSl空间
88.[单选题]人工智能研究的一项基本内容是机器感知。以下列举中的()不属于机器感知的领域。
A)使机器具有视觉、听觉、触觉、味觉、嗅觉等感知能力。
B)让机器具有理解文字的能力。
C)使机器具有能够获取新知识、学习新技巧的能力。
D)使机器具有听懂人类语言的能力
89.[单选题](_)是具有适应性的简单单元组成的广泛并行互联的网络。
A)神经系统
B)神经网络
C)神经元
D)感知机
90.[单选题]数据清洗的方法不包括()
A)缺失值处理
B)噪声数据清除
C)一致性检查
D)重复数据记录处理
91.[单选题]将一副图像进行分割后,分割出的区域彼此之间()重叠
A)可以
B)不可以
C)根据任务需要确定是否可以
D)根据分割方法确定是否可以
92.[单选题]我们常见的二维码标签属于物联网架构中的哪一层?
A)感知层
B)网络层
C)处理层
D)应用层
93.[单选题IKafkaClusterMirroring工具可以实现以下哪些功能?
A)Kafka跨集群数据同步方案
B)Kafka单集群内数据备份
OKafka但集群内数据恢复
D)以上全不正确
94.[单选题]下列关于LSTM的说法错误的是()。
A)LSTM中存在sigmoid函数
B)LSTM中存在tanh函数
C)LSTM又称长短时记忆网络
D)RNN是LSTM的变种
95.[单选题]下面关于大数据安全问题,描述错误的是:O
A)大数据的价值并不单纯地来源于它的用途,而更多地源自其二次利用
B)对大数据的收集、处理、保存不当,会加剧数据信息泄露的风险
C)大数据成为国家之向博弈的新战场
D)大数据对于国家安全没有产生影响
96.[单选题]处理文本数据,循环神经网络与前馈神经网络相比有()的优点。
A)不会梯度消失
B)训练结果不会发散
C)不需要激活函数
D)可以接受有序的输入序列
97.[单选题]阅读下面程序:list_demo=[1,2,1,3]nums=set(list_demo)foriinnums:
Print(i,end="")执行的结果为()
A)1213
B)213
C)321
D)123
98.[单选题]对分类任务来说,学习器从类别标记集合中预测出一个标记,最常见的结合策略是0
A)投票法
B)乎均法
C)学习法
D)排序法
99.[单选题]以下语句不正确的是()
A)select*fromemp;
B)selectename,hiredate,salfromemp;
C)select*fromemporderdeptno;
D)select*fromwheredeptno=landsal<300;
100.[单选题]将属性缩放到一个指定的最大和最小值之间,这种预处理方法的好处是(_)。
A)对于方差非常小的属性可以增强其稳定性
B)维持稀疏矩阵中为0的条目
C)便于理解
D)以上都是
IOL[单选题]如果要清空文件,需要使用的命令是(一)o
A)close()
B)seek(0)
C)truncate()
D)write('stuff')
102.[单选题]HBase交互模式中,显示所有命名空间
A)show_namespace
B)shows_namespace
C)Iistsjamespace
D)list_namespace
103.[单选题]下面关于数据产品开发相关描述正确的有(_)。
A)数据科学家的主要职责是“数据的管理”
B)数据科学家一定是科学家
C)“数据码农”可以胜任数据科学家
D)数据科学家是为解决现实世界中问题提供直接指导、依据或参考的高级专家
104.[单选题]在SPark中,(—)是指RDD的每个分区都只被子RDD的一个分区所依赖。
A)子分区
B)父分区
C)宽依赖
D)窄依赖
105.[单选题]下列哪个不属于k-means算法的终止条件()
A)没有(或最小数目)对象被重新分配给不同的聚类
B)没有聚类中心再发生变化
C)误差平方和局部最小
D)聚类中心聚集在一点
106.[单选题]下面关于增强学习描述不正确的是(_)。
A)增强学习主要研究如何协助自治Agent的学习活动
B)增强学习基本思路是当Agent在环境中做出每个动作时,施教者会提供奖赏或者惩罚信息,以表示
结果状态的正确与否
C)增强学习中的Agent需要具备环境交互能力和自治能力
D)基于马尔可夫决策不属于增强学习
107.[单选题]关于SeCondaryNameNOde下面哪项是正确的()。
A)它是NameNode的热备
B)它对内存没有要求
C)它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间
D)SecondaryNameNode应与NameNode部署到一个节点
108.[单选题]有如下程序:y=6z=lambdax:x*yprint(z(8))程序的输出结果是()。
A)14
B)24
048
D)64
109.[单选题]长短时记忆神经网络被设计用来解决的问题是()
A)传统RNN存在的梯皮消失/爆炸问题
B)传统RNN计算量大的问题
C)传统RNN速度较慢的问题
D)传统RNN容易过过拟合的问题
110.[单选题]()在训练的每一轮都要检查当前生成的基学习器是否满足基本条件
A)支持向量机
B)BOOSting算法
C)贝叶斯分类器
D)Bagging算法
IlL[单选题]YARN中默认的资源调度器是:()。
A)FlFO调度器
B)容量调度器
C)Fair调度器
D)以上全部是
112.[单选题]以下哪个不是Storm的特点:()
A)可扩展性
B)可靠的消息处理
C)支持各种编程语言
D)复杂的APl
113.[单选题]以下属于PythonWeb开发框架第三方库的是:
A)Django
B)Wheel
C)Pygame
D)WeRoBot
114.[单选题]为数据表创建索引的目的是()
A)提高查询的检索性能
B)归类
C)创建唯一索引
D)创建主键
115.[单选题]假负率是指()
A)正样本预剧结果数/正样本实际数
B)被预测为负的正样本结果数/正样本实际数
C)被预测为正的负样本结果数/负样本实际数
D)负样本预测结果数/负样本实际数
116.[单选题]下列关于云数据库的描述,哪个是错误的?()
A)云数据库是部署和虚拟化在云计算环境中的数据库
B)云数据库是在云计算的大背景下发展起来的一种新兴的共享基础架构的方法
C)云数据库价格不菲,维护费用极其昂贵
D)云数据库具有高可扩展性、高可用性、采用多租形式和支持资源有发等特点
117.[单选题]线性模型中的权重W值可以看做各个属性X的()。
A)正则化系数
B)对最终决策结果的贡献度
C)高维映射
D)取值
118.[单选题]数据被称为信息时代的“石油”,正在成为企业的核心资产。下列说法不正确的是
OO
A)企业应更加重视大数据技术应用推广
B)企业需要培养和引进数据应用人才
C)可以未经许可任意使用其它企业的数据
D)核心数据必须通过加密备份等严密保护
119.[单选题]下列哪一项关于极大似然估计(MLE)的说法是正确的?LMLE并不总是存在2.MLE一直
存在3.如果MLE存在,它可能不特异4.如果MLE存在,它一定是特异的
A)I和4
B)2和3
C)I和3
D)2和4
120.[单选题]用机器代码表示的数据库模式称为()
A)物理模式
B)逻辑模式
C)源模式
D)目标模式
121.[单选题]任何一个核函数都隐式地定义了一个()空间
A)希尔伯特空间
B)再生希尔伯特空间
C)再生按希尔伯特空间
D)欧式空间
122.[单选题]ndarry对象的SiZe属性表示(_)o
A)数组占用空间大小
B)数组每一维度的数量
C)数组中包含的元素个数
D)数组中的最大元素值
123.[单选题]构造了一个词表:{1.“小明”2.“喜欢"3.”踢”4.“看”5.“足球”6.“篮
球”7.“电影”},利用上述词表的索引号,文档{小明喜欢踢足球}可以用一个7维向量表示
[(一)]0
ʌ)lIOlOOl
B)l111111
OIIIIIOO
D)l110100
124.[单选题]以下描述错误的是:
A)在终极的分析中,一切知识都是历史
B)在抽象的意义下,一切科学都是数学
C)在理性的基础上,所有的判断都是统计学
D)在数据角度上,一切决策都是随机的
125.[单选题]不属于判别式模型的是(
A)决策树
B)BP神经网络
C)支持向量机
D)贝叶斯
126.[单选题]Numpy是由谁开发的?
A)中国
B)美国
C)开源组织
D)日本
127.[单选题]大数据参考架构的水平轴和垂直轴分别为()。
A)信息(活动)价值链和信息技术价值链
B)信息技术价值链和信息(活动)价值链
C)信息交互价值链和信息技术价值链
D)信息(活动)价值链和信息交互价值链
128.[单选题]执行np.ConCatenate([[[123][234]],[[345]]],axis=。)得到的结果是?
A)[Li23]L234][345]]
B)[[123345][234]]
C)[[123]L234345]]
D)[[123][234]]
129.[单选题]在有关数据仓库测试,下列说法不正确的是:
A)在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统
测试
B)当数据仓库的每个单独组件完成后,就需要对他们进行单元测试
C)系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试
D)在测试之前没必要制定详细的测试计划
130.[单选题IHashShuffleMagnage是(—)之前版本的默认模式
A)Sparkl.1
B)Sparkl.2
C)Sparkl.3
D)Sparkl.4
131.[单选题]银行进行客户购买力分析,首先获取客户历史账单,确定其中各项商品的计算权重,得
出每位客户的购买力评分并存储记录。最后将结果以图表显示。请问该过程对应于以下哪个项目数
据流程设计。
A)数据可视化->数据源->数据落地->数据处理
B)数据源->数据落地->数据处理->数据可视化
C)数据源->数据处理->数据落地-〉数据可视化
D)数据可视化->数据源-〉数据处理>数据荷地
132.[单选题]下列哪个选项对批量数据处理组件的描述是不正确的?
A)HiVe:传统SQL批处理引擎,用于处理SQL类批处理作业,使用广泛海量数据下表现稳定,但是处理
速度较慢。
B)MaPRedUCe:传统批处理引擎,用于处理非SQL类,尤其是数据挖掘和机器学习类批处理作业,使用
广泛,海量数据下表现不稳定,但是处理速度较快。
OSparkSQL:新型SQL批处理引擎,用于处理SQL类批处理作业,适合海量数据.处理速度高效。
D)Spark:新型批处理引擎,可以用于处理非SQL类,尤其是数据挖掘和机器学习类批处理作业,适
合海量数据,处理速度高效。
133.[单选题]下列关于计算机存储容量单位的说法中,错误的是
A)1KB<1MB<1GB
B)基本单位是字节(Byte)
C)一个汉字需要一个字节的存储空间
D)一个字节能够容纳一个英文字符
134.[单选题]机械思维强调的是()
A)世界是确定的
B)世界是不确定的
C)世界是机械的
D)世界是智能的
135.[单选题]根据《大数据风控平台项目操作手册》,财务智能分析中的国资委行业标准值比对模
块,通过选择O期次,用户可对企业财务报表进行切换,选择需要与国资委绩效标准值对比的财
务报表期次。
A)报表
B)B.对比企业规模
C)C财务科目
D)D.财务指标
136.[单选题]下列关于数据仓库随时间变化的描述不正确的是()。
A)数据仓库随时间的变化不断增加新的数据内容
B)捕捉到的新数据会覆盖原来的快照
C)数据仓库随时间变化不断删去旧的数据内容
D)数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合
137.[单选题]关于Hive建表基本操作,描述正确的是
A)一旦表建好,不可再修改表名
B)一旦表建好,不可再增加新列
C)创建外部表时需要制定external关键字
D)一旦表创建好,不可再修改列名
138.[单选题]Python标示注释使用符号是以下哪个?
A)@
B)&
C)≠
D)0
139.[单选题](_)是将数据转换为产品的艺术。
A)数据柔术
B)数据处理
C)数据加工
D)数据设计
140.[单选题]()操作属于预剪枝
A)信息增益
B)计算最好的特征切分点
C)巳限制树模型的深度
D)可视,化树模型
141.[单选题]下列关于MaP/Reduce并行计算模型叙述正确的一项为O0
A)MaP/Reduce把待处理的数据集分割成许多大的数据块
B)大数据块经MaP()函数并行处理后输出新的中间结果
C)reduce()函数把多任务处理后的中间结果进行汇总
D)reduce阶段的作用接受来自输出列表的迭代器
142.[单选题]在HadooP生态系统中,()可以将结构化的数据文件映射成一张数据库表,并提供简单的
查询语言。
A)Pig
B)HBase
OHive
D)MapReduce
143.[单选题](_)是交叉验证法的一种特例。
A)自助法
B)留一法
C)交叉验证法
D)错误率分析
144.[单选题]根据《大数据风控平台项目操作手册》,系统在【客户信息管理】一级菜单下增加【
征信报告查询管理】二级菜单,用户可在此菜单下的O节点查看征信报告。
A)待处理的征信报告
B)B.审批中的征信报告
C)C.审批批准
D)D.审批否决
145.[单选题]()认为,大数据时代的数据管理目标不一定理想和完美,一致性、可用性和分区容
错性中的任何两个特征的保证(争取)可能导致另一个特征的损失(放弃)。
A)CAP理论
B)BASE原则
C)数据一致性理论
D)大数据法则
146.[单选题]假如使用一个较复杂的回归模型来拟合样本数据,使用Ridge回归,调试正则化参数
入,来降低模型复杂度若入较大时,关于偏差(bias)和方差(VarianCe),下列说法正确的是()
A)若人较大时,偏差减小,方差减小
B)若入较大时,偏差减小,方差增大
C)若λ较太时,偏差增大,方差减小
D)若人较大时,偏差增大,方差增大
147.[单选题]下列关于关键词提取的说法错误的是()。
A)关键词提取是指借用自然语言处理方法提取文章关键词
B)TF-IDF模型是关键词提取的经典方法
C)文本中出现次数最多的词最能代表文本的主题
D)这个问题涉及数据挖掘、文本处理、信息检索等领域
148.[单选题]HDFS采用了什么模型?
A)分层模型
B)主从结构模型
C)管道-过滤器模型
D)点对点模型
149.[单选题]大数据的本质是()。
A)洞察
B)采集
C)统计
D)联系
150.[单选题]我行《大数据应用推动考核办法》从O开始实施。
A)20170101
B)20170801
C)20180101
D)20180801
151.[单选题]HBase来源于哪一项?。
A)TheGoogleFileSystem
B)MapReduce
OBigTable
D)Chubby
152.[单选题]()指从“数据视角”提出问题、在“数据层次”上分析问题、“以数据为中心”解
决问题,以及将“数据”当作决策制定的决定因素,提高决策制定的信度与效度。
A)、模型驱动型决策支持
B)、数据驱动型决策支持
C)、任务驱动型决策支持
D)、算法驱动型决策支持
153.[单选题]()模式的变化意味着数据科学中所关注的数据计算的常见瓶颈、关注焦点、主要
矛盾和思维模式发生了根本性变化。
A)数据计算
B)、数据管理
0、数据分析
D)、数据获取
154.[单选题]Hive查看数据库命令是()
A)looktable;
B)showtable;
C)lookdatabases;
D)showdatabases;
155.[单选题]以下不属于数据治理工作的主要内容的有(_)。
A)理解自己的数据
B)数据部门的建立
C)有效监督与动态优化
D)岗位工资的定义
156.[单选题]对于HBaSeKeyValUe存储模型描述不正确的是?
A)同一个Key值只能关联个ValUe
B)拥有时间戳类型等关键信息
C)KeyVaIUe具有特定的格式
D)时间戳来区分多个记录版本
157.[单选题]MaxCompute表中的列,不支持()数据类型。
A)Bigint
B)Double
C)Boolean
D)Varchar
158.[单选题]下列基本活动中不属于数据产品开发工作之中需要特别注意的是()。
A)创造性设计
B)数据洞见
C)虚拟化
D)个性化描述
159.[单选题]商品的()用于在搜索和浏览列表时更准确的找到该商品。--
A)关键词
B)描述
C)提示
D)详情
160.[单选题]对arr=np.arange(9).reshape(3,3),反转二维数组arr的行进行的操作是
()O
A)arr[::-1]
B)arrL::-2]
C)arr[::1]
D)arr[::0]
161.[单选题]int('12',16)的结果是(—)。
A)10
B)12
016
D)18
162.[单选题]关于虚拟私有云(VPC)描述不对的是()
A)VPC支持专线接入
B)VPC的多个子网可以创建在同一Region内的不同AZ中
C)可以通过安全组实现不同VPC之间的云主机互通
D)每个用户可以创建多个VPC及子网
163.[单选题]在下列算法中,对于缺失值敏感的模型为(—)。
A)随机森林
B)逻辑回归
C)C5.0
D)朴素贝叶斯
164.[单选题IZooKeeper的特点描述错误的是()。
A)复杂性
B)自我复制
C)顺序访问
D)高速读取
165.[单选题]()采用概率模型来表达聚类原型。
A)K均值算法
B)学习向量量化
C)高斯混合聚类
D)密度聚类
166.[单选题]下面组件哪个是数据挖掘库:O
A)Zookeeper
B)Mahout
OMySQL
D)HBase
167.[单选题]以下哪项属于FlUme的基本数据单位?
A)Object
B)Subject
C)Topic
D)Event
168.[单选题]数据库利用()进行死锁检测。
A)DAG
B)RPC
OWFG
D)DLC
169.[单选题]在实验集群的master节点使用jps命令查看进程时,终端出现以下哪项能说明
Hadoop主节点启动成功?()
A)Namenode,Datanode,TaskTracker
B)Namenode,Datanode,SecondaryNameNode
C)Namenode,Datanode,HMaster
D)Namenode,JobTracker,SecondaryNameNode
170.[单选题]matplotlib中的Iegend函数作用是什么()
A)设置标签文本
B)绘制网格线
C)标示不同图形的文本标签图例
D)设置X轴的数值显示范围
171.[单选题]下列关于气泡图的说法中,错误的是()
A)气泡图中气泡的颜色是系统统一设置的,无法人为调整
B)气泡大小的不同意味着所代表的的数值的不同
C)气泡图中的图形形状不一定是圆形
D)可以为每个气泡打上标签使其展示的数值更加直观化
172.[单选题]在MaPRedUCe中,下面哪个数据流的顺序是正确的O
A)InputFormat
B)Mapper
C)Combiner
D)Reducer
173.[单选题]一切皆可连,任何数据之间逻辑上都有可能存在联系,这体现了大数据思维维度中的(
)o
A)定量思维
B)相关思维
C)因果思维
D)检验思维
174.[单选题]下列论据中,体现“冷眼”看大数据的观点是()
A)互联网金融打破了传统的观念和行为
B)大数据医疗正在走进平民百姓
C)数据资产型企业前景光明
D)个人隐私泄露与信息安全担忧
175.[单选题]下列关于Numpy的简单介绍不正确的是()。
A)Numpy(NumericalPython)是Python语言的一个扩展程序库
B)支持大量的维度数组与矩阵运算
C)针对数组运算提供大量的数学函数库
D)Numpy不开放源代码
176.[单选题]下面算法中属于图像锐化处理的是:Oo
A)低通滤波
B)加权平均法
C)高通滤波
D)中值滤波
177.[单选题]当需要将一个数组改变形状时,应使用numPy的哪个属性?
A)shape()
B)reshape()
C)arrange()
D)array()
178.[单选题]哪个产品适应于OLAP场景?
A)PostgressQL
B)SQLServero
C)MysQL
D)GaussDB200
179.[单选题]从网络的原理上来看,结构最复杂的神经网络是()。
A)卷积神经网络
B)长短时记忆神经网络
OGRU
D)BP神经网络
180.[单选题]以下关于HDFS适合做什么描述正确的是
A)低延迟读取
B)大文件存储
C)大量小文件存储
D)随机写入
181.[单选题]下列不属于HiVe记录中默认分隔符()
A)∖n
B)^A
C)^B
D)∖r∖n
182.[单选题]()是Spark中的抽象数据模型。
A)RDD
B)Scheduler
C)Storage
D)Shuffle
183.[单选题]下面与HDFS类似的框架是O?
A)NTFS
B)FAT32
OGFS
D)EXT3
184.[单选题]Hadoop的作者是下面哪一位()。
A)MartinFowler
B)Dougcutting
C)KentBeck
D)GraceHopper
185.[单选题]最早被提出的循环神经网络门控算法是什么
A)长短期记忆网络
B)门控循环单元网络
C)堆叠循环神经网络
D)双向循环神经网络
186.[单选题]多分类学习中,最经典的三种拆分策略不包括0。
A)一对一
B)一对其余
C)一对多
D)多对多
187.[单选题]在MaXConIPUteSQL中,用于执行显示类型转换的函数是:()。
A)CAST
B)CONCAT
OTO
D)L1KE
188.[单选题]以下关于HDFS适合做什么描述不正确的是?
A)流式数据读取
B)大文件存储与访问
C)大数据量吞吐
D)低延迟读取
189.[单选题]求以下程序结果正确的是()L=CGoogle','Python','Taobao')print(L[-2])
print(L[l:])
A)Python',('Python1,'Taobao')
B)Google',('Python',"Taobao')
C)Google''Python,
D),Taobao''Python,
190.[单选题]SELECT语句的完整语法较复杂,但至少包括的部分是()
A)仅SELECT
B)SELECT,FROM
C)SELECT,GROUP
D)SELECT,INTO
191.[单选题]python中,while的中止的关键字是O
A)continue
B)broken
C)break
D)plug
192.[单选题]基于大数据的谷歌广告体现的大数据思维方式是()
A)全样而非抽样
B)效率而非精确
C)相关而非因果
D)以数据为中心
193.[单选题]下列关于数据重组的说法中,错误的是()。
A)数据重组是数据的重新生产和重新采集
B)数据重组能够使数据焕发新的光芒
C)数据重组实现的关键在于多源数据融合和数据集成
D)数据重组有利于实现新颖的数据模式创新
194.[单选题]如果Python程序中包括零运算,解释器将在运行时抛出()错误信息。O
A)NameError
B)FiIeNotFoundError
C)SyntaxError
D)ZeroDivisionError
195.[单选题]在Hadoop的分区阶段,默认的Partitioner是()。
A)RangePartitioner
B)Partitioner
C)HashPartitioner
D)用户自定义的Partitioner
196.[单选题]重点完善并应用电网统一(),夯实数据同源维护机制,构建各专业共建共享的电网资
源业务中台,沉淀形成共性服务能力。
A)数据模型
B)技术模型
C)应用模型
D)计算模型
197.[单选题]以下哪项不属于传统的数据存储和管理技术:O
A)NoSQL数据库
B)文件系统
C)关系数据库
D)数据仓库
198.[单选题]阅读下列代码,最后显示的数是:importrandoms=random.randint(1,99)print(s)
A)l
B)2
C)99
D)1-99之间的随机数
199.[单选题]数据产品的定义是()。
A)数据产品是指能够供给市场,被人们使用和消费,并能满足人们某种需求的任何东西
B)数据产品是可以发挥数据价值去辅助用户更优地做决策(甚至行动)的一种产品形式
C)数据产品是指为了满足自身的需要,通过科技发明或经验总结而形成的技术
D)数据产品是数据科学的结果,创造了新的实物形态和使用价值的产品
200.[单选题]plt.legend()函数可以在途中添加(—)。
A)曲线
B)坐标轴
C)标题
D)图例
201.[单选题]令N为数据集的大小[注:设训练样本问,y;),N即训练样本个数],d是输入空间的维数
(注:d即向量Xi的维数)硬间隔SVM问题的原始形式[即在不等式约束(Yi(WTXi+b)2:l)下最小化
(l∕2)wTw]在没有转化为拉格朗日对偶问题之前,是()
A)一个合N个变量的二次规划问题
B)一个含N+1个变量的二次规划问题
C)一个舍d个变量的二次规划问题
D)一个舍d+1个变量的二次规划问题
202.[单选题]在HiVe的查询语句中,表示A和B按位取异或的是()
A)A∣B
B)Λ^B
OA-B
D)A~B
203.[单选题]支持向量回归与传统回归模型的差别是()
A)模型输出与真实值相同
B)模型输出与真实值存在E偏差
C)模型输出大于真实性
D)模型输出小于真实值
204.[单选题]下列关于极大似然估计的描述错误的是()。
A)极大似然估计先假定其具有某种确定的概率分布形式
B)极大似然估计没有确定的概率分布形式
C)概率模型的训练过程就是参数估计
D)贝叶斯学派认为参数本身也有分布,是未观察的随机变量
205.[单选题]感知机中,()是M-P神经元,也称为阔值逻辑单元
A)输入层
B)输出层
C)第一层
D)第二层
206.[单选题]numPy中计算矩阵的协方差矩阵使用什么函数?
A)np.mean()
B)np.std()
C)np.cov()
D)np.var()
207.[单选题]以下能够删除一列的是()
A)altertableempremoveaddcolumn
B)altertableempdropcolumnaddcolumn
C)altertableempdeletecolumnaddcolumn
D)altertableempdeleteaddcolumn
208.[单选题]创建Loader作业中,可以在以下哪个步骤中设置过滤器类型?
A)输入设置
B)转换
C)基本信息
D)输出
209.[单选题]HDFS集群中的NameNode职责不包括()。
A)维护HDFS集群的目录树结构
B)维护HDFS集群的所有数据块的分布、副本数和负载均衡
C)负责保存客户端上传的数据
D)响应客户端的所有读写数据请求
210.[单选题]对参数进行L2正则,是机器学习常用的防止过拟合的方法。对参数做L2正则时,()是
对参数本身做先验分布假设。
A)高斯分布
B)拉普拉斯分布
C)泊松分布
D)均匀分布
211.[单选题]以下()不是MaXComPUteMR的必须组成阶段。
A)Map
B)Shuffle
C)Reduce
D)Combiner
212.[单选题]在HDFS中(__)管理文件系统的命名空间。
A)DataNode
B)Client
C)NameNode
D)Flume
213.[单选题]执行下面操作后,list2的值是[()]o$;$listl=[4,5,6]$;$list2=
IiSt1$;$IiStI[2]=3
A)4,5,6
B)4,3,6
04,5,3
D)其他答案都不正确
214.[单选题]()数据的最大特点是表现为以行、列组成的二维形式
A)结构化
B)半结构化
C)准结构化
D)非结构化
215.[单选题「数据的故事化描述"是指为了提升数据的(),将数据还原成关联至特定的情景的过程。
A)可理解性、可记忆性、可体验性
B)可接受性、可记忆性、可体验性
C)可接受性、可记忆性、可呈现性
D)可理解性、可记忆性、可呈线性
216.[单选题]Python语句Print(OXA+0XB)的输出结果是。()
A)0xA+0xB
B)A+B
C)OxAOxB
D)21
217.[单选题]以下关于Python文件的描述,错误的是:
A)open函数的参数处理模式'b'表示以二进制数据处理文件
B)open函数的参数处理模式'+'表示可以对文件进行读和写操作
Oreadline函数表示读取文件的下一行,返回一个字符
D)open函数的参数处理模式'a'表示追加方式打开文件,删除已有内容
218.[单选题]在制作图表时,为了实现在单个图表中的穿透,可以通过增加()实现
A)图层
B)筛选器
C)维度
D)度量
219.[单选题]使用Pig语句实现内连接,下列语句正确的是(—)。
A)SELECT*FROMtmp_tableAJOINtmp_table_2BONA.age=B.age;
B)DUMPtmp_tableBYageJOINtmp_table_2BYage;
C)tmptable_join=JOINtmptableBYage,tmptable_2BYage;DUMPtmp_table_join;
D)JOINtmp_tableBYage,tmp_table_2BYage;
220.[单选题]下列描述中属于DMM(数据管理成熟度模型)中的关键过程域数据战略的是()。
A)数据战略制定
B)业务术语表
C)数据质量评估
D)过程质量保障
221.[单选题]真正率是指(一)。
A)正样本预测结果数/正样本实际数
B)被预测为负的正样本结果数/正样本实际数
C)被预测为正的负样本结果数/负样本实际数
D)负样本预测结果数/负样本实际数
222.[单选题]任何一个核函数都隐式地定义了一个()空间。
A)希尔伯特空间
B)再生希尔伯特空间
C)再生核希尔伯特空间
D)欧式空间
223.[单选题]()是用来解决海量大数据文件存储问题的,是目前应用最广泛的分布式文件系统。
A)HDFS
B)HBase
OHIve
D)Kafka
224.[单选题]SQL语言是。的语言,易学习
A)过程化
B)非过程化
C)格式化
D)导航式
225.[单选题]tuple函数可以达到的效果是()。
A)计算元组元素个数
B)返回元组中元素最大值
C)将元组转换成列表
D)将列表转换成元组
226.[单选题]表达式eval('500/10')的结果是:
A)'500/10'
B)500/10
C)50
D)50.0
227.[单选题]以下哪个不属于数据治理内容的是()。
A)理解自己的数据
B)行为规范的制定
C)岗位职贵的定义
D)获得更多的数据
228.[单选题]关于“与/或”图表示法的叙述中,正确的是:Oo
A)“与/或”图就是用“AND”与“OR”连续各个部分的图形,用来描述各部分的因果关系。
B)“与/或”图就是用“AND”与“OR”连续各个部分的图形,用来描述各部分之间的不确定关系。
C)“与/或”图就是用“与”节点与“或”节点组合起来的树形图,用来描述某类问题的层次关系。
D)“与/或”图就是用“与”节点与“或”节点组合起来的树形图,用来描述某类问题的求解过程。
229.[单选题]MaxCOmPUte表T中有IoOO万行数据,需要把这些数据全部导出到本地,下面()是可
行
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现代办公环境下的会议组织策略
- 环保理念在艺术空间设计中的应用
- 9 古诗三首《秋夜将晓出篱门迎凉有感》(说课稿)-2024-2025学年统编版语文五年级下册
- 2024年五年级语文下册 第六单元 15 自相矛盾说课稿 新人教版
- 6 我们神圣的国土第一课时 (说课稿)- 2024-2025学年统编版道德与法治五年级上册001
- Unit 3 After School Activities Let's Check(说课稿)-2023-2024学年人教新起点版英语三年级下册
- 2024-2025学年高中物理 第六章 万有引力与航天 2 太阳与行星间的引力(1)说课稿 新人教版必修2
- Unit5 Clothes (第六课时)(说课稿)-2024-2025学年人教新起点版英语三年级上册001
- 2024年四年级英语上册 Unit 4 Shopping in the City Lesson 24 Etta's Teddy Bear说课稿 冀教版(三起)
- 3 桂花雨 说课稿-2024-2025学年语文五年级上册统编版
- 2025福建新华发行(集团)限责任公司校园招聘30人高频重点提升(共500题)附带答案详解
- 油气长输管道检查标准清单
- 山东铁投集团招聘笔试冲刺题2025
- 图像叙事的跨学科视野-洞察分析
- 急性缺血性卒中再灌注治疗指南2024解读
- 暑假假期安全教育(课件)-小学生主题班会
- 2024年潍坊护理职业学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 西藏自治区建筑与市政工程竣工验收报告
- 2022届高考地理一轮复习课件区域地理欧洲西部
- 《社会主义市场经济理论(第三版)》第一章社会主义市场经济基础论
- 编外人员录用审批表
评论
0/150
提交评论