版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试卷科目:大数据开发基础大数据开发基础(习题卷57)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大数据开发基础第1部分:单项选择题,共54题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.在Matplotlib中调整后可以显示中文的参数是()。A)lines.linestyleB)lines.linewidthC)font.sans-serifD)axes.unicodeminus答案:C解析:C项是在plt.rcparams中设置字体以正确显示中文。[单选题]2.YARN的基于标准调度,是对下列选项中的()进行标签化。A)AppMasterB)ResourceManagerC)NodeManagerD)Container答案:C解析:[单选题]3.构建一个神经网络,将前一层的输出和它自身作为输入()有反馈连接A)循环神经网络B)卷积神经网络C)限制玻尔兹曼机D)都不是答案:A解析:[单选题]4.若将2转换为0b10,应该使用()函数。A)oct()B)bin()C)hex()D)int()答案:B解析:[单选题]5.以下()在关系模型中表示属性的取值范围。--A)元组B)键C)属性D)域答案:D解析:[单选题]6.()采用概率模型来表达聚类原型。A)K均值算法B)学习向量量化C)高斯混合聚类D)密度聚类答案:C解析:[单选题]7.下列属于分组表中的是()A)形状B)风格C)背景D)标题答案:A解析:class="fr-ficfr-dib"BCD其他表都有。[单选题]8.Python使用()关键字自定义一个函数。A)functionB)funcC)defD)lambda答案:C解析:[单选题]9.多分类学习中,最经典的三种拆分策略不包括()A)一对一B)一对其余C)一对多D)多对多答案:A解析:[单选题]10.(__)代表的是生成数据的机构。A)数据资源B)数据源C)数据端D)数据站答案:A解析:[单选题]11.对组织机构的数据管理成熟度等级划分中的已执行级的描述错误的是()。A)在具体项目中,DMM关键过程域(KPA)中给出的关键过程已被执行,但随意性和临时性较大B)DMM关键过程的执行不仅仅局限于特定业务范畴,存在跨越不同业务领域的关键过程C)缺少针对DMM关键过程的反馈与优化D)虽然有可能在特定业务过程中进行了基础性改进,但没有进行持续跟进,也未拓展到整个组织机构答案:B解析:DMM的执行级(PerformedLevel):组织机构只在个别项目的范围之内"执行"了DMM给出的关键过程,但缺乏机构层次的统筹与管理。主要特点如下:①在具体项目中,DMM关键过程域(KPA)中给出的关键过程(KeyProcess)已被执行,但随意性和临时性较大。②DMM关键过程(KeyProcess)的执行往往仅限于特定业务范畴,很少存在跨越不同业务领域的关键过程。③缺少针对DMM关键过程(KeyProcess)的反馈与优化。以DMM关键过程(KeyProcess)中的"数据质量"为例,其数据管理工作可能过于集中在一个特定业务,如"数据修复活动",并没有扩散到整个的业务范围或并没有开展对数据修复活动本身的反馈与优化工作;④虽然有可能在特定业务过程中已进行了基础性改进,但没有进行持续跟进,也未拓展到整个组织机构;⑤)组织机构没有统筹其数据管理工作,而数据管理活动局限在具体项目中,主要按照其具体项目的实施需求进行,如果一个具体项目中需要进行数据管理,可能会执行DMM中给出的相关过程,反之亦然。[单选题]12.云计算包括3种类型。面向所有用户提供服务,只要是注册付费的用户都可以使用,这种云计算属于:()A)公有云B)私有云C)混合云D)独立云答案:A解析:[单选题]13.DAGScheduler将每个()打包成TaskSet交给TaskScheduler调度。A)TaskB)JobC)DAGD)Stage答案:D解析:[单选题]14.关于Python语言的特点,以下选项中描述错误的是()。A)Python语言是非开源语言B)Python语言是跨平台语言C)$;$Python语言是多模型语言D)Python语言是脚本语言答案:A解析:[单选题]15.以下选项中由客户端编码决定的是()。--A)character_set_serverB)character_set_databaseC)character_sets_dirD)character_set_results答案:D解析:[单选题]16.假设属性income的最大最小值分别是98000元和12000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为()。A)0.821B)1.224C)1.45D)0.716答案:D解析:[单选题]17.HBase中可以启动多个HMaster,通过ZooKeeper的主选举(MasterElection)机制保证总有()Master在运行A)1个B)2个C)多个D)以上都不正确答案:A解析:[单选题]18.引用集合数据类型中的元素选择sub数组中第一个元素进行查询,正确的是()A)selectname,subordinates[0]fromemplyees;B)selectname,subordinates[1]fromemplyees;C)selectname,subordinatesfromemplyees;D)以上都不正确答案:A解析:[单选题]19.在能源互联网产业生态架构中,()将不仅作为能源传输、转换的枢纽,更是承载各种服务,连接各方利益,实现信息交互、共享,支撑各种交易的平台。A)电能B)电网C)电厂D)电力设备制造企业答案:B解析:[单选题]20.YARN服务中,如果要给队列QueueA设置容量为30%,应该配置哪个参数?A)yarn.scheduler.capacity.root.Queueuser.limit-factorB)yarn.scheduler.capacity.root.QueueA.minimun-suer-limit-precentC)yarn.scheduler.capacity.root.QueueA.capacityD)yarn.scheduler.capacity.root.QueueA.state答案:C解析:[单选题]21.S和T是两个集合,对S|T的描述正确的是()A)、S和T的差运算,包括在集合S但不在T中的元素B)、S和T的并运算,包括在集合S和T中的所有元素C)、S和T的交运算,包括同时在集合S和T中的元素D)、S和T的补运算,包括集合S和T中的非相同元素答案:B解析:[单选题]22.HDfS中的block默认保存几份?A)3份B)2份C)1份D)不确定答案:A解析:HDFS默认BlockSize64MB,block默认保存3份。记住即可[单选题]23.使用OTSJavaSDK进行表操作时需要创建,以下()不属于构造此对象时必须提供的信息。A)实例名称B)AccountIDC)EndpointD)AccessKeySecret答案:B解析:[单选题]24.数据资产维护是指为保证数据质量,对数据进行()等处理的过程。A)更正B)删除C)补充录入D)以上答案都正确答案:D解析:数据资产维护是指为保证数据质量,对数据进行更正、删除、补充录入等处理的过程。[单选题]25.下面属于查询分析计算技术的是:()A)SparkB)StormC)HiveD)Pregel答案:C解析:[单选题]26.HDFS读取文件时用的是哪一个read方法?A)DataInputStreamB)FSDataInputStreamC)DataOutputStreamD)FSDataOutputStream答案:B解析:[单选题]27.执行以下代码段importmathprint(math.factorial(5))时,输出为()。A)120B)15C)[1,2,3,4,5]D)3125答案:A解析:[单选题]28.altertabletableNamesettblproperties('EXTERNAL?='FALSE?);执行该Hive命令能实现以下哪一个目标?A)修改外部表tableName为内部表B)删除tableName表的元数据信息C)修改内部表tableName为外部表D)移动tableName数据到外部存储系统答案:A解析:[单选题]29.下列关于HDFS机架感知中两个DataNode之间的距离说法哪个不正确?A)同一个DataNode之间的distance为0;B)同一个rack下的不同的DataNode之间的distance为2;C)同一个IDC下的不同的DataNode之间的distance为4;D)不同的IDC下的DataNode之间的distance为8;答案:D解析:[单选题]30.下列能体现大数据思维的是()A)大数据思维是要追求数据的精确性B)大数据思维是要抓住样本数据C)大数据思维是要通过少量数据观察数据间关系D)大数据思维是要从自然思维转变为智能思维答案:D解析:[单选题]31.以下可以用于比较运算的函数是()。--A)RAND()B)POW()C)CEIL()D)IN()答案:D解析:[单选题]32.数据的可用性取决于()。A)数据分析B)数据集采C)数据质量D)数据需求答案:C解析:[单选题]33.为了防止个人信息泄露,下列做法不正确的是()。A)关闭电脑摄像头B)不下载不明APPC)抖音发布个人地址D)手机设置多重密码答案:C解析:[单选题]34.以下属于Hive的架构组件的是?A)HLogB)DriverC)MasterD)NameNode答案:B解析:[单选题]35.关于Hive建表基本操作,描述正确的是:()。A)一旦表建好,不可再修改表名B)一旦表建好,不可再增加新列C)创建外表时需要指定external关键字D)一旦表建好,不可再修改列名答案:C解析:[单选题]36.下列关于traintestsplit函数的说法正确的是()。A)train_test_split能够将数据集划分为训练集、验证集和测试集B)生成的训练集和测试集在赋值的时候可以调换位置,系统能够自动识别C)train_test_split每次的划分结果不同,无法解决D)train_test_split函数可以自行决定训练集和测试集的占比答案:D解析:[单选题]37.创建Loader作业中,可以在以下哪个步骤中设置过滤器类型?A)输入设置B)转换C)基本信息D)输出答案:A解析:[单选题]38.主节点程序()。A)NameNodeB)DataNodeC)SecondaryNameNodeD)Jobtracker答案:A解析:[单选题]39.运行以下程序,输出结果的是:str1="NanjingUniversity"str2=str1[:7]+"Normal"+str1[-10:]print(str2)A)NormalUB)NanjingNormalC)NormalUniversityD)NanjingNormalUniversity答案:D解析:[单选题]40.当数据经过设计好的流程处理后,接下来需要进行可视化展示。在DEEP中需要将处理后的数据落地到(),就能在DEEP可视化模块中进行可视化展示。A)云数据库的表中B)关系数据库C)数据源D)Excel的工作表中答案:A解析:[单选题]41.在HBase的专用过滤器中,单列排除过滤器是()A)SingleValueExcludeFilterB)SingleColumnExcludeFilterC)SingleColumnValueExcludeFilterD)ColumnValueExcludeFilter答案:C解析:[单选题]42.DIKW金字塔模型中,顶层与底层的名称分别为()。A)智慧与数据B)知识与数据C)智慧与数值D)知识与数值答案:A解析:[单选题]43.Python寻找标识符命名空间的顺序是()。A)Python首先搜索全局命名空间,然后搜索本地命名空间,最后搜索内置命名空间B)Python首先搜索本地命名空间,然后是全局命名空间,最后是内置命名空间C)Python首先搜索内置命名空间,然后搜索全局命名空间,最后是本地命名空间D)Python首先搜索内置命名空间,然后是本地命名空间,最后是全局命名空间答案:B解析:[单选题]44.划分聚类算法是一种简单的较为基本的重要聚类方法。它的主要思想是通过将数据点集分为()个划分,并使用重复的控制策略使某个准则最优化,以达到最终的结果A)DB)KC)ED)F答案:B解析:划分聚类算法K-Means将数据点集分为K个子集。[单选题]45.点击率问题是这样一个预测问题,99%的人是不会点击的,而1%的人是会点击进去的,所以这是一个非常不平衡的数据集。假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是()。A)模型预测准确率已经很高了,我们不需要做什么了B)模型预测准确率不高,我们需要做点什么改进模型C)无法下结论D)以上答案都不正确答案:C解析:类别不均衡的情况下,不能用准确率做分类评估指标,因为全判断为不会点,准确率也是99%,此时分类器一点用都没有。[单选题]46.数据科学家采用()方法判断数据是否?干净?。A)、数据处理B)、数据加工C)、数据审计D)、数据化答案:C解析:[单选题]47.在k均值算法中,假定聚类簇数k=3,则在算法开始时随机选取(__)个样本作为初始均值向量A)1B)2C)3D)任意答案:C解析:[单选题]48.电商大数据存在的安全风险不包括()。A)数据版权缺乏保护B)数据产权归属不清C)大数据?杀熟?现象D)业务数据跨境传输答案:C解析:[单选题]49.以下不能创建一个字典的语句是A)dict1={}B)dict2={3:5}C)dict3={[1,2,3]:?uestc?}D)dict4={(1,2,3):?uestc?}答案:C解析:[单选题]50.关于下列Python语句的说法正确的是()ifi==1:s=1A)i==1,s=1都是赋值语句B)i==1,s=1都是关系表达式C)i==1是关系表达式,s=1是赋值语句D)i==1是赋值语句,s=1是关系表达式答案:C解析:[单选题]51.下面关于关系数据库特点的描述,错误的是:()A)采用表格的储存方式,数据以行和列的方式进行存储,要读取和査询都方便B)为了规范化数据、减少重复数据以及利用好存储空间,把数据按照蚁小关系表的形式进行存储C)由于关系数据库将数据存储在数据表中,数据操作的瓶颈岀现在多张数据表的操作中.而且数据表越多这个问题越严重D)关系数据库采用非结构化査询语言来对数据库进行査询答案:D解析:[单选题]52.下列滤波器中对图像中的椒盐噪声滤波效果最好的是()。A)中值滤波B)均值滤波C)最大值滤波D)最小值滤波答案:A解析:[单选题]53.大数据的起源()A)电信B)互联网C)金融D)公共管理答案:B解析:[单选题]54.Kafka中数据从Producer到Broker和Broker到Consumer分别是那种传递方式A)pullpushB)pullpullC)pushpushD)pushpull答案:D解析:第2部分:多项选择题,共26题,每题至少两个正确答案,多选或少选均不得分。[多选题]55.数据表在设计时应遵循以下()原则。--A)避免数据经常发生变化B)避免经常修改表结构C)尽可能详细地记录日志D)避免删除数据答案:ABCD解析:[多选题]56.以下正确的指令有()。A)pipupdateB)pipinstall-UpipC)piplistD)pip--help答案:BCD解析:[多选题]57.大数据分析相关技术主要特征包括?A)机器学习,全量特征B)数据背后事件关联性分析C)基于海量数据为基础D)基于精确样本为基础答案:ABC解析:[多选题]58.Flume进程级联时,以下哪些sink类型用于接收上一跳Flume发送过来的数据?A)avrosinkB)thriftsinkC)HDFSsinkD)NullSink答案:BC解析:[多选题]59.释放预处理语句使用()。--A)ALLOCATEPREPAREB)DEALLOCATEPREPAREC)DELETEPREPARED)DROPPREPARE答案:BD解析:[多选题]60.下列表示同一种学习方法的是(__)。A)集成学习B)多分类器系统C)基于委员会的学习D)平均策略答案:ABC解析:[多选题]61.某大数据业务人员因误操作,导致某条Hive的Insert语句执行了多次,使得数据出现了重复的现象,为了避免下次再次出现这种问题。以下哪些操作是可取的?A)添动加Hive表的唯一索引,保正数据不重复。B)改造SQL语句,在插入前添动加清空操作如truncateC)改造SQL语句,添加关键字Overwrite使得数据以夏盖的方式写入。D)添动加权限,使得业务人员只执行单次插入。答案:ABCD解析:[多选题]62.ADS提供()批量导入数据的方式。A)通过batchinsert命令B)通过rest-likeapi方式C)通过insertD)datapipeline系列命令答案:CD解析:[多选题]63.以下能创建一个字典的语句是()。A)dict1={}B)dict2={3:5}C)dict3=dict([2,5],[3,4])D)dict4=dict(([1,2],[3,4]))答案:ABD解析:[多选题]64.按照应用类型,Flink窗口可以划分为以下哪几种?A)事件窗口B)容量窗口C)滚动窗口D)时间窗口答案:ACD解析:[多选题]65.实时检索的解决方案中有哪些组件?A)HBaseB)HadoopC)ElasticSearchD)Hive答案:AC解析:[多选题]66.避免?数据孤岛?的方法包括:A)关键匹配变量B)数据融合C)数据输入D)利用样本框答案:ABD解析:[多选题]67.某开发团队要使用E1asticSearch做检索工具,下列哪些选项可以用E1asticSearch检索?A)关系型数据库数据B)图片C)xml文档D)向量化数据答案:ABC解析:[多选题]68.以下关于函数的作用描述正确的是()。A)减少代码重复B)将复杂的问题分解为更简单的部分C)提高代码的清晰度D)提高语句的共享性答案:ABCD解析:[多选题]69.生成一个新的RDD方式有:A)从其他stablestorage读取生成B)定义一个RDD变量C)从其他RDD转换而来D)由一个已经存在的Scala集合创建答案:ACD解析:[多选题]70.对RDD执行的操作有一下几种:A)创建B)转换C)控制D)执行答案:ABCD解析:[多选题]71.以下哪层是卷积神经网络的组成部分(A)卷积层B)中间层C)池化层D)全连接层答案:ACD解析:卷积神经网络的组成部分不包括中间层。[多选题]72.关于HDFS中NameNode的作用描述的正确的是?A)管理HDFS的名称空间(NameSpace)B)配置副本策略通常为3份C)处理客户端读写请求D)执行数据块的读/写操作答案:ABC解析:[多选题]73.下列关于偏差、方差、均方差、泛化误差的作用表述正确的是(__)。A)偏差刻画了模型本身的拟合能力B)方差刻画了数据扰动所造成的影响C)噪声刻画了学习问题本身的难度D)泛化误差可分解为方差与噪音之和。答案:ABC解析:[多选题]74.下列可以用于实现爬虫功能的有()。A)BeautifulSoup库B)re模块C)Scrapy框架D)urllibrequest库答案:ACD解析:re是正则模块不含网络功能,但可以用它将爬下来的数据进行处理。[多选题]75.Hadoop组件Zookeeper的设计目标和主要特点包括()。A)简单性B)自我复制C)顺序访问D)高速读取答案:ABCD解析:[多选题]76.关于?大数据摩尔定律?,以下说法正确的是:()A)人类社会产生的数据一直都在以每年50%的速度増长B)人类社会的数据量大约每两年就増加一倍C)人类在最近两年产生的数据量相当于之前产生的全部数据量之和D)人类社会的数据量以每年10%的速度増长答案:ABC解析:[多选题]77.基于语义的情感词典方法有(__)等流程。A)构建词典B)统计词频C)构建倾向性计算算法D)确定阈值答案:ACD解析:第3部分:判断题,共16题,请判断题目是否正确。[判断题]78.在DWS服务中,通过GDS并行导入数据时,需要明确DWS的集群IP地址。A)正确B)错误答案:错解析:[判断题]79.3NF消除了传递函数依赖。--A)正确B)错误答案:对解析:[判断题]80.定义函数时,带有默认值的参数必须出现在参数列表的最右端,任何一个带有默认值的参数右边不允许出现没有默认值的参数。A)正确B)错误答案:错解析:[判断题]81.量化是一种把定性指标转换为定量指标的方法,用具体的数据表示出来。A)正确B)错误答案:对解析:[判断题]82.CIoudera是Hadoop商业版的发布公司。A)正确B)错误答案:对解析:[判断题]83.在阿里云大数据计算服务(MaxCompute,原ODPS)中,当一个用户被移除出项目空间(project)后,与该用户有关的ACL授权仍然会被保留。一旦该用户以后被再添加到该项目空间时,该用户的历史的ACL授权访问权限将被重新激活。A)正确B)错误答案:对解析:[判断题]84.from_arrays()方法是将元组列表转换为MultiIndex对象。()A)正确B)错误答案:错解析:[判断题]85.DataNode首次加入cluster的时候,如果log中报告不兼容文件版本,那需要NameNode执行?Hadoopnamenode-format?操作格式化磁盘。A)正确B)错误答案:错解析:首先明白介绍,什么ClusterIDClusterID添加了一个新的标识符ClusterID用于标识集群中所有的节点。当格式化一个Namenode,需要提供这个标识符或者自动生成。这个ID可以被用来格式化加入集群的其他Namenode。二次整理有的同学问题的重点不是上面分析内容:内容如下:这个报错是说
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度标砖及环保涂料采购合同3篇
- 2024年版东莞市土地使用权出让合同
- 2025厂房买卖合同-航空航天产业基地产权交易及配套设施移交3篇
- 2024标准二手车交易协议样本一
- 2024校长任期管理与绩效提升聘用合同规范文本2篇
- 2024标准个人劳务合作协议模板版
- 2024年食品包装OEM供应协议
- 2025年度教育机构实验室场地借用及设备维护协议3篇
- 2024年阁楼销售协议综合版版B版
- 2024年网球赛事:场馆租借合同3篇
- 低空经济公司设立可行性分析
- 2024新能源风电场集电线路施工方案
- 2023-2024学年江西省吉安市吉州区八年级(上)期末数学试卷(含解析)
- 建筑工程周转材料及保证措施
- 铁路调车作业技能培训课件
- 临床医学研究的基本原则
- 市属国有企业全资子公司管理办法
- 摄影师的年度述职-捕捉美好定格永恒
- 《中国的河流(第2课时 滚滚长江)》示范课教学设计【湘教版八年级地理上册】
- 酒店婚庆可行性方案
- 教师法律法规讲座课件
评论
0/150
提交评论