




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、20 春学期( 1709 、 1803 、1809 、1903 、1909 、 2003 )大数据开发技术(一)在线作业 DBD20 春学期( 1709 、 1803 、 1809 、 1903 、 1909 、 2003)大数据开发技术(一)在线作业 单选题 1.HDFS 中 ClientProtocol 的 () 方法 通知名称节点关闭文件 A.close B.finish C.exit D.complete 正确答案 :D 2.() 可解决 HDFS 中名称节点运行 期间 EditLog 不断变大的问题 A.NameNodeB. SecondaryNameNode C.DataNode
2、D.Block 正确答案 :B 3. 优点是性能好 ( 高并发 ), 灵活性高 , 复杂性低 , 数据结构灵 活 提供嵌入式文档功能的数据库是 () A. 列族数据库 B. 键值 数据库 C. 图数据库 D. 文档数据库 正确答案 :D 4. 名称节点 和数据节点之间则使用 () 协议进行交互 A. 名称节点 B. 第二 名称节点 C. 数据节点 D.TCP 正确答案 :C 5. 以下哪种数据库 适合于批量数据处理和即席 查询 () A.MySQL B.OracleC. Hbase D.NosSQL 正确答案 :C 6. 以下哪种不属于为大数据 时代提供关键技术支撑的信息科技变化 () 。A.
3、 网络宽带不断增加 B. 存储设备容量不断增加 C.CPU 处 理能大幅提升 D. 存储设备尺寸不断减小 正确答案 :D 7.UMP 系通过 () 来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能 A.Controller 服务器 B.Procy 服务器 C. 愚公系统 D.Agent 服务器 正确答 案 :A 8.HBase 的客户端并 不依赖 Master, 而是通过 () 来获 得 Region 位臵信息 , 大多数客户端甚至从来不和 Master 通 信 , 这种设计 方式使得 Master 负载很小 A.MasterB. RegionC.Zoo
4、keeper D.Chubby 正确答案 :C 9.Pregel 计算 模型以 () 作为输入 A. 有向图 B. 无向图 C. 矢量图 D. 树 正确 答案 :A 10. 在做人口调查时 , 采用对一个总样本为 1 亿人口 的数据随机抽取 1000 人进行抽样调查体现了大数据的哪种思 维方式 () 。A. 相关而 非因果 B. 全样而非抽样 C. 效率而非精确 D. 全 面而非特别 正确答案 :B 11. 每个 Region 服务器存储 () 个 Region A.1 B.10 C.10-1000 D.0 正确答案 :C 12.SQLAzure 体系结构层中哪层相当于网关 , 相当于普通 W
5、eb 系统的逻辑 层 A.ClientLayer B.ServicesLayer C.PlatformLayerD. InfrastructureLayer 正确答案 :B 13.HDFS 中 ClientProtocal 的 () 方法可以查找下一个数据块 A.getBlock B.getBlockLocations C.getLocationD.nextBlock 正确答案 :B 14.1 秒定律体现了大数据的哪个 特征 () 。A. 数据量大 B. 数据产生速度快 C. 数据存储快 D. 数据计 算快 正确答案 :B 15. 批处理系统关注 (), 流处理系统关注 () 。A. 吞吐率,
6、延时 B. 延时,吞吐率 C. 延时,速度 D. 速 度,吞吐率 正确答案 :A 16. 大数据摩尔定律体现了大数据的 哪个体征 () 。A. 数据体量大 B. 数据产生速度快 C. 数据种类多 D. 数据 计算快 E. 数据价值高 正确答案 :A 17.HDFS 中 NameNode将 从 SecondaryNameNode 接收到的新的 FsImage 替换旧的 FsImage 文件 , 同时将 edit.new 替换 # 文件 A.editB. edit.old C.FsImage D.EditLog 正确答案 :D 18.MongoDB 将数据存储为一个 () A. 关系 B. 属性
7、C. 字段 D. 文档 正确答 案 :D 19.NoSQL 中的 CAP 理论中的 C 代表 () A. 一致性 B. 可用性 C. 分区容忍性 D. 可扩展性 正确答案 :A 20. 以下属于 Hadoop2.0 的特性是 () 。A.MapReduce B.HDFS C.YARN D.SPARK 正确答案 :C 21. 日志的获取属于流计算的哪个步骤 () 。A. 实时采集 B. 实时存储 C. 实时计算 D. 实时查询 正确答 案 :A 22. 以下说法不正确的是 () 。A.Zookeeper 提供分布式锁之类的基本服务 B.Mahout 提 供了分布式存储服务 C.Flume 提供了
8、日志管理服务 D.Sqoop 主要被用于数据交互操作 正确答案 :B 23.UMP 系统借助于 () 来实现各个节点之间的 通信 A.Mnesia B.LVS C.RabbitMQ D.Zookeeper 正确答案 :C 24.Hbase 中采用 () 保证系统出错 时及时恢复 A.MemStore B.Hlog C.StoreFileD. 客户端 正确 答案 :B 25. 以下亚马逊的产品中哪个是分布式内存缓存 A.ElastiCache B.RDS C.DynamoDB D.Redshift正确答案 :A26.Storm 中如果要让所有的 Tuple 都发送到同一个 Task 中 , 应该
9、采用哪种 StreamGroupings() 。A.ShuffleGrouping B.AllGrouping C.GlobalGrouping D.FiedlsGrouping 正确答案 :C 27.NoSQL 中的 CAP 理论中的 A 代表 () A. 一致性 B. 可用性 C. 分区容忍性 D. 可扩展性 正 确答案 :B 28.UMP 系统借助于 () 来实现集群内部的负载均衡 A.Mnesia B.LVS C.RabbitMQ D.Zookeeper 正确答案 :B 29. 应用于专门用于处理具有高度相互关联关系的数据 , 比较适合 于社交网络的 数据库是哪种 () A. 列族数据
10、库 B. 键值数据库C. 图数据库 D. 文档数据库 正确答案 :C 30. 以下哪种属于键 值数据库 () A.MongoDB B.Redis C.Hbase D.Neo4j 正确答 案 :B 多选题 1.HDFS 要实现的目标 A. 流数据读写 B. 大数据集的操作 C. 复杂的文件模型D. 强大的跨平台兼容性 正确答案 :A 2. 以下哪些是云数据库 产品 () A.Dynamo B.SimpleDB C.RDSD.SQLServer 正确答 案 :A 3. 以下亚马逊的产品中哪个属于存储部分A.EC2 B.EBSC. S3 D.ELB 正确答案 :B 4. 以下哪些是数据可视化地图工具
11、 () A.GoogleFusionTables B.ModestMaps C.LeafletD. GoogleChartAPI 正确答案 :A 5. 流计算处理流程三个主要 阶段是 () 。A. 实时采集 B. 实时存储 C. 实时计算 D. 实时查询 正确答 案 :A 6.Hbase 提供了哪些访问接口 ? A.Pig B.Hive C.Zookeeper D.JavaAPI 正确答案 :A 7.NoSQL 数据库与关系 数据库相比有哪些优势 () A. 支持事务 ACID 四性 B. 可以支 持超大规模数据存储 C. 以完善的关系代数理论作为基础 D. 具 有强大的横向扩展能力 正确答案
12、 :B 8. 大数据的特征是 () 。A. 数据体量大 B. 数据产生速度快 C. 数据种类多 D. 数据 计算快 E. 数据价值高 正确答案 :A 9. 以下亚马逊的产品中哪 个属于计算部分 A.EC2 B.EBS C.S3 D.ELB 正确答案 :A 10. 以下属于 Hadoop 的安装方式的有 () 。A.单机模式 B. 多机模式 C. 分布式模式 D. 并行模式 E. 伪 分布式模式 正确答案 :A 判断题 1. 云数据库不可以满足企业动态变化的数据存储需求T.对 F. 错 正确答案 :F 2.Map 函数的任务就是将输入的一系列 具有相同键的键值对以某种方式组合起来 , 输出处理后
13、的键值 对 , 输出结果会合并 成一个文件。T.对 F. 错 正确答案 :F 3.HDFS 中数据节点会根据客户 端或者是 名称节点的调度来进行数据的存储和检索 , 并且向 名称节点定期发送自己所存储 的块的列表 T. 对 F. 错 正确答 案 :T 4. 在传统的文件系统中 , 为了提高磁盘读写效率 , 一般 以数据块为单位 T. 对 F. 错 正确答案 :T 5.Hadoop 平台在大 数据发展的成熟期时开始大行其道 T. 对 F. 错 正确答案 :T 6. 对于每个顶点而言 ,Pregel 只保存一份顶点值和边值 , 但是 , 会保存两份“标志位”和输入消息队列 , 分别用于当前超步 和下一个超步 T. 对 F. 错 正确答案 :T 7.Hbase 中表在垂直 方向由一个或者多个列族组成 , 一 个列族中可以包含任意
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 设备维修值班管理制度
- 设备设施日常管理制度
- 设计公司事故管理制度
- 设计园林公司管理制度
- 证书介质领用管理制度
- 诊所医保网络管理制度
- 诊所营销日常管理制度
- 试验质量奖惩管理制度
- 财务资金计划管理制度
- 财政收费票据管理制度
- 期末总动员暨诚信教育主题班会
- 医学检验进修汇报
- 2025春季学期河南电大本科补修课《民法学#》一平台无纸化考试(作业练习+我要考试)试题及答案
- 《数据分析与可视化》课件
- 2024年贵州省黎平县事业单位公开招聘医疗卫生岗笔试题带答案
- 《关于智能家居系统》课件
- 煤矿重大灾害治理顶层设计方案
- 从患者心理出发优化医患沟通
- 灰尘的旅行测试题及答案
- 孵化器员工合同协议
- 2024年云南省初中学业水平考试生物学试题卷
评论
0/150
提交评论