20秋学期《大数据导论》在线作业i附标_第1页
20秋学期《大数据导论》在线作业i附标_第2页
20秋学期《大数据导论》在线作业i附标_第3页
20秋学期《大数据导论》在线作业i附标_第4页
20秋学期《大数据导论》在线作业i附标_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、20 秋学期(1709、1803、1809、1903、1909、2003 2009 )大数据导论在线作业试卷总分MoO得分:92一、单选题(共15道试题,共30分)1 大数据的最显著特征是()OA. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度高答案:A2. 下列哪个R语言扩展包可以创建带有点和边的网络图()A. ggpIot2B. networkC. ggmapsD. animat i On答案:B更多加微boge306193. 下列不属于GOOgIe云计算平台技术架构的是()A. 并行数据处理MaPRedUCeB. 分布式锁ChUbbyG结构化数据表BigTabIeD

2、.弹性云计算EC2答案:D4. 基础设施即服务的英文简称是A. IaaSB. PaaSC. SaaS答案:A5. PaaS是()的简称A. 软件即服务B. 平台即服务C. 基础设施即服务D. 硬件即服务答案:B6. MaPRedUCe中的MaP和RedUCe函数使用()进行输入输出A. key/vaI Ue 对B. 随机数值G其他计算结果答案:A7. 用于描述相等时间间隔下连续数据随时间变化趋势的是OA. 折线图B. 散点图C. 条形图D. 饼图答案:A8. GFS中的文件切分成O的块进行存储A. 32MBB. 64MBC. 128MBD. 1G答案:B9. 以下不是数据仓库基本特征的是OA.

3、 数据仓库是面向主题的B. 数据仓库是面向事务的C. 数据仓库的数据是相对稳定的D. 数据仓库的数据是反映历史变化的答案:B10. 下面哪一项不是中国发展大数据产业的基础()oA信息化积累了丰富的数据资源B. 大数据技术创新取得明显突破C. 大数据应用推动势头良好D. 大数据产业支撐薄弱答案:D行IaaS是()的简称A. 软件即服务B平台即服务C. 基础设施即服务D. 硬件即服务答案:C12. 下列哪个工具常用来开发移动友好地交互地图OA. Leaf IetB. ViSUaL IyC. BPiZZa Pie ChartSD. GePh i答案:A13. 数据清洗的方法不包括A. 缺失值处理B.

4、 噪声数据清除C. 一致性检查D. 重复数据记录处理答案:D14. 数据仓库是随着时间变化的,下列不正确的是()A. 数据仓库随时间变化不断增加新内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合答案:C15. 下列不属于商业大数据类型的是A. 传统企业数据B. 机器和传感器数据C. 社交数据D. 电子商务数据答案:B二、多选题(共15道试题,共30分)16. 主流分布式计算平台有0A goog I eB. IBMC. baiduD. AmaZOn答案:ABD17. 一个HDFS集群

5、由一个#和#构成。此外,还有与这两个角色 之间作为沟通桥梁的客户端(CI ient) oA. 一个名字节点B. 若干个名字节点C. 一个数据节点D若干个数据节点答案:AD18. 关于R语言扩展包下列正确的是()A. network可创建带有点和边的网络图B. animat iOn可制作一系列的图像并将它们串联起来做成动画C. ggmaps通过树图来可视化层次型数据D. PrOtfOl io基于谷歌地图、OPenStreetMaP及其他地图的空间数据可视化工具答案:AB19. 大数据在电信中的应用有A基于用户、业务及流量分级的多维管控机制B. 精准的客户分析及营销C. 利用位置和轨迹信息服务社会

6、答案:ABC20. 去除噪声使得数据光滑的技术主要有:A. 分箱B. 回归C. 离群点分析答案:ABC21. 大数据在医疗中的应用有()A 流行性疾病预防B.慢性病健康管理G临床决策支持D. 医疗器械研发答案:ABCD22. 医疗大数据的来源主要包括0A.制药企业/生命科学B 临床医疗/实验室数据C. 费用报销/利用率D. 健康管理/社交网络答案:ABCD23. 下列正确的是OA. D3是数据驱动文件的缩写,是最流行的可视化库之一,它被 很多其他的表格插件所使用B. D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWOrker JL运行C. D3釆用的是SeleCt

7、OrS APl的第一级标准D基础R已经包含支撑包括协同图(Coplot)、拼接图(MOSaiCPlOt)和双标图等多类图形的功能。答案:ABCD24. 按照数据量的大小,可将数据分析分为0A. 内存级数据分析B. BI级数据分析C. 海量级数据分析D. 巨量级数据分析答案:ABC25. 基于大数据的临床决策支持系统的架构包括A. 支撐层B. 大数据分析层C. 网络层D. 应用层答案:ABD26. 常见的非结构化数据有()A. Web网页B. 即时消息C. 富文本文档D. 实时多媒体数据答案:ABCD27. 统计图表的可视化方法主要包括()A. 散点图B. 折线图C. 条形图D. 饼图答案:AB

8、CD28. 离群点检测的应用包括()等。A.欺诈检测B. 入侵检测C. 故障检测D 疾病的不寻常模式答案:ABCD29层次方法可以分为()A. K均值算法B. K中心点算法C. 凝聚法D. 分裂法答案:CD30.常见的分类方法有A. 决策树B. 贝叶斯网络C. 遗传算法D. FP算法答案:ABC三、判断题(共20道试题,共40分)31广义的SPark是指SPark生态系统,采用了四层架构。答案:正确数据挖掘方法侧重于从数据驱动的角度出发获取模式或规律。因 此,针对海量人类移动数据,数据挖掘方法可以发挥其挖掘模式 或规律的长处。答案:正确数据会吸引更多的潜在攻击者,成为更具吸引力的目标。答案:正

9、确34. 数据规约是在尽可能保持数据原貌的前提下,最大限度地精 简数据量答案:正确35. FP是一种最有影响的挖掘布尔关联规则频繁项集的算法 答案:错误36百度地图春节人口迂伏大数据在业界首次实现了全程、动 态、即时直观地展现中国春节前后人口大迁伏的轨迹与特征。答案:正确37. 空间视图提供了交通堵塞的概览答案:正确38. 基于大数据的智慧医疗系统的建立,能显著的提高医疗机构 的信息化水平,为医院、患者带去更多的利益。答案:正确39. 通常将统计指标的数值按时间顺序排列所形成的数列,称为 时间序列。答案:正确40. 数据采集,又称数据获取,是大数据生命周期的第一个环节, 通过RFID射频识别技术、传感器、交互型社交网络以及移动互 联网等方式获得的各种类型的结构化、半结构化及非结构化的海 量数据。答案:正确41. HDFS为海量的数据提供了存储;答案:正确42美国自然(NatUre)杂志专刊The next google,第一次正式提出“大数据”概念。答案:正确弹性是指有容错的机制,若一个RDD分片去失,SPark可以根据粗 粒度的日志数据更新记录的信息重构它。答案:正确44. 云存储中用户需要按需付费并使用存储服务答案:正确45. 宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。 答案:正确46. 非结构化数据是指非纯文本类数据,没有标准格式,无

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论