南开大学22春学期《大数据导论》在线作业答卷_第1页
南开大学22春学期《大数据导论》在线作业答卷_第2页
南开大学22春学期《大数据导论》在线作业答卷_第3页
南开大学22春学期《大数据导论》在线作业答卷_第4页
南开大学22春学期《大数据导论》在线作业答卷_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

22春学期(高起本1709-1803、全层次1809-2103)《大数据导论》在线作业-00001试卷总分:100得分:100一、单选题(共15道试题,共30分)1.大数据的最显著特征是()。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高答案:A2.下列不属于商业大数据类型的是A.传统企业数据B.机器和传感器数据C.社交数据D.电子商务数据答案:B3.下面哪一项不是中国发展大数据产业的基础()。A.信息化积累了丰富的数据资源B.大数据技术创新取得明显突破C.大数据应用推动势头良好D.大数据产业支撑薄弱答案:D4.()是MicrosoftOffice的核心组件A.SQLC.PPTD.EXCEL答案:D5.以下不是数据仓库基本特征的是()A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的答案:B6.第一个提出大数据概念的公司是()。A.麦肯锡公司B.谷歌公司C.微软公司D.脸谱公司答案:A7.购物篮问题是##的典型案例A.数据变换B.关联规则挖掘C.数据分类答案:B8.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段()。A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段答案:A9.GFS中的文件切分成()的块进行存储A.32MBC.128MBD.1G答案:B10.MapReduce中的Map和Reduce函数使用()进行输入输出A.key/value对B.随机数值C.其他计算结果答案:A11.哪个选项不属于大数据4V特点?A.VolumeB.ValidC.VarietyD.Value答案:B12.用于描述相等时间间隔下连续数据随时间变化趋势的是()A.折线图B.散点图C.条形图D.饼图答案:A13.下列哪个R语言扩展包可以创建带有点和边的网络图()A.ggplot2B.networkC.ggmapsD.animation答案:B14.数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段答案:C15.以下哪项不是数据可视化工具的特性()A.实时性B.简单操作C.更丰富的展现D.仅需一种数据支持方式即可答案:D二、多选题(共15道试题,共30分)16.可视化工具包括()A.ExcelB.GoogleChartC.GephiD.ppt答案:ABC17.可使用##,##,##进行光滑。A.最大值B.箱中位数C.箱边界D.箱均值答案:BCD18.以下可以用于数据可视化的是()。A.R语言B.ExcelC.RapidMinerD.Weka答案:ABCD19.关于R语言扩展包下列正确的是()A.network可创建带有点和边的网络图B.animation可制作一系列的图像并将它们串联起来做成动画C.ggmaps通过树图来可视化层次型数据D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具答案:AB20.借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。A.消费能力B.趋势报告C.购物结果答案:AB21.下列属于传统统计学展示方法的是()A.B.C.D.答案:ABC22.主流分布式计算平台有()A.googleB.IBMC.baiduD.Amazon答案:ABD23.大数据在医疗中的应用有()A.流行性疾病预防B.慢性病健康管理C.临床决策支持D.医疗器械研发答案:ABCD24.基于大数据的临床决策支持系统的架构包括A.支撑层B.大数据分析层C.网络层D.应用层答案:ABD25.数据分析的类型根据数据分析深度可以分为()A.描述性分析B.预测性分析sC.规则性分析答案:ABC26.大数据时代预测人类移动行为的数据特点是A.多样化B.数据量大C.维数高D.变化快答案:BCD27.百度大数据引擎主要包含三大组件()A.开放云B.数据工厂C.百度大脑。答案:ABC28.统计图表的可视化方法主要包括()A.散点图B.折线图C.条形图D.饼图答案:ABCD29.云计算是##,##,##的发展?,是虚拟化、效用计算、IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。A.流计算B.分布式计算C.并行计算D.网络计算答案:BCD30.大数据在教育中的应用A.网上公开课B.慕课C.智慧校园D.翻转课堂答案:ABCD三、判断题(共20道试题,共40分)31.数据的集中存储增加了数据泄露风险。答案:正确32.发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。答案:正确33.数据存在形式包括结构化数据和结构化数据答案:错误34.网络数据采集是利用互联网搜索引擎技术对数据进行针对性、行业性、精准性的抓取,并按照一定规则和筛选标准将数据进行归类,形成数据库文件的一个过程。答案:正确35.基于腾讯大社交平台独特基因,以海量用户为基础,以大数据洞察为核心,以智能定向推广为导向,广点通提供一站式网络推广营销平台。答案:正确36.原始数据的错误,异常值和冲突值必须被清理。典型的数据清洁操作包含三个阶段:审计数据发现差距,选择转换来修正差距,将转换应用到数据集。答案:正确37.在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等领域的半结构化数据和非结构化数据答案:正确38.广播变量在广播后可以修改答案:错误39.预测性分析(PredictiveAnalysis)用于预测未来事件发生的概率和演化趋势答案:正确40.数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据答案:正确41.用户可以容易地分析空间情况(道路网络内部)随时间的任何变化,或分析道路段上的交通状况的时间变化,或者利用历史数据跟踪单个车辆的即时状态。答案:正确42.离群点检测的任务是识别特征显著不同于其他数据的观测值,这样的点称为异常点、离群点或孤立点。答案:正确43.按照数据量的大小,可将数据分析分为内存级数据分析、Bl级数据分析和海量级数据分析答案:正确44.Facebook积累了超过12亿全球用户,其存储了大量的用户数据,这使它成为一个巨大的“数据乐园”。人们越来愈倾向于在Facebook上表达自己的情绪。答案:正确45.美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”答案:正确46.轨迹数据包含空间和时间属性,并且通常规模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论