第五章 数据处理与可视化表达及答案_第1页
第五章 数据处理与可视化表达及答案_第2页
第五章 数据处理与可视化表达及答案_第3页
第五章 数据处理与可视化表达及答案_第4页
第五章 数据处理与可视化表达及答案_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章数据处理与可视化表达[复制]基本信息:[矩阵文本题]*姓名:________________________班级(1,2,3,4,5,6,7):________________________一、单选题1.从互联网产生大数据的角度来看,大数据具有的特征是()[单选题]*A.“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity)(正确答案)B.样本渐趋于总体,精确让位于模糊,相关性重于因果C.分布式存储,分布式并行计算D.没有特征2.下列可以用于分析数据趋势的是()[单选题]*A.饼图B.折线图(正确答案)C.动态热力图D.词云图3.数据分析的方法不包括()[单选题]*A线性分析(正确答案)B.关联分析C.聚类分析D.数据分类4.下列关于大数据的特征,说法正确的是()。[单选题]*A.数据价值密度高B.数据类型少C.数据基本无变化D.数据体量巨大(正确答案)5.数据特征探索的主要任务是对数据进行预处理,以下不属于该过程的是()。[单选题]*A.数据清洗B.异常数据处理C.数据缺失处理D.数据分类处理(正确答案)6.海军军官通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的()[单选题]*A.在数据基础上倾向于全体数据而不是抽样数据B.在分析方法上更注重相关分析而不是因果分析(正确答案)C.在分析效果上更追究效率而不是绝对精确D.在数据规模上强调相对数据而不是绝对数据7.大数据时代已经在悄悄地改变我们的日常生活,也使人们日常生活更为便捷,如移动支付、网络约车出行、网络购物、网络预约挂号等。以下不属于大数据分析的是()。[单选题]*A.特征探索B.关联分析C.聚类与分类D.建模分析(正确答案)8.电子警察采用拍照的方式来约束车辆的行为,其拍照的过程属于()。[单选题]*A.数据分析B.数据采集(正确答案)C.数据分类D.数据可视化表达9.某超市曾经研究销售数据,发现买商品A的人购买商品B的概率很大,这种属于数据的()。[单选题]*A.聚类分析B.关联分析C.分类分析D.回归分析(正确答案)10.数据采集的非本方法包括()、网络数据采集法和其他数据采集法。[单选题]*A.数据库采集法B.访问记录采集法C.数据目录采集法D.系统日志采集法(正确答案)11.下列关于聚类分析的说法,错误的是()[单选题]*A.可以从数据点集合中随机选择K个点作为初始的聚集中心B.对其他的每个数据点,以此判断其与K个中心点的距离,距离最近的表明它属于这项聚类C.聚类分析,必须先设定分类的标准,否则无法准确分类(正确答案)D.重新计算新的聚簇集合的平均值既中心点12.K-平均算法属于()分析方法。[单选题]*A.聚类(正确答案)B.关联C.分类D.回归13.网络数据采集法,主要通过网络爬虫或网站公开API的方式获取,网络爬虫从网页的())开始获取。[单选题]*A.HTMLB.WWWC.URL(正确答案)D.XML14.大数据时代,数据应用的关键是()[单选题]*A.教据收集B.数据存储C.数据分析(正确答案)D.数据再利用15.为了弘扬和传承中华民族勤俭节约的传统美德,引导同学们进一步深化节约粮食的意识和行为习惯,学生会开展了“我为食堂提建议”的活动。请根据学生会开展该活动的几个步骤,排出最合理的顺序()。

①根据数据分析结果,撰写数据分析报告,对食堂提出合理化建议;②学生会成员去学校食堂收集数据,并制作调查问卷的题目;③利用图表形式直观展示分析数据;④对问卷进行回收整理,将无效的问卷进行剔除;⑤学生会成员对就餐同学们进行问卷调查;⑥对调查数据和食堂数据进行分析与处理。[单选题]*A.②⑤④⑥③①(正确答案)B.②④⑤③⑥①C.⑤②④⑥③①D.⑤④②③⑥①16.某超市曾经研究销售数据,发现购买方便面的顾客购买火腿肠、卤蛋等商品的概率很大,进而调整商品摆放位置。这种数据分析方法是()[单选题]*A.聚类分析B.分类分析C.关联分析(正确答案)D.回归分析17.小智通过网络问卷收集同学们课外阅读时间的百分比分布情况,下列可以用于分析调查数据的是()[单选题]*A.饼图(正确答案)B.折线图C.动态热力图D.词云图18.为了展示股票价格的变动趋势,最好选择()[单选题]*A.饼图B.折线图(正确答案)C.动态热力图D.词云图19.“扫描历史数据,并对每项数据进行频率次数统计”是()数据分析算法的第一步。[单选题]*A.关联分析(正确答案)B.K-mean聚类C.贝叶斯分类D.特征分析20.为了统计春节晚会的热频词,最好选择()[单选题]*A.饼图B.折线图C.动态热力图D.词云图(正确答案)二、判断题1.利用Python采集网络数据时,导入扩展库的关键字是import。[判断题]*对(正确答案)错2.从互联网产生大数据的角度来看,大数据具有的特征是“4V”特征:大量、多样、高价值密度、低速。[判断题]*对错(正确答案)3.网络数据采集法主要通过网络爬虫或网站公开API的方式获取网络爬虫,从网页的URL开始获取。[判断题]*对(正确答案)错4.数据采集的基本方法包括系统日志采集、网络数据采集等方法。[判断题]*对(正确答案)错5.数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征。[判断题]*对(正确答案)错6.K-平均算法属于聚类分析方法。[判断题]*对(正确答案)错7.可以用于分析数据趋势的可视化呈现类型包括折线图、分组柱形图、堆叠柱形图和柱线混合图等。[判断题]*对(正确答案)错8.Seaborn基于且高度依赖于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论