版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据分析及应用智慧树知到课后章节答案2023年下云南大学云南大学
第一章测试
大数据的英文描述是()
A:LargedataB:HeavydataC:BigdataD:Greatdata
答案:Bigdata
下面最大的储存单位是()
A:PBB:TBC:GBD:KB
答案:PB
大数据之父是()
A:詹姆斯·高斯林B:查尔斯·巴赫曼C:姚期智D:维克托·迈尔-舍恩伯格
答案:维克托·迈尔-舍恩伯格
大数据的特点包括()
A:ValueB:VelocityC:VolumeD:Variety
答案:Value;Velocity;Volume;Variety
第一次正式提出大数据概念和第一次用社会调查的方式分析大数据对人们生活影响的期刊是()和()
A:PNASB:ScienceC:NatureD:Cell
答案:Science;Nature
大数据是只和互联网相关的计算机技术。
A:错B:对
答案:错
企业中大部分的数据都是非结构化数据。
A:对B:错
答案:对
大数据技术的基础是由阿里巴巴首先提出的。
A:对B:错
答案:错
大数据人才需要数学、统计学、数学分析、商业分析和自然语言处理的多方面的学习。
A:对B:错
答案:对
大数据对网络安全没有威胁。
A:对B:错
答案:错
第二章测试
目前,企业的数据架构存在的最大比例问题是()
A:高耗能B:资源利用率低C:运营成本高D:拓展性差
答案:拓展性差
目前,企业数据分析处理面临的主要问题是缺少数据全方位分析方法。
A:对B:错
答案:对
地图导航根据以往的行程记录,绘制了最优路程,标明了可能堵车的地点,这表现了大数据分析理念中的()
A:注重相对性而不是绝对性B:注重相关性而不是因果性C:注重效率而不是准确D:注重全体而不是局部
答案:注重相关性而不是因果性
最早提出大数据研发计划的国家是()
A:中国B:日本C:法国D:美国
答案:美国
大数据可能被运用的行业有()
A:教育B:医疗C:农业D:金融
答案:教育;医疗;农业;金融
2015年9月18日云南省启动我国首个大数据综合试验区的建设工作。
A:对B:错
答案:错
大数据的价值密度很高。
A:错B:对
答案:错
日本政府将IT产业,尤其是大数据及云计算作为促进经济增长,解决内部矛盾一个关键。
A:错B:对
答案:对
非结构化数据对企业也富有价值。
A:错B:对
答案:对
企业的日数据生成量可达到1TB。
A:对B:错
答案:对
第三章测试
HDFS中文件存储的基本节点是()
A:BaseNodeB:DataNodeC:WholeNodeD:NameNode
答案:DataNode
下面不属于ETL的功能是()
A:抽取B:加载C:翻译D:转换
答案:翻译
自然语言处理的范畴包括()
A:中文自动分词B:关联分析C:机器翻译D:离群值检测
答案:中文自动分词;机器翻译
ApacheHadoop所涉及的核心技术包括()
A:MapReduceB:HbaseC:HDFSD:EMC
答案:MapReduce;Hbase;HDFS
HDFS的主要结构包括()
A:ServerB:DataNodeC:ClientD:NameNode
答案:DataNode;Client;NameNode
下列算法中属于聚类算法的是()
A:AprioriB:DBSCANC:k-distanceD:K-means
答案:DBSCAN;K-means
Hadoop可以运行在任何普通的PC机上。
A:错B:对
答案:对
Client是获取分布式文件的应用程序
A:错B:对
答案:对
Hadoop是一种集中式存储和计算技术。
A:错B:对
答案:错
聚类之前的样本没有类别
A:错B:对
答案:对
第四章测试
Modeler在2009年被()收购后对产品的性能和功能进行了大幅度的改进和提升。
A:IBMB:谷歌C:微软D:苹果
答案:IBM
Modeler数据挖掘功能将复杂的统计方法和()技术结合到一起。
A:大数据B:信息安全C:软件工程D:机器学习
答案:机器学习
Modeler可以将模型保存为()的通用格式,支持对其进行二次开发。
A:PBB:PKLC:CKPTD:PMML
答案:PMML
下面()是基本数据流的节点。
A:导出节点B:选择节点C:导入节点D:变量文件节点
答案:导出节点;选择节点;变量文件节点
Modeler中的常用节点选项面板包括:()。
A:字段选项B:建模选项C:图形选项D:记录选项E:源
答案:字段选项;建模选项;图形选项;记录选项;源
Modeler和Statistics是相互独立的两个数据分析软件。
A:错B:对
答案:错
Modeler可以对可变长度记录进行数据的处理。
A:对B:错
答案:对
Modeler能通过第三方提供开放的ODBC与其他数据库连接。
A:对B:错
答案:对
Modeler不支持生成散点图、分布图等来反映数据的特征。
A:对B:错
答案:错
Modeler支持数据挖掘CRISP-DM的标准流程。
A:对B:错
答案:对
第五章测试
协方差分析中,如果两个变量的变化趋势一致,那么这两个变量之间的协方差就是()。
A:负值B:不清楚C:正值D:0
答案:正值
在抽样调查中,如果样本数量N为()时,就称为大样本。
A:N>=20B:N>=30C:N>=100D:N>=50
答案:N>=30
在统计调查中,()误差是由观察、测量或计算等原因所造成的。
A:抽样误差B:登记性误差C:系统误差D:随机性误差
答案:登记性误差
常见的数据变换操作包括()。
A:规范化B:属性构造C:数据规约D:聚集E:平滑
答案:规范化;属性构造;数据规约;聚集;平滑
平滑处理在科学研究中广泛使用,常用方法有()。
A:单纯移动平均B:聚类法C:滤波法D:加权移动平均
答案:单纯移动平均;滤波法;加权移动平均
维数归约的主要方法有()。
A:逐步向前选择B:逐步向后删除C:逐步向前删除D:逐步向后选择
答案:逐步向前选择;逐步向后删除
抽样极限又称置信区间,是指一定概率下抽样误差的真实范围。
A:对B:错
答案:错
数据规约是指在尽可能保持数据原貌的前提下,最大限度地精简属性数量。
A:对B:错
答案:错
聚集也称为数据汇总,用来构建数据立方体。
A:对B:错
答案:对
在概率论和统计学中,协方差用于衡量两个变量的平均误差。
A:对B:错
答案:错
第六章测试
在计算机领域,()用来描述数据的起源或者出处。
A:来源B:溯源C:源头D:缘由
答案:溯源
由于采集设备异常,造成接收的数据取值不合理,是属于()类型的数据质量问题。
A:数据失效B:空值C:缺少完整性约束D:噪声数据
答案:噪声数据
数据质量的相关技术中,()被用来检查文件系统或者数据库中数据的过程。
A:数据剖析B:数据集成C:数据清洁D:数据采集
答案:数据剖析
在四种数据集成技术中,()技术可以实现对各个数据源数据的抽取、清洗、转换和复制。
A:基于中间件的数据集成模型B:联邦数据库系统结构C:基于数据仓库的数据集成模型D:MPP数据库存储与处理架构
答案:基于数据仓库的数据集成模型
数据剖析的分类是()。
A:非结构化数据B:多源数据C:单源数据D:结构化数据
答案:多源数据;单源数据
针对“空值”的数据清洁方法有()。
A:均值填充B:概率统计值填充C:全局变量填充D:人工填写
答案:均值填充;概率统计值填充;全局变量填充;人工填写
数据溯源追踪的主要方法有标注法和反向查询法。
A:对B:错
答案:对
AHP质量评估方法一般是应用于质量指标权重值的确定。
A:对B:错
答案:对
数据质量的定性评估主要依靠支持者的主观判断。
A:错B:对
答案:错
综合评估方法结合了定性评估和定量评估的优点,适用范围更广泛。
A:错B:对
答案:对
第七章测试
使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的()任务?
A:探索性数据分析B:建模描述C:预测建模D:寻找模式和规则
答案:探索性数据分析
英文单词缩写KDD表示()含义?
A:文档知识发现B:动态知识发现C:数据挖掘与知识发现D:领域知识发现
答案:数据挖掘与知识发现
以下()操作会降低Apriori算法的挖掘效率。
A:项数减少B:事务数减少C:减小硬盘读写速率D:支持度阈值增大
答案:减小硬盘读写速率
寻找数据集中的关系是为了寻找精确、方便并且有价值地总结出数据的某一特征的表示,这个过程包括了以下()步骤?
A:决定要使用的表示的特征和结构B:决定用什么样的数据管理原则以高效地实现算法C:选择一个算法过程使评分函数最优D:决定如何量化和比较不同表示拟合数据的好坏
答案:决定要使用的表示的特征和结构;决定用什么样的数据管理原则以高效地实现算法;选择一个算法过程使评分函数最优;决定如何量化和比较不同表示拟合数据的好坏
下面列出的条目中,(
)是数据仓库的基本特征。
A:数据仓库的数据是反映历史变化的B:数据仓库是面向主题的C:数据仓库的数据是集成的D:数据仓库是面向事务的E:数据仓库的数据是相对稳定的
答案:数据仓库的数据是反映历史变化的;数据仓库是面向主题的;数据仓库的数据是集成的;数据仓库的数据是相对稳定的
关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。
A:错B:对
答案:错
给定关联规则AàB,意味着:若A发生,B也会发生。
A:错B:对
答案:错
Apriori算法产生的关联规则总是确定的
A:对B:错
答案:对
对于项集来说,置信度没有意义。
A:错B:对
答案:对
数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。
A:对B:错
答案:对
第八章测试
关于相关系数,下面不正确的描述是
A:当0≤|r|≤1时,表示两变量不完全相关B:当r=0时,表示两变量间无相关C:如果自变量增长引起因变量的相应增长,就形成正相关关系D:两变量之间的相关关系是单相关
答案:当r=0时,表示两变量间无相关
当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在()关系
A:直线正相关B:直线负相关C:曲线负相关D:曲线正相关
答案:直线正相关
评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示()。
A:中等相关B:无相关C:低度相关D:高度相关
答案:中等相关
身高和体重之间的关系是()
A:严格的依存关系B:共变关系C:无关系D:函数关系
答案:共变关系
下列关系中,属于正相关关系的是()
A:身高与体重B:商品的零售额和流通费率C:产品与单位成本D:正常商品的价格和需求量
答案:身高与体重
当所有的观察值y都落在直线yc=a+bx上时,则x与y之间的相关系数为()
A:-1B:r=1C:0D:r=0
答案:r=1
两变量X和Y的相关系数为0.8,则其回归直线的判定系数为()
A:0.9B:0.8C:0.5D:0.64
答案:0.64
在完成了构造与评价一个回归模型后,我们可以()
A:以给定的自变量的值估计因变量的值B:估计未来所需样本的容量C:计算相关系数和判定系数D:以给定的因变量的值估计自变量的值
答案:以给定的自变量的值估计因变量的值
在回归分析中,两个变量()
A:都不是随机变量B:自变量是随机变量C:都是随机变量D:因变量是随机变量
答案:因变量是随机变量
以下指标恒为正的是()
A:斜率bB:截距aC:复相关系数D:相关系数r
答案:复相关系数
第九章测试
科学可视化主要关注的是()维现象的可视化。
A:三维B:N维C:二维D:一维
答案:三维
不同用户对数据可视化的认知有所区别,设计人员认为可视化是()。
A:信息编码方式B:用户情感的表示C:表述想法的工具D:漂亮的视觉表现
答案:漂亮的视觉表现
作为电商企业,以下()图可以有效地提供不同商品的销售和趋势情况。
A:热力图B:条形图和线图的组合图C:平行坐标图D:气泡图
答案:条形图和线图的组合图
数据可视化分为()与()两个方向。
A:图像可视化B:内容可视化C:科学可视化D:信息可视化
答案:科学可视化;信息可视化
下面属于数据类别的是()。
A:数量B:位置C:关系D:序列
答案:数量;位置;关系;序列
数据可视化是借助于图形化手段,清晰有效地传达与沟通信息。
A:对B:错
答案:对
气泡图只能够表示3个变量之间的关系。
A:错B:对
答案:错
平行坐标图是利用色块大小,颜色来传达信息的。
A:对B:错
答案
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 房地产买卖合同与房地产买卖合同2024年
- 室内装潢设计委托协议范本
- 标准工地农民工劳务合同样本
- 土地承包种植合同
- 逻辑电平课程设计
- 代理金融课程合作协议
- 牛头刨床课程设计大图
- 短期雇佣协议书样本
- 家电采购合同样本
- 2024版餐馆经营权转让合同
- 博物馆安全管理规章制度
- 北京市居住区公共服务设施配套指标
- 2023通信原理期中考题及答案
- 一年级上数学一课一练-讲讲算算|沪教版
- 银行保险理财沙龙课件
- 中国智库名录类别索引-政府部门智库
- 包虫病防控方案
- GB/T 18513-2022中国主要进口木材名称
- GB/T 2573-2008玻璃纤维增强塑料老化性能试验方法
- GB/T 25217.7-2019冲击地压测定、监测与防治方法第7部分:采动应力监测方法
- 科技时代人们的时间(孙宏)
评论
0/150
提交评论