下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据分析与可视化知到智慧树章节测试课后答案2024年秋山东交通学院第一章单元测试
什么是KDD?()
A:领域知识发现
B:动态知识发现
C:文档知识发现
D:数据挖掘与知识发现
答案:数据挖掘与知识发现
数据挖掘分析是指从海量的数据中抽取感兴趣的(有价值的、隐含的、以前没有用但是潜在有用信息的)模式和知识。()
A:对B:错
答案:对数据挖掘分析的步骤包括()
A:模型评估
B:数据预处理
C:创建数据集
D:算法分析
答案:模型评估
;数据预处理
;创建数据集
;算法分析
当今社会,数据挖掘分析被广泛应用。()
A:对B:错
答案:对()是未来大数据分析的发展趋势。
A:简单
B:实时性
C:非结构化数据
D:可视化
答案:实时性
;非结构化数据
;可视化
第二章单元测试
关于描述统计,包括()。
A:其余选项都不是
B:相关分析
C:集中趋势分析
D:离中趋势分析
答案:相关分析
;集中趋势分析
;离中趋势分析
以下属于推断统计的是()。
A:其余选项都不是
B:集中趋势分析
C:参数估计
D:离中趋势分析
答案:离中趋势分析
在数据特征的测度中,描述分布的形状的值为()
A:偏态
B:中位数
C:峰态
D:众数
答案:偏态
;峰态
测度集中趋势就是寻找数据水平的代表值或中心值()
A:对B:错
答案:对四分位数可以用于顺序数据、数值数据和分类数据()
A:对B:错
答案:错
第三章单元测试
下面哪个属于映射数据到新的空间的方法?()
A:渐进抽样
B:特征加权
C:维归约
D:傅立叶变换
答案:傅立叶变换
将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()
A:数据流挖掘
B:分类和预测
C:频繁模式挖掘
D:数据预处理
答案:数据预处理
影响数据质量问题的因素有哪些()
A:可信性、可解释性
B:其余选项都对
C:准确性、完整性、一致性
D:相关性、时效性
答案:其余选项都对
数据预处理的常见方法有()
A:数据变换
B:数据集成
C:数据清洗
D:其余选项都不对
答案:数据变换
;数据集成
;数据清洗
数据预处理是指在对数据进行挖掘分析以前,需要对原始数据进行清理、集合和变换等一系列处理工作()
A:错B:对
答案:对
第四章单元测试
考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()
A:1,2,3,4
B:1,2,3,5
C:1,2,4,5
D:1,3,4,5
答案:1,2,4,5
频繁项集、频繁闭项集、最大频繁项集之间的关系是:()
A:频繁项集频繁闭项集=最大频繁项集
B:频繁项集=频繁闭项集=最大频繁项集
C:频繁项集=频繁闭项集最大频繁项集
D:频繁项集频繁闭项集最大频繁项集
答案:频繁项集频繁闭项集最大频繁项集
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()
A:自然语言处理
B:分类
C:聚类
D:关联规则发现
答案:关联规则发现
下面购物篮能够提取的3-项集的最大数量是多少()ID购买项
1牛奶,啤酒,尿布
2面包,黄油,牛奶
3牛奶,尿布,饼干
4面包,黄油,饼干
5啤酒,饼干,尿布
6牛奶,尿布,面包,黄油
7面包,黄油,尿布
8啤酒,尿布
9牛奶,尿布,面包,黄油
10啤酒,饼干
A:3
B:4
C:1
D:2
答案:3
Apriori算法的计算复杂度受(
)影响。
A:项数(维度)
B:事务数
C:事务平均宽度
D:支持度阀值
答案:项数(维度)
;事务数
;事务平均宽度
;支持度阀值
第五章单元测试
以下哪些算法是分类算法,()
A:EM
B:C4.5
C:DBSCAN
D:K-Mean
答案:C4.5
决策树中不包含一下哪种结点,()
A:内部结点(internalnode)
B:叶结点(leafnode)
C:外部结点(externalnode)
D:根结点(rootnode)
答案:外部结点(externalnode)
以下哪项关于决策树的说法是错误的()
A:子树可能在决策树中重复多次
B:寻找最佳决策树是NP完全问题
C:冗余属性不会对决策树的准确率造成不利的影响
D:决策树算法对于噪声的干扰非常敏感
答案:决策树算法对于噪声的干扰非常敏感
以下关于人工神经网络(ANN)的描述错误的有()
A:训练ANN是一个很耗时的过程
B:至少含有一个隐藏层的多层神经网络
C:可以处理冗余特征
D:神经网络对训练数据中的噪声非常鲁棒
答案:神经网络对训练数据中的噪声非常鲁棒
贝叶斯信念网络(BBN)有如下哪些特点,()
A:贝叶斯网络不适合处理不完整的数据
B:对模型的过分问题非常鲁棒
C:网络结构确定后,添加变量相当麻烦
D:构造网络费时费力
答案:对模型的过分问题非常鲁棒
;构造网络费时费力
如下哪些不是最近邻分类器的特点,()
A:可以生产任意形状的决策边界
B:分类一个测试样例开销很大
C:它使用具体的训练实例进行预测,不必维护源自数据的模型
D:最近邻分类器基于全局信息进行预测
答案:最近邻分类器基于全局信息进行预测
第六章单元测试
()这些数据特性都是对聚类分析具有很强影响的。
A:高维性
B:规模
C:稀疏性
D:噪声和离群点
答案:高维性
;规模
;稀疏性
;噪声和离群点
考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近邻,所以应该选择()的相似度计算方法。
A:余弦距离
B:共享最近邻
C:平方欧几里德距离
D:直接相似度
答案:共享最近邻
在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位数。
A:平方欧几里德距离
B:余弦距离
C:曼哈顿距离
D:Bregman散度
答案:曼哈顿距离
简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()
A:模糊聚类
B:划分聚类
C:层次聚类
D:非互斥聚类
答案:划分聚类
K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。()
A:对B:错
答案:错
第七章单元测试
可视化涉及到的学科包括()
A:统计分析
B:计算机图形学
C:数据挖掘
D:人机交互
答案:统计分析
;计算机图形学
;数据挖掘
;人机交互
若有一个数据集,每个数据点有5个属性,以下哪种可视化技术最适用于表示其属性凉凉之间的相关性呢?()
A:像
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年陇南道路运输货运考试题库
- 2025年佛山年货运从业资格证考试题大全
- 2025年运城货运从业资格仿真考题
- 2025年海口货运从业资格证考试模拟试题及答案解析
- 2025年芜湖货运从业资格考试题
- 2025年玉林货运从业资格证考试模拟考试
- 《债券基础知识》课件
- 《截交线与相贯线》课件
- 《插座安全使用》课件
- 贸易统计个人工作总结范文三篇
- 布加综合征护理
- 燃气高空作业专项施工方案
- 2022年内蒙古自治区高等职业院校对口招收中等职业学校毕业生单独考试英语试卷
- 产业园区招商合作协议书
- 《重组与突破》黄奇帆
- 安卓工程师招聘面试题与参考回答(某大型国企)2024年
- 高考倒计时 二百天大有可为-高三冲刺班会
- 2024版BIM模型可视化与仿真技术培训
- 电解质紊乱的诊断和治疗
- 浙江省浙南名校联盟2024-2025学年高二上学期期中联考物理试题 含解析
- 2025届云南省昭通市物理高二第一学期期末教学质量检测试题含解析
评论
0/150
提交评论