数据挖掘智慧树知到课后章节答案2023年下国防科技大学

上传人：题*** IP属地：浙江上传时间：2023-11-08 格式：DOCX 页数：12 大小：13.45KB 积分：6 举报 版权申诉

已阅读5页，还剩7页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

数据挖掘智慧树知到课后章节答案2023年下国防科技大学国防科技大学

绪论单元测试

什么是KDD？()

A:领域知识发现

B:文档知识发现

C:数据挖掘与知识发现

D:动态知识发现

答案:数据挖掘与知识发现

“8,000”和“10,000”表示：()

A:智慧

B:知识

C:信息

D:数据

答案:数据

人从出生到长大的过程中，是如何认识事物的？()

A:先分类，后聚类

B:分类过程

C:先聚类，后分类

D:聚类过程

答案:先聚类，后分类

“8,000米是飞机飞行最大高度”与“10,000米的高山”表示：()

A:知识

B:数据

C:信息

D:智慧

答案:信息

“飞机无法飞过高山”表示：()

A:数据

B:信息

C:智慧

D:知识

答案:知识

第一章测试

下面哪个不属于数据的属性类型：()

A:序数

B:相异

C:区间

D:标称

答案:相异

只有非零值才重要的二元属性被称作：()

A:对称属性

B:非对称的二元属性

C:计数属性

D:离散属性

答案:非对称的二元属性

一所大学内的各年纪人数分别为：一年级200人，二年级160人，三年级130人，四年级110人。则年级属性的众数是：()

A:三年级

B:一年级

C:四年级

D:二年级

答案:一年级

杰卡德系数用来度量非对称的二进制属性的相似性。()

A:错B:对

答案:对

欧式距离用来度量连续数值属性数据的相似性。()

A:对B:错

答案:对

第二章测试

卡方测试用来度量离散标称属性数据的相关性。()

A:错B:对

答案:对

相关系数用来度量标称属性数据的相关性。()

A:对B:错

答案:错

所谓高维数据，指的是数据属性很多。()

A:对B:错

答案:对

假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为：()

A:0.821

B:1.458

C:0.716

D:1.224

答案:0.716

假设12个销售价格记录组已经排序如下：5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频（等深）划分时，15在第几个箱子内？()

A:第二个

B:第三个

C:第四个

D:第一个

答案:第二个

第三章测试

考虑两队之间的足球比赛：队0和队1。假设65%的比赛队0胜出，剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场，而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为()

A:0.75

B:0.35

C:0.5738

D:0.4678

答案:0.5738

Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法，待分样本的分类结果取决于各类域中样本的全体。()

A:对B:错

答案:错

朴素贝叶斯分类器的朴素之处在于：（）

A:只能处理低维属性

B:属性之间的条件独立性假设

C:分类效果一般

D:只能处理离散型属性

答案:属性之间的条件独立性假设

可以利用概率统计方法估计数据的分布参数，再进一步估计待测试数据的概率，以此来实现贝叶斯分类。（）

A:错B:对

答案:对

贝叶斯分类器对离群点敏感。（）

A:错B:对

答案:错

第四章测试

决策树中不包含一下哪种结点，()

A:内部结点（internalnode）

B:根结点（rootnode)

C:叶结点（leafnode）

D:外部结点（externalnode）

答案:外部结点（externalnode）

一个决策树包括如下哪些要素（）

A:叶子

B:分支

C:各选项均有误

D:测试节点

答案:叶子

;分支

;测试节点

以下哪个算法是分类算法（）

A:EM

B:K-Means

C:ID3

D:DBSCAN

答案:ID3

采用决策树分类算法，连续数据如何处理？（）

A:各说法均正确

B:连续数据每2个值之间形成分裂

C:选择最佳划分点分裂

D:连续数据离散化

答案:选择最佳划分点分裂

;连续数据离散化

决策树的父节点和子节点的熵的大小关系是什么？（）

A:决策树的父节点更大

B:根据具体情况而定

C:两者相等

D:子节点的熵更大

答案:子节点的熵更大

第五章测试

当不知道数据所带标签时，可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离？()

A:聚类

B:关联分析

C:分类

D:隐马尔可夫链

答案:聚类

简单地将数据对象集划分成不重叠的子集，使得每个数据对象恰在一个子集中，这种聚类类型称作（）

A:非互斥聚类

B:划分聚类

C:模糊聚类

D:层次聚类

答案:划分聚类

下面说法正确的是

()

A:K-modes能够解决离散数据的聚类问题

B:K-means++能够解决初始点影响聚类效果的问题

C:K-means算法能够解决有离群点的聚类问题

D:K中心点能够解决有离群点的聚类问题

答案:K-modes能够解决离散数据的聚类问题

;K-means++能够解决初始点影响聚类效果的问题

;K中心点能够解决有离群点的聚类问题

关于k-means算法，正确的描述是：（）

A:能找到任意形状的聚类

B:初始值不同，最终结果可能不同

C:每次迭代的时间复杂度是O(n^2)，其中n是样本数量

D:不能使用核函数(kernelfunction)

答案:初始值不同，最终结果可能不同

K-Means算法中的初始中心点：（）

A:必须在每个簇的真实中心点的附近

B:可随意设置

C:直接影响算法的收敛结果

D:必须足够分散

答案:直接影响算法的收敛结果

第六章测试

logistic回归对噪声敏感。（）

A:对B:错

答案:对

经典的逻辑回归可以解决非线性的分类问题。（）

A:错B:对

答案:错

分类和回归都可用于预测，分类的输出是离散的类别值，而回归的输出是连续数值。()

A:对B:错

答案:对

逻辑回归正则化主要包括L1正则化和L2正则化。（）

A:错B:对

答案:对

数据规范化能够提高逻辑回归算法参数学习的效率。（）

A:对B:错

答案:对

第七章测试

某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的哪类问题？()

A:关联规则发现

B:聚类

C:自然语言处理

D:分类

答案:关联规则发现

数据挖掘的主要任务是从数据中发现潜在的规则，从而能更好的完成描述数据、预测数据等任务。（）

A:错

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

数据挖掘智慧树知到课后章节答案2023年下国防科技大学

文档简介

温馨提示

最新文档

评论

数据挖掘智慧树知到课后章节答案2023年下国防科技大学

文档简介

温馨提示

最新文档

评论

相关文档