数据挖掘知到章节答案智慧树2023年国防科技大学_第1页
数据挖掘知到章节答案智慧树2023年国防科技大学_第2页
数据挖掘知到章节答案智慧树2023年国防科技大学_第3页
数据挖掘知到章节答案智慧树2023年国防科技大学_第4页
免费预览已结束,剩余5页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据挖掘知到章节测试答案智慧树2023年最新国防科技大学绪论单元测试

什么是KDD?()

参考答案:

数据挖掘与知识发现

“8,000”和“10,000”表示:()

参考答案:

数据

人从出生到长大的过程中,是如何认识事物的?()

参考答案:

先聚类,后分类

“8,000米是飞机飞行最大高度”与“10,000米的高山”表示:()

参考答案:

信息

“飞机无法飞过高山”表示:()

参考答案:

知识

第一章测试

下面哪个不属于数据的属性类型:()

参考答案:

相异

只有非零值才重要的二元属性被称作:()

参考答案:

非对称的二元属性

一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:()

参考答案:

一年级

杰卡德系数用来度量非对称的二进制属性的相似性。()

参考答案:

欧式距离用来度量连续数值属性数据的相似性。()

参考答案:

第二章测试

卡方测试用来度量离散标称属性数据的相关性。()

参考答案:

相关系数用来度量标称属性数据的相关性。()

参考答案:

所谓高维数据,指的是数据属性很多。()

参考答案:

假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:()

参考答案:

0.716

假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?()

参考答案:

第二个

第三章测试

考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为()

参考答案:

0.5738

Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。()

参考答案:

朴素贝叶斯分类器的朴素之处在于:()

参考答案:

属性之间的条件独立性假设

可以利用概率统计方法估计数据的分布参数,再进一步估计待测试数据的概率,以此来实现贝叶斯分类。()

参考答案:

贝叶斯分类器对离群点敏感。()

参考答案:

第四章测试

决策树中不包含一下哪种结点,()

参考答案:

外部结点(externalnode)

一个决策树包括如下哪些要素()

参考答案:

测试节点

;分支

;叶子

以下哪个算法是分类算法()

参考答案:

ID3

采用决策树分类算法,连续数据如何处理?()

参考答案:

连续数据离散化

;选择最佳划分点分裂

决策树的父节点和子节点的熵的大小关系是什么?()

参考答案:

子节点的熵更大

第五章测试

当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?()

参考答案:

聚类

简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()

参考答案:

划分聚类

下面说法正确的是

()

参考答案:

K-modes能够解决离散数据的聚类问题

;K-means++能够解决初始点影响聚类效果的问题

;K中心点能够解决有离群点的聚类问题

关于k-means算法,正确的描述是:()

参考答案:

初始值不同,最终结果可能不同

K-Means算法中的初始中心点:()

参考答案:

直接影响算法的收敛结果

第六章测试

logistic回归对噪声敏感。()

参考答案:

经典的逻辑回归可以解决非线性的分类问题。()

参考答案:

分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。()

参考答案:

逻辑回归正则化主要包括L1正则化和L2正则化。()

参考答案:

数据规范化能够提高逻辑回归算法参数学习的效率。()

参考答案:

第七章测试

某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()

参考答案:

关联规则发现

数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。()

参考答案:

具有较高的支持度的项集具有较高的置信度。(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论