数据挖掘智慧树知到答案章节测试2023年青岛大学_第1页
数据挖掘智慧树知到答案章节测试2023年青岛大学_第2页
数据挖掘智慧树知到答案章节测试2023年青岛大学_第3页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章测试数据挖掘就是从大量的、()数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。()。

A:不完全的

B:随机的

C:模糊的

D:有噪声的

答案:ABCD互联网本身具有()的特征,这种属性特征给数据搜集、整理、研究带来了革命性的突破。()。

A:快速性

B:数字化

C:互动性

D:共享

答案:BCKDD和数据挖掘可以应用在很多领域中,它们具有如下一些公共特征:()。

A:数据利用非常不足

B:在开发知识发现系统时,领域专家对该领域的熟悉程度至关重要

C:最终用户专门知识缺乏

D:海量数据集

答案:ABCD大数据的特征有()。

A:Velocity

B:Value

C:Variety

D:Volume

答案:ABCD从宏观上看,数据挖掘过程主要由三个部分组成,即()。

A:数据收集

B:数据挖掘

C:结果的解释评估

D:数据整理

答案:BCD第二章测试不完整数据的成因有()。

A:数据收集的时候就缺乏合适的值

B:其他

C:人为/硬件/软件问题

D:数据收集时和数据分析时的不同考虑因素

答案:ACD处理空缺值的主要方法有()。

A:使用属性的平均值填补空缺值。

B:忽略元组

C:使用与给定元组属同一类的所有样本的平均值。

D:使用一个全局常量填补空缺值

答案:ABCD给定一个数值属性,怎样才能平滑数据,去掉噪声?()。

A:回归

B:聚类

C:分箱(binning)

D:计算机和人工检查结合

答案:ABCD数据集成时需解决的三个基本问题为()。

A:模式集成的过程中涉及到的实体识别问题

B:冗余问题

C:数据集成过程中数值冲突的检测与处理

D:降维

答案:ABC常用的数据转换方法有()。

A:聚集

B:平滑

C:属性构造

D:数据概化

答案:ABCD第三章测试下列哪个算法不属于层次聚类算法?()。

A:Agnes

B:CURE

C:K-means

D:BIRCH

答案:C下列哪个算法属于层次聚类算法?()。

A:DBSCAN

B:K-modes

C:PAM

D:DIANA

答案:D下列哪个算法属于密度聚类算法?()。

A:K-modes

B:DIANA

C:DBSCAN

D:PAM

答案:C聚类分析中,通常使用()来衡量两个对象之间的相异度。()。

A:比较

B:大小

C:位置

D:距离

答案:D下列哪个选项不是DBSCAN算法的缺点?()。

A:能够识别出噪声点

B:不能很好反映高维数据

C:对用户定义的密度参数是敏感的

D:如果样本集的密度不均匀、簇间距离相差很大时,聚类质量较差

答案:A第四章测试下列哪些是分类算法?()。

A:DIANA

B:C4.5

C:KNN

D:ID3

答案:BCD下列哪些是决策树分类算法?()。

A:KNN

B:CART

C:ID3

D:C4.5

答案:BCD贝叶斯分类方法都有:()。

A:TAN

B:NBC

C:GBN

D:BAN

答案:ABCD分类分析的两个阶段分别为:()。

A:使用阶段

B:分类阶段

C:归纳阶段

D:学习阶段

答案:BD朴素贝叶斯分类器对()数据具有较好的分类效果()。

A:完全独立的数据

B:函数依赖的数据

C:离散数据

D:连续数据

答案:AB第五章测试关联规则挖掘最为著名的是Agrawal等人提出的()及其改进算法。()

A:Apriori

B:PAM

C:ID3

D:NBC

答案:A()是对关联规则重要性的衡量,反映关联是否是普遍存在的规律。()

A:支持度

B:置信度

C:最大值

D:最小值

答案:A()是对关联规则准确度的衡量,度量关联规则的强度。()

A:最小值

B:最大值

C:支持度

D:置信度

答案:D给定全局项集I和交易数据集D,对于I的非空项集I1,若其支持度()最小支持度阈值min_sup,则称I1为频繁项集。()

A:等于

B:大于或等于

C:小于或等于

D:大于

答案:B如果购买铁锤的顾客中有70%的人购买了铁钉,那么置信度是()。

A:50%

B:100%

C:70%

D:无法计算

答案:C第六章测试序列模式挖掘经典算法有:()。

A:AprioriSome

B:PrefixSpan

C:GSP

D:AprioriAll

答案:ABCDAprioriSome算法可以看作是AprioriAll算法的改进,具体过程分为两个阶段:()。

A:凝聚

B:前推阶段

C:分裂

D:回溯阶段

答案:BDAprioriAll算法存在的问题()。

A:容易生成大量的候选项集

B:在转换阶段产生巨大的开销

C:很难找到长序列模式

D:需要对数据库进行多次扫描

答案:ABCDAprioriSome算法的优缺点()。

A:AprioriSome会产生比较多的候选,可能在回溯阶段前就占满内存。

B:适用于任何数据集

C:AprioriSome跳跃式计算候选,会在某种程度上减少遍历数据集次数

D:对于较低的支持度,数据集中有较长的大序列的情况下,采用AprioriSome比较好。

答案:ACDGSP算法存在的问题()。

A:只适用于小规模数据集

B:当序列数据集比较大时,容易生成庞大的候选序列

C:需要对序列数据集进行多次扫描

D:对长序列模式的处理效率比较低

答案:BCD第七章测试数据挖掘是面向应用的。()

A:错

B:对

答案:B数据挖掘技术可以应用于大数据分析。()

A:对

B:错

答案:A数据挖掘是在没有明确假设的前提下去挖掘信息、发现知

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论