版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
精品文档-下载后可编辑数据挖掘与数据分析常见测试题汇编数据挖掘与数据分析常见测试题汇编
1.【单选题】2分|某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题()。
A关联规则发现
B聚类
C分类
D自然语言处理
2.【单选题】2分|将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务()
A频繁模式挖掘
B分类和预测
C数据预处理
D数据流挖掘
3.【单选题】2分|当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离()。
A分类
B聚类
C关联分析
D隐马尔可夫链
4.【单选题】2分|什么是KDD()。
A数据挖掘与知识发现
B领域知识发现
C文档知识发现
D动态知识发现
5.【单选题】2分|为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务()
A探索性数据分析
B建模描述
C预测建模
D寻找模式和规则
6.【单选题】2分|建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务()
A根据内容检索
B建模描述
C预测建模
D寻找模式和规则
7.【单选题】2分|用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务()
A根据内容检索
B建模描述
C预测建模
D寻找模式和规则
8.【单选题】2分|下面哪种不属于数据预处理的方法()
A变量代换
B离散化
C聚集
D估计遗漏值
9.【单选题】2分|下面哪个不属于数据的属性类型:()
A标称
B序数
C区间
D相异
10.【单选题】2分|以下哪种方法不属于特征选择的标准方法:()
A嵌入
B过滤
C包装
D抽样
11.【单选题】2分|在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:()
A有放回的简单随机抽样
B无放回的简单随机抽样
C分层抽样
D渐进抽样
12.【多选题】4分|数据仓库是随着时间变化的,下面的描述正确的是()
A数据仓库随时间的变化不断增加新的数据内容;
B捕捉到的新数据会覆盖原来的快照;
C数据仓库随事件变化不断删去旧的数据内容;
D数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合;
13.【单选题】2分|OLAP技术的核心是:()
A在线性;
B对用户的快速响应;
C互操作性;
D多维分析;
14.【多选题】4分|有关数据仓库的开发特点,正确的描述是:()
A数据仓库开发要从数据出发;
B数据仓库使用的需求在开发出去就要明确;
C数据仓库的开发是一个不断循环的过程,是启发式的开发;
D在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式
15.【单选题】2分|关于OLAP的特性,下面正确的是:(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性()
A(1)(2)(3)
B(2)(3)(4)
C(1)(2)(3)(4)
D(1)(2)(3)(4)(5)
16.【多选题】4分|在有关数据仓库测试,下列说法正确的是:()
A在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试.
B当数据仓库的每个单独组件完成后,就需要对他们进行单元测试.
C系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试.
D在测试之前没必要制定详细的测试计划.
17.【单选题】2分|设X={1,2,3}是频繁项集,则可由X产生()个关联规则。
A4
B5
C6
D7
18.【单选题】2分|以下哪些算法是分类算法()
ADBSCAN
BC4.5
CK-Mean
DEM
19.【单选题】2分|以下哪些分类方法可以较好地避免样本的不平衡问题()
AKNN
BSVM
CBayes
D神经网络
20.【多选题】4分|关于OLAP和OLTP的区别描述,正确的是:()
AOLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同.
B与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.
COLAP的特点在于事务量大,但事务内容比较简单且重复率高.
DOLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的.
21.【单选题】2分|如果规则集中的规则按照优先级降序排列,则称规则集是()
A无序规则
B穷举规则
C互斥规则
D有序规则
22.【单选题】2分|以下哪个聚类算法不是属于基于原型的聚类()。
A模糊c均值
BEM算法
CSOM
DCLIQUE
23.【单选题】2分|一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。
A概率
B邻近度
C密度
D聚类
24.【单选题】2分|下面关于Jarvis-Patrick(JP)聚类算法的说法不正确的是()。
AJP聚类擅长处理噪声和离群点,并且能够处理不同大小、形状和密度的簇。
BJP算法对高维数据效果良好,尤其擅长发现强相关对象的紧致簇。
CJP聚类是基于SNN相似度的概念。
DJP聚类的基本时间复杂度为O(m)。
25.【多选题】4分|关于决策树的说法,正确的是()
A冗余属性不会对决策树的准确率造成不利的影响
B子树可能在决策树中重复多次
C决策树算法对于噪声的干扰非常敏感
D寻找最佳决策树是NP完全问题
26.【多选题】4分|以下关于人工神经网络(ANN)的描述正确的有()
A神经网络对训练数据中的噪声非常鲁棒
B可以处理冗余特征
C训练ANN是一个很耗时的过程
D至少含有一个隐藏层的多层神经网络
27.【多选题】4分|关于混合模型聚类算法的优缺点,下面说法不正确的是()。
A当簇只包含少量数据点,或
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论