




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章单元测试1【单选题】(2分)什么是KDD?()A.领域知识发现B.动态知识发现C.数据挖掘与知识发现D.文档知识发现2【判断题】数据挖掘分析是指从海量的数据中抽取感兴趣的(有价值的、隐含的、以前没有用但是潜在有用信息的)模式和知识。()A.对B.错3.【多选题】正确答案:ABCD数据挖掘分析的步骤包括()A.模型评估B.数据预处理C.创建数据集D.算法分析4【判断题】当今社会,数据挖掘分析被广泛应用。()A.错B.对5.【多选题】正确答案:ABD()是未来大数据分析的发展趋势。A.实时性B.可视化C.简单D.非结构化数据第二章单元测试1.【多选题】(3分)正确答案:ABD关于描述统计,包括()。A.集中趋势分析B.相关分析C.其余选项都不是D.离中趋势分析2【单选题】(3分)以下属于推断统计的是()。A.离中趋势分析B.参数估计C.集中趋势分析D.其余选项都不是3.【多选题】(3分)正确答案:AD在数据特征的测度中,描述分布的形状的值为()A.偏态B.众数C.中位数D.峰态4【判断题】测度集中趋势就是寻找数据水平的代表值或中心值()A.对B.错5【判断题】四分位数可以用于顺序数据、数值数据和分类数据()A.错B.对第三章单元测试1【单选题】(2分)下面哪个属于映射数据到新的空间的方法?()A.维归约B.特征加权C.傅立叶变换D.渐进抽样2【单选题】(2分)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()A.数据预处理B.分类和预测C.数据流挖掘D.频繁模式挖掘3【单选题】(2分)影响数据质量问题的因素有哪些()A.相关性、时效性B.可信性、可解释性C.其余选项都对D.准确性、完整性、一致性4.【多选题】正确答案:ABC数据预处理的常见方法有()A.数据集成B.数据清洗C.数据变换D.其余选项都不对5【判断题】数据预处理是指在对数据进行挖掘分析以前,需要对原始数据进行清理、集合和变换等一系列处理工作()A.错B.对第四章单元测试1【单选题】(2分)考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()A.1,2,4,5B.1,3,4,5C.1,2,3,4D.1,2,3,52【单选题】(3分)频繁项集、频繁闭项集、最大频繁项集之间的关系是:()A.频繁项集=频繁闭项集最大频繁项集B.频繁项集频繁闭项集最大频繁项集C.频繁项集频繁闭项集=最大频繁项集D.频繁项集=频繁闭项集=最大频繁项集3【单选题】(3分)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()A.自然语言处理B.关联规则发现C.聚类D.分类4【单选题】(3分)下面购物篮能够提取的3-项集的最大数量是多少()ID购买项1牛奶,啤酒,尿布2面包,黄油,牛奶3牛奶,尿布,饼干4面包,黄油,饼干5啤酒,饼干,尿布6牛奶,尿布,面包,黄油7面包,黄油,尿布8啤酒,尿布9牛奶,尿布,面包,黄油10啤酒,饼干A.1B.2C.3D.45.【多选题】(4分)正确答案:ABCDApriori算法的计算复杂度受()影响。A.事务平均宽度B.支持度阀值C.项数(维度)D.事务数第五章单元测试1【单选题】(2分)以下哪些算法是分类算法,()A.EMB.K-MeanC.DBSCAND.C4.52【单选题】(2分)决策树中不包含一下哪种结点,()A.叶结点(leafnode)B.根结点(rootnode)C.内部结点(internalnode)D.外部结点(externalnode)3【单选题】(2分)以下哪项关于决策树的说法是错误的()A.寻找最佳决策树是NP完全问题B.子树可能在决策树中重复多次C.冗余属性不会对决策树的准确率造成不利的影响D.决策树算法对于噪声的干扰非常敏感4【单选题】(2分)以下关于人工神经网络(ANN)的描述错误的有()A.神经网络对训练数据中的噪声非常鲁棒B.可以处理冗余特征C.至少含有一个隐藏层的多层神经网络D.训练ANN是一个很耗时的过程5.【多选题】(4分)正确答案:CD贝叶斯信念网络(BBN)有如下哪些特点,()A.贝叶斯网络不适合处理不完整的数据B.网络结构确定后,添加变量相当麻烦C.对模型的过分问题非常鲁棒D.构造网络费时费力6【单选题】(2分)如下哪些不是最近邻分类器的特点,()A.它使用具体的训练实例进行预测,不必维护源自数据的模型B.可以生产任意形状的决策边界C.最近邻分类器基于全局信息进行预测D.分类一个测试样例开销很大第六章单元测试1.【多选题】正确答案:ABCD()这些数据特性都是对聚类分析具有很强影响的。A.高维性B.稀疏性C.噪声和离群点D.规模2【单选题】(2分)考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近邻,所以应该选择()的相似度计算方法。A.余弦距离B.平方欧几里德距离C.共享最近邻D.直接相似度3【单选题】(2分)在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位数。A.余弦距离B.Bregman散度C.曼哈顿距离D.平方欧几里德距离4【单选题】(2分)简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()A.模糊聚类B.非互斥聚类C.划分聚类D.层次聚类5【判断题】K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。()A.对B.错第七章单元测试1.【多选题】正确答案:ABCD可视化涉及到的学科包括()A.统计分析B.数据挖掘C.人机交互D.计算机图形学2【单选题】(2分)若有一个数据集,每个数据点有5个属性,以下哪种可视化技术最适用于表示其属性凉凉之间的相
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年中国铅锌行业十三五投资分析及发展风险评估报告
- 2025-2030年中国针织面料市场运营状况与发展潜力分析报告
- 2025-2030年中国酵母核糖核酸市场运行趋势及投资战略研究报告
- 2025-2030年中国速溶固体饮料市场发展趋势及前景调研分析报告
- 2025-2030年中国豆腐市场运行状况及发展趋势分析报告
- 2025-2030年中国血液透析机市场运营现状及发展前景规划分析报告
- 2025-2030年中国脱咖啡因绿茶市场发展策略规划分析报告
- 2025-2030年中国美白护肤市场运行状况及投资战略研究报告
- 2025年上海市建筑安全员-A证考试题库及答案
- 2025-2030年中国米酒市场运行动态及投资战略研究报告
- 第10辑:句子表达效果(原句vs改句)解题指导-2023年高考语文一轮复习修辞手法与句子表达效果专练
- 2024年辅警招考时事政治考题及答案(100题)
- 2024年中考数学《二次函数的实际应用》真题含解析版
- GB 30254-2024高压三相笼型异步电动机能效限定值及能效等级
- 非物质文化遗产拓印 课件
- 空气动力学数值方法:有限元法(FEM):边界条件处理与应用
- 教科版科学三年级下册《 各种各样的运动 》课件
- (正式版)CB∕T 4548-2024 船舶行业企业相关方安全管理要求
- 部编版八年级物理(上册)期末试卷(带答案)
- NB-T10342-2019水电站调节保证设计导则
- 当代世界经济与政治 第八版 课件 第四章 发展中国家的经济与政治
评论
0/150
提交评论