东财《数据挖掘概论》单元作业二答卷_第1页
东财《数据挖掘概论》单元作业二答卷_第2页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东财《数据挖掘概论》单元作业二试卷总分:100得分:100一、单选题(共10道试题,共50分)1.以下选项中,属于监督的离散化技术的是()。A.直方图分析B.分箱C.决策树分析D.K-means答案:C2.规范化、数据离散化和概念分层产生都是某种形式的()。A.数据清理B.数据集成C.数据删除D.数据变换答案:D3.()可以通过如聚集、删除冗余特征或聚类来降低数据的规模。A.数据集成B.数据归约C.数据变换D.数据清理答案:B4.提升度的值小于1,表明两个项之间的相关关系为()。A.正相关B.置信度C.不相关D.不确定答案:B5.下面购物篮能够提取的3-项集的最大数量是()ID购买项1牛奶,啤酒,尿布2面包,黄油,牛奶3牛奶,尿布,饼干4面包,黄油,饼干5啤酒,饼干,尿布6牛奶,尿布,面包,黄油7面包,黄油,尿布8啤酒,尿布9牛奶,尿布,面包,黄油10啤酒,饼干。A.1B.2C.3D.4答案:C6.Kulc度量的值越(),A和B的联系越紧密。A.大B.小C.不变D.零答案:A7.Apriori算法使用一种称为逐层搜索的迭代方法,其中k项集用于探索()项集。A.kB.k+1C.k+2D.k-1答案:B8.设X={1,2,3,4}是频繁项集,则可由X产生()个关联规则。A.12B.13C.14D.16答案:C9.如果使用神经网络后向传播算法进行分类挖掘,对训练元组中每个属性的输入值进行(),将有助于加快学习阶段的速度。A.光滑B.属性构造C.聚集D.规范化答案:D10.数据变换策略中,把属性数据按比例缩放,使之落入一个特定的小区间的策略称为()。A.光滑B.属性构造C.聚集D.规范化答案:D二、多选题(共5道试题,共25分)11.以下属于频繁项集挖掘方法的有()。A.Apriori算法B.频繁模式增长C.聚类D.分类答案:AB12.在以下的模式评估度量中属于零不变度量的有()。A.提升度B.全置信度C.最大置信度D.余弦答案:BCD13.关联规则的基本框架有()。A.支持度B.提升度C.置信度D.卡方分析答案:AC14.PCA可以用于有序和无序的属性,并且可以更好地处理()数据。A.密集B.高维C.倾斜D.稀疏答案:CD15.数据清理通过()来“清理”数据。A.识别或删除离群点B.光滑噪声数据C.忽略缺失的值D.解决不一致性来答案:ABD三、判断题(共5道试题,共25分)16.通过为找候选项集划分数据可以提高Apriori算法的效率。()答案:正确17.离散化不能用来处理噪声。()答案:错误18.维归约和数量归约也可以看作是某种形式的数据压缩。()答案:正确19.关联

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论