2013秋浙江大学数据挖掘作业必做在线要点_第1页
2013秋浙江大学数据挖掘作业必做在线要点_第2页
2013秋浙江大学数据挖掘作业必做在线要点_第3页
2013秋浙江大学数据挖掘作业必做在线要点_第4页
2013秋浙江大学数据挖掘作业必做在线要点_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、单选题1置信度(confidenee)是衡量兴趣度度量()的指标。A简洁性'* B确定性'C实用性'D新颖性正确答案:B单选题2哪种OLAP操作可以让用户在更高的抽象层,更概化的审视数据?“ A上卷'B下钻rc切块'D转轴正确答案:A单选题3下列几种数据挖掘功能中,()被广泛的用于购物篮分析。'* A关联分析'B分类和预测'C聚类分析D演变分析正确答案:A单选题4下列哪个描述是正确的?'A分类和聚类都是有指导的学习B分类和聚类都是无指导的学习C分类是有指导的学习,聚类是无指导的学习D分类是无指导的学习,聚类是有指导的学习正

2、确答案:C单选题5计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?'A算术平均值B截尾均值'C中位数'D众数正确答案:B单选题6. 规则:age(X, ”-29” )A buys(X, popcorn ”)=> buys(X, Coke")是一个('A单维关联规则'* B多维关联规则C混合维关联规则'D不是一个关联规则正确答案:B单选题通常所使用的数据7. 假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述, 挖掘功能是()。'A关联分析'B分类和预测'C孤立点分析D演变分析(5*

3、E概念描述正确答案:E单选题8. 下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?'* A数据清理'B数据集成c数据变换D数据归约正确答案:A单选题9进行数据规范化的目的是()。'A去掉数据中的噪声'B对数据进行汇总和聚集'C使用概念分层,用高层次概念替换低层次原始”数据D将属性按比例缩放,使之落入一个小的特定区间正确答案:D单选题10.平均值函数avg()属于哪种类型的度量?1A分布的B代数的rC整体的rD混合的正确答案:B单选题11.面哪种分类方法是属于统计学的分类方法?CA判定树归纳B贝叶斯分类rC后向传播分类CD基于案例的推理正确答案:B单

4、选题12.二列几种数据挖掘功能中,()被广泛的用于购物篮分析。A关联分析rB分类和预测rC聚类分析D演变分析正确答案:A单选题13. 支持度(support)是衡量兴趣度度量()的指标。'* A实用性'B确定性'C简洁性'D新颖性正确答案:A 单选题14. 以下哪个范围是数据仓库的数据库规模的一个合理范围?rA 1 100M' B 100M 10GC 10 1000GD 100GB 数 TB正确答案:D单选题15. 下面那种数据挖掘方法可以用来检测孤立点?'A概念描述'B分类和预测ffC聚类分析D演变分析正确答案:C单选题属于那种属性类型

5、?16. 字段 Hair_color = auburn, black, blond, brown, grey, red, whiteA标称属性r 一B二元属性c序数属性D数值属性正确答案:A 单选题17. 下面哪种分类方法是属于神经网络学习算法?'A判定树归纳'B贝叶斯分类* C后向传播分类'D基于案例的推理正确答案:C 单选题18. 哪种数据变换的方法将数据沿概念分层向上汇总?CA平滑B聚集'* C数据概化'D规范化正确答案:C单选题19. 下面的数据挖掘的任务中,()将决定所使用的数据挖掘功能。'A选择任务相关的数据'* B选择要挖掘

6、的知识类型CC模式的兴趣度度量cD模式的可视化表示正确答案:B单选题20. 孤立点挖掘适用于下列哪种场合?A目标市场分析B购物篮分析c模式识别rD信用卡欺诈检测正确答案:D单选题21. 下面的数据操作中,哪些操作不是多维数据模型上的OLAP操作?' A 上卷(roll-up)肯,rB 选择(select)'C 切片(slice)'D 转轴(pivot)正确答案:B单选题22. 下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性?'A空间填充曲线"B散点图矩阵C平行坐标D圆弓分割正确答案:B单选题23. 根据顾客的收入和职业情况,预测他们在计算机

7、设备上的花费,所使用的相应数据挖掘 功能是()。'A关联分析'* B分类和预测C演变分析D概念描述正确答案:B单选题24. 下列几种数据挖掘功能中,()被广泛的应用于股票价格走势分析。'A关联分析'B分类和预测'C聚类分析D演变分析正确答案:D单选题25. 数据归约的目的是()。' A填补数据种的空缺值B集成多个数据源的数据C得到数据集的压缩表示'D规范化数据正确答案:C单选题26. 数据的噪声是指()。'A孤立点'B空缺值” C测量变量中的随即错误或偏差''D数据变换引起的错误正确答案:C单选题27. 存

8、放最低层汇总的方体称为()。'A顶点方体'B方体的格ffC基本方体cD维正确答案:C单选题28. 数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于()。'A所涉及的算法的复杂性B所涉及的数据量c计算结果的表现形式D是否使用了人工智能技术 正确答案:B单选题29. 以下哪种聚类方法可以发现任意形状的聚类?'A划分的方法B基于模型的方法C基于密度的方法D层次的方法正确答案:C单选题30. 帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功 能是(关联分析分类和预测<*C聚类分析D孤立点分析E演变分析正确答案:C单选题31.以下

9、哪个指标不是表示对象间的相似度和相异度?A Euclidean 距离B Manhattan 距离C Eula距离D Minkowski 距离 正确答案:C单选题32. 字段Size = small, medium, large属于那种属性类型?A标称属性B二元属性C序数属性D数值属性正确答案:C单选题33. 根据关联分析中所处理的值类型,可以将关联规则分类为()。'* A布尔关联规则和量化关联规则'B单维关联规则和多维关联规则'C单层关联规则和多层关联规则'D简答关联规则和复杂关联规则正确答案:A单选题34. ()通过将属性域划分为区间,从而减少给定连续值的个数

10、。A概念分层” B离散化''C分箱'D直方图正确答案:B多选题35.OLAP系统和OLTP系统的主要区别包括()。 A OLTP系统主要用于管理当前数据,而OLAP系统主要存放的是历史数据 B在数据的存取上,OLTP系统比OLAP系统有着更多的写操作C对OLTP系统上的数据访问量往往比对OLAP系统的数据访问量要大得多"D OLAP系统中往往存放的是汇总的数据,而OLTP系统中往往存放详细的数据正确答案:ABD多选题36.Apriori算法所面临的主要的挑战包括()。A会消耗大量的内存B会产生大量的候选项集C对候选项集的支持度计算非常繁琐 D要对数据进行多次扫

11、描正确答案:BCD多选题37下列哪些是数据变换可能涉及的内容?A数据压缩'B数据概化-He维归约"D规范化正确答案:BD多选题38. 下面哪些问题是我们进行数据预处理的原因?已A数据中的空缺值 B噪声数据 C数据中的不一致性D数据中的概念分层正确答案:ABC多选题39. 以下哪些是数据仓库的主要应用? A信息处理B互联网搜索 C分析处理"D数据挖掘正确答案:ACD多选题40. 根据关联分析中所涉及的数据维,可以将关联规则分类为()。A布尔关联规则B单维关联规则C多维关联规则D多层关联规则正确答案:BC多选题41. 数据清理的目的是处理数据中的()。 A空缺值"B噪声数据* C不一致数据D敏感数据正确答案:ABC多选题42. 从结构的角度看,数据仓库模型包括以下几类()。 A企业仓库 B数据集市 C虚拟仓库D信息仓库正确答案:ABC多选题43. 根据关联分析中所涉及的抽象层,可以将关联规则分类为()。A布尔关联规则'B单层关联规则C多维关联规

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论