![数据仓库与数据挖掘复习提纲_第1页](http://file3.renrendoc.com/fileroot_temp3/2021-12/26/05327315-d665-465a-980f-b19f502f9350/05327315-d665-465a-980f-b19f502f93501.gif)
![数据仓库与数据挖掘复习提纲_第2页](http://file3.renrendoc.com/fileroot_temp3/2021-12/26/05327315-d665-465a-980f-b19f502f9350/05327315-d665-465a-980f-b19f502f93502.gif)
![数据仓库与数据挖掘复习提纲_第3页](http://file3.renrendoc.com/fileroot_temp3/2021-12/26/05327315-d665-465a-980f-b19f502f9350/05327315-d665-465a-980f-b19f502f93503.gif)
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据库应用技术(数据仓库与数据挖掘复习提纲)说明:考试形式: 闭卷考试题型: 填空、选择、判断、名词解释、简答题、综合题。 (由于试题是随机从试题库中抽取,有可能抽取的试题中不会全部包含上述的所有题型)另外:本提纲仅针对试题中的名词解释、简答题和综合题提供复习参考,不包括填空、选择、判断等其它题型的参考。一:名词解释数据仓库、数据挖掘、 OLAP、 ODS(操作数据存储)二简答题1试述数据仓库系统与数据库系统的区别与相似之处。2试述数据仓库设计的步骤以及每一步所完成的工作。3OLAP与 OLTP的区别有哪些它们适合于运行在同一个服务器上吗为什么4在数据挖掘前,为什么要对数据进行预处理,数据预处
2、理的有哪些主要的处理方法5在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法。6.什么是数据仓库中的元数据,元数据包含哪些内容其重要性体现在哪些方面7.试述 ODS在“ DB-ODS-DW”体系结构中的作用。8.请解释 OLAP中维、维层次与维成员的概念,并举例说明。9. 数据仓库中的数据是数据库中数据的简单堆积吗它有哪些常用的数据组织方式10数据仓库和数据集市的区别是什么数据仓库的体系环境具有什么特点有哪些建立数据仓库体系化环境的方法它们各有何优劣11.数据仓库的设计包括哪些内容12.在内容和使用者方面,数据仓库环境中的元数据与操作型环境中的元数据有何异同13.为了
3、提高数据仓库的性能,可以在哪些方面作一些努力在各个方面分别采用什么样的技术这些技术易于实现吗提供哪些基本操作服务器有哪些实现方法它们的优劣是什么16.为什么不能依靠传统的业务处理系统进行决策分析17.自然演化体系结构中存在的问题18.试述建立多维数据库的过程。19数据挖掘的主要方法。20.数据挖掘中的数据分类是个两步的过程,简述每步过程。21.对于类特征化,基于数据立方体的实现与诸如面向属性归纳的关系实现之间的主要不同是什么讨论哪种方法最有效,在什么条件下最有效。22. 一般来说,数据仓库采用什么样的数据模型与 OLTP的数据库模型相比,这些模型有什么特点三综合题第一类:给定一个表的结构及数据
4、,计算每个决策属性的信息增益(请同学们掌握该方法,不同的试题中给定的表结构及数据是不同的)例一:假设有如下的“雇员基本信息”表的结构及数据,其中属性“工资”为类别标识属性,属性“部门” 、“职位”、“年龄”作为决策属性集。第一种出题形式:请计算每个决策属性“部门”、“职位”、“年龄”的信息增益。第二种出题形式:建立决策树,并产生IF-THEN规则。(另外请同学们自己复习课上所讲的例子),。部门*职位*年龄*工资销售部高级314041K55K C2销售部初级213026K40K C3销售部初级314026K40K C3系统部初级213041K55K C2系统部高级314056K70K C1系统部
5、初级213041K55K C2系统部高级415056K70K C1市场部高级314041K55K C2市场部初级314041K55K C2秘书处高级415026K40K C3秘书处初级213026K40K C3第二类:利用 Apriori 算法寻找事务集中的频繁项集,并由找到的频繁项集产生强关联规则。(请同学们掌握该方法,不同的试题中给定的事务集是不同的)例一:假设现有如下表所示的一个事务数据库, 数据库中有 10 个事务,即|D|=10 。假定最小支持度 minsup=20%,最小置信度 minsup=65%,利用 Apriori 算法寻找 D中的频繁项集,并由找到的频繁项集产生强关联规则。
6、(另外请同学们自己复习课上所讲的例子)TID项列表T1I1,I2, I5T2,I2I1T3,I4I2T4,I4I1I2T5,I3I1T6I1,I2, I3,I5T7I1,I2, I3T8,I5I2T9I2,I3, I4T10I3, I4第三类:利用简单贝叶斯分类对数据进行分类(请同学们掌握该方法,不同的试题中给定的表结构及数据是不同的)例一:假设有如下的“雇员基本信息”表的结构及数据,其中属性“工资”为类别标识属性,类别标识有 3 个取值( C1、C2、 C3),属性“部门”、“职位”、“年龄”作为决策属性集,请利用贝叶斯简单分类方法对未知数据:X=(部门 =系统部,职位 =高级年龄 =2130)进行分类。(另外请同学们自己复习课上所讲的例子)部门 *职位 *年龄 *工资销售部高级314041K55K C2销售部初级213026K40K C3销售部初级314026K40K C3系统部初级213041K55K C2系统部高级314056K70K C1系统部初级21
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 提高销售管理能力的培训课程
- 2025天津市农资买卖合同范文
- 家居装饰设计与施工方案
- 劳动合同知识产权保密条款
- 房屋中介买卖服务合同范本
- 2025《代理企业所得税年度纳税申报合同》(合同模版)
- 的买卖合同范本
- 社工劳动合同
- 2025工程外包合同模板
- 农业机械设备采购安装合同
- JTGT H21-2011 公路桥梁技术状况评定标准
- 卖花生混声合唱简谱
- 【永辉超市公司员工招聘问题及优化(12000字论文)】
- 柴油加氢装置知识培训课件
- 汽油安全技术说明书(MSDS)
- 中国直销发展四个阶段解析
- 2024届浙江省宁波市镇海区镇海中学高一物理第一学期期末质量检测试题含解析
- 部编版语文四年级下册 教材解读
- 《一次函数与方程、不等式》说课稿
- 动火作业安全管理要求及控制措施
- 诗豪刘禹锡一生部编教材PPT
评论
0/150
提交评论