数据仓库与数据挖掘试题_第1页
数据仓库与数据挖掘试题_第2页
数据仓库与数据挖掘试题_第3页
数据仓库与数据挖掘试题_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据仓库与数据挖掘试题一、判断问题(每小题1分,共计30分,解答时每5个解答写上)1 .数据库作为数据资源管理业务中的信息分析处理。 (x )2 .数据库查询是指分析请求查询,而不是记录级别数据查询。 (x )3 .关系数据库是二维数据(平面),多维数据库是空间立体数据。 (v )4 .在数据进入数据仓库之前,必须经过加工和整合。 (v )5. OLAP正在使用当前数据OLTP正在使用历史数据。 (v )6 .数据仓库操作不明确,操作数据量少。 (x )7 .数据集市的实现超出了数据仓库。 (x )8. OLAP使用的资料会经常更新。OLTP使用的资料不会更新,但会定期更新。 (x )9 .数据集市可以升级到完整的数据仓库。 (v )10 .存储在数据库中的数据基本上存储当前的综合数据。 (x )11. OLAP可以根据分析家的要求快速、灵活地处理大量数据的复杂性。 (v )12. OLAP支持复杂的决策分析操作,侧重于分析人员和高级管理人员的决策支持。 (v )13. OLTP的事务处理量大,处理内容比较简单,但是重复率高。 (v )14 .数据仓库的用户有信息用户和探险家两种。 (v )15 .对数据库的操作明确,操作数据量大。 (x )16 .数据库用于事务,数据仓库用于决策分析。 (v )17 .信息用户以可预测和重发的方式使用数据仓库平台。 (v )18. OLAP一次处理的数据量较大的OLTP一次处理的数据量较少。 (v )19. OLTP一次操作的数据量很少,OLTP通常是当前数据。 (v )20 .数据仓库系统由数据仓库系统(DW )、仓库管理和分析工具三部分组成。 (v )21 .随着业务变化,数据仓库的数据随时更新。 (x )22 .数据集市的规模大于数据仓库。 (x )2-3 .数据集市更加详细,并且具有存储在数据仓库中的数据。 (v )24 .不同的维值组合及其相应的度量值构成不同的查询和分析。 (v )25. OLAP使用详细数据,而OLTP使用综合数据。 (x )26 .数据集市由企业管理和维护。 (x )27. OLAP的概念模型是多维的。 (v )28 .数据库已经成为成熟的信息基础设施。 (v )29 .数据库既保存过去的数据又保存当前的数据。 (x )30. OLTP面临的是事务处理操作员和低层管理者。 (v )二、填空问题(每小题一分,共十分)1 .信息用户通常显示摘要数据或聚集计数。2 .探险家的任务是在公司数据中寻找隐藏的价值。3 .资料立方结构是聚总计算的总和,依所有可能组合的维度分组。4 .基本的多维数据分析操作包括切片、旋转、钻孔等。5 .数据立方体的构建和维护等计算方法已成为多维数据分析研究的重要问题。6. OLAP是建立在网络上的开发架构。7 .在数据立方体中,不同维度的组合构成不同的子立方体。8 .不同的数据仓库需要建立不同的数据库。9. ETL是建立数据仓库的重要步骤,开发数据仓库需要70%的劳动力。10 .数据仓库的数据是综合集成。三、名词解释(每小题5分,共30分)1、数据集市4、元数据2、数据挖掘5、知识发现3、商业智能6、数据仓库1、数据集市通过更小、更集中的数据仓库向企业提供分析商业数据的廉价方法;Data Marts是一个具有特定应用程序的数据仓库,支持用户在主要应用程序或特定部门级别的应用程序中获得竞争优势,并找到进入新市场的具体解决方案。4 .元数据(metadata )被定义成与数据有关的数据(data about data ),其中元数据描述了数据仓库中的数据和环境。2、数据挖掘(DM) :KDD过程中的特定步骤,其为专业计算从法律数据中提取知识。3、商业智能基于数据仓库,通过在线分析处理和数据挖掘技术帮助企业领导对市场变化环境进行快速准确的决策。5、知识发现(KDD ) :从数据中发现有用知识的整个过程。6、数据仓库是决策支持系统(dss )和在线分析应用数据源的结构化数据环境。 数据仓库研究和解决从数据库中检索信息的问题。 数据仓库的特点在于主题、整合性、稳定性和时不变性。四、简单解答(每小题5分,共计30分)1 .数据仓库与数据挖掘的关系是否简要说明?数据仓库和数据挖掘是决策支持的新技术。 但是,有完全不同的决策支持方法。在数据仓库系统的前端分析工具中,数据挖掘是其中的重要工具之一。 这有助于确定用户挖掘数据仓库中数据的隐式规则。2 .比较统计学和数据挖掘的区别吗?n统计学主要通过数值计算(初期等运算)对数量数据(数值)和连续值数据(年龄、工资等)进行定量分析,得到数量信息。n数据挖掘主要对离散数据(如职务、病症等)进行定性分析(霸盖、归纳等),获得规律知识。n统计学和数据挖掘是不同的。 但是,它们之间是相互补充的。3 .是否将OLAP数据模型MOLAP与ROLAP进行比较?MOLAP是教师成为多维多维数据集,用于以后的查询分析,与此相对,ROLAP动态地生成Sql,通过制作查询关系型数据库,在不进行性能的优化的情况下,数据量大的情况下,性能的问题变得显着。ROLAP与MOLAP的比较罗拉公司摩拉公司沿用现有关系数据库的技术专为OLAP设计响应速度慢于MOLAP现有关系数据库对OLAP进行了大量优化,包括并行存储、并行查询、并行数据管理、基于成本的查询优化、位图索引和SQL OLAP扩展(cube、rollup )性能好,响应速度快数据加载速度快数据加载速度慢存储空间消耗较少,维数没有限制需要预测计算,数据可能会爆炸,不支持维数有限的维的动态变化借用RDBMS保存数据。 没有文件大小限制根据操作系统平台的文件大小,很难达到TB级别(10 g到20 g )您可以使用SQL存储详细信息和性能分析数据没有数据模型和数据访问标准不支持读写预期计算SQL无法完成部分计算什么不能完成多行计算无法完成跨维计算支持高性能决策支持计算复杂的交叉维度计算多用户读写操作计算行级别很难维护易于管理4 .比较数据挖掘和OLAP之间的区别吗?OLAP的典型应用是,在业务活动发生变化的查询中发现的问题可以跟踪查询、确定问题的原因以及帮助决策。数据挖掘任务是集群(神经网络集群等)、分类(决策树分类等)、预测等。5 .什么是有关数据仓库映射的元数据?除了描述数据仓库中的数据(数据仓库字典)之外,数据仓库元数据还包括三种元数据类型(1)有关数据源的元数据(2)与提取和转换有关的元数据(3)关于最终用户的元

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论