




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、导入foodmart数据与整理数据一、 导入数据数据仓库也是一种数据库,其管理同样是通过数据库管理系统(DBMS)来进行的。因此数据仓库可以像普通数据库一样进行创建、修改和删除。当数据仓库的逻辑结构设计完后,就可以创建物理数据仓库了。打开第二周安装的SQL2005开始,所有程序找到然后运行然后登录界面如下图注意 如果服务器名称空白,请单击旁边的下来菜单按钮,选择浏览更多,然后选择网络服务器,然后等待后,选择身份验证选择SQL身份验证用户名是:sa密码:123进行登录选择数据库右键,新建数据库,取名为foodmart,然后确定选择刚才新建的数据库 foodmart 右键 任务 导入数据 数据源
2、选择 access 在下拉菜单的上面文件名 选择 第三周文件夹里面的 foodmart2000 数据然后 进行下一步选择 SQL 身份 验证 同样用户名:sa密码:123下一步下一步这时会让用户选择源表和源视图。按照前面对数据仓库的设计,这里选择原始表中的time_by_day、promotion、product、product_class、customer、store和sales_fact_1998表作为需要输入的表。点击下一步。点击下一步点击完成点击关闭,这样数据导入完成.第二、整理数据设计好了结构良好的数据仓库,并且将需要分析的业务数据装载到了数据仓库中之后,就为满足商务决策的全方位需求
3、打下了根基,以后的操作都是基于这些拥有数据的数据仓库进行的。但是,对数据的多维分析却并不是主要针对数据仓库,而是针对从数据仓库中提取的子集,如数据集市和多维数据集(也称为数据立方)。因此通常还需要在具体分析数据之前创建数据立方。数据立方的创建和管理需要用到SQL Server 2005中Business Intelligence Development Studio的Analysis Services组件,即SSAS。找到第二周安装的软件这里将创建用于foodmart商店销售分析的数据立方,首先要创建一个SSAS的项目。打开Business Intelligence Development S
4、tudio,选择【文件】【新建】【项目】命令,或按【Ctrl+Shift+N】组合键以显示“新建项目”对话框。在“新建项目”对话框中,从“项目类型”选项组中选择“商业智能项目”。从“Visual Studio已安装的模板”选项组中选择“Analysis Services 项目”。在“名称”文本框中输入“foodmartsaleAS”作为项目名称,如图2-10所示。单击【确定】按钮进入SSAS的工作界面。图2-10 建立foodmart项目打开“解决方案资源管理器”,可以看到数据源、数据源视图、多维数据集、维度和挖掘结构等8个文件夹对象,建立和管理数据立方也是主要针对这8个对象进行的
5、。下面介绍创建数据立方的步骤。2.3.1 定义数据源这是创建数据立方的第1步。在“解决方案资源管理器”中的“数据源”文件夹上单击鼠标右键,在弹出的快捷菜单中选择【新建数据源】命令,如图2-11所示。图2-11 新建数据源在弹出的“选择如何定义连接”窗口中选择“基于现有连接或新连接创建数据源”单选按钮,在“数据连接”列表框中选择foodmart数据源,如果没有此连接,可以单击【新建】按钮,定义指向foodmart数据仓库的连接。设置完成后的页面如图2-12所示。图2-12 定义数据连接服务器名称选择自己本机用户名 同样sa 密码 123数据库选择刚才我们导入数
6、据的foodmart选择默认值,然后点击下一步.点击完成. 2.3.2 定义数据源视图数据源提供与数据库的简单连接,但更多高级功能,如缓存元数据、添加关系、创建计算和设置逻辑键等还需要使用数据源视图来完成。为了对多维数据集进行这些高级操作,这一步定义数据源视图。可以在“数据源视图”文件夹对象上单击鼠标右键,在弹出的快捷菜单中选择【新建数据源视图】命令,然后在弹出的“数据源视图向导”窗口中选择foodmartsaleDW选项作为关系数据源,单击【下一步】按钮。这时会弹出如图2-13所示的“名称匹配”窗口,其原因是在前面SSIS的数据装载操作中没有为数据仓库中的表设置主键及其关系,SS
7、AS试图在匹配的列上创建逻辑关系,可以选择“与主键同名”单选按钮,单击【下一步】按钮继续。图2-13 设置名称匹配这时进入“选择表和视图”窗口,如图2-14所示。可以从选定的数据源提供的对象列表中选择表和视图。这里主要的商务需求是对销售数据进行分析,所以可以把相关的数据表都选入数据源视图,对数据源中与分析需求关联不大的要素也可以不选入此分析视图,例如此处的region表可以不用选入数据源视图。以上操作完成后,单击【下一步】按钮,为此数据源视图命名为Vfoodmartsale,再单击【完成】按钮结束此向导。图2-14 选择表和视图按>>全部选择到右边 同样也是
8、由于数据源中的表没有设置主键的原因,现在打开的数据源视图上的表都是独立的,相互之间没有关系,还需要我们设置各个表的主键及其关系才能成为可用的视图。一般来说,事实表是没有主键的,而维度表都有主键,且每一个维度表的主键都是事实表的外键,因而,需要为每一个维度表设置主键,如图2-15所示,在维度表中选择应该为主键的字段,然后单击鼠标右键,在弹出的快捷菜单中选择【设置逻辑主键】命令,即可设置维度表的主键。图2-15 设置维度表的主键对每一个维度表设置好主键后,应该设置维度表和事实表之间的关系,方法是把事实表中的外键作为源,拖动到维度表中的相关字段,这时会弹出“创建关系”窗口,如图2-16所
9、示。需要注意的是一定要把外键表作为源,主键表作为目标,如果方向错了,可以单击图2-16的【反向】按钮以保证其关系符合业务数据中的逻辑关系。图2-16 “创建关系”对话框按照以上的步骤,设置好维度表和事实表之间的关系后,数据源视图将会如图2-17所示。注意方向性图2-17 设置好表间关系后的数据源视图做法 第一步 把所有数据源视图 拖放到同一界面,然后把sales_fact_1998放在最中间 其余数据放在周围然后 把其他后面有 _id 的选择 设置为主键 如图然后拖动 sales_fact_1998中的各个选项到分别其他表中。完成表与表之间的维度建立。2.3.3 生成多
10、维数据集这一步在上面创建的数据源视图的基础上生成多维数据集,方法如下。(1)在“解决方案资源管理器”中用鼠标右键单击“多维数据集”文件夹对象,在弹出的快捷菜单中选择【新建多维数据集】命令。(2)在弹出的“多维数据集向导”欢迎界面中单击【下一步】按钮进入“选择生成方法”窗口,如图2-18所示。在此窗口中选择“使用数据源生成多维数据集”单选按钮,并且确认选中了“自动生成”复选框,并在下拉列表框中选择“创建属性和层次结构”选项,以便向导能为维度表中的大多数列创建属性,并尝试建立包含多级的层次结构。图2-18 “选择生成方法”窗口在这一步可以发现,生成多维数据集可以暂时不用基于数据源,这实际代表了数据
11、立方的两种创建方法。关于它们之间的区别和联系,将在第5章中讲解。(3)单击【下一步】按钮,选择前面创建的数据源视图来为多维数据集提供数据。再单击【下一步】按钮,向导将扫描关系架构,以识别事实表和维度表。识别完成后,单击【下一步】按钮将会弹出如图2-19所示的“标识事实数据表和维度表”窗口。选择“time_by_day”作为时间维度表,并且按照图中所示来分别设置各表为事实表或是维度表。设置好后单击【下一步】按钮继续。图2-19 标识事实数据表和维度表(4)由于上一步选择了“time_by_day”作为时间维度表,这一步需要设置时间维度的层次结构。在所有维度的层次结构中,只有时间维度最
12、为特殊。其他维度系统可以根据数据之间的关系检测其层次结构,而时间维度则需要指定其时间上的层次。如图2-20所示,依据时间表中的具体情况,为年月日等时间属性指定时间表列。设置好后单击【下一步】按钮继续。图2-20 指定时间维度层次结构(5)这时系统将会让用户选择度量值,如图2-21所示。度量是来源于事实表中的数据,在图中选择“Store Sales”、“Store Cost”和“Unit Sales”为度量。单击【下一步】按钮继续。图2-21 选择度量值(6)这时系统将会依据前面对维度表和事实表的设置来检测层次结构。如果前面的设置都是正确的,则会成功检测其层次结构,检测完毕,单击【下一步】按钮继续。(7)由于前面系统自动检测了维度之间的层次关系,因此,产生了一些新的维度,这一步向导将提供一个窗口来查看新建维度的结构并根据需要进行更改。此例中的新建维度结构关系如图2-22所示。可见,由程序自动分析出来的层次结构和用户自己设置的时间层次结构都是和业务数据中的逻辑结构相符合的。如果不符合,则可以在这一步进行修改。设置完成后单击【下一步】按钮,为多维数据集指定一个名称,再单击【完成】按钮,结束多维数据集的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖北黄冈应急管理职业技术学院《国际商务策划》2023-2024学年第二学期期末试卷
- Unit 5 Topic 2 Section C 教学设计 2024-2025学年仁爱科普版八年级英语下册
- 比例的认识(教学设计)-2023-2024学年六年级下册数学北师大版
- 庆阳职业技术学院《工业通风与除尘》2023-2024学年第二学期期末试卷
- 宣化科技职业学院《建筑风景速写》2023-2024学年第二学期期末试卷
- 辽宁现代服务职业技术学院《食品生物化学(实验)》2023-2024学年第二学期期末试卷
- 济南2024年山东济南市章丘区社区工作者招考10人笔试历年参考题库附带答案详解
- 信阳师范大学《语文课堂教学技能》2023-2024学年第二学期期末试卷
- 济南护理职业学院《中西医结合实验诊断研究》2023-2024学年第二学期期末试卷
- 河南质量工程职业学院《结构化学C》2023-2024学年第二学期期末试卷
- 选择性必修二《Unit 4 Journey across a vast land》单元教学设计
- 2024年一年级数学下册教学计划15篇
- 2024年时事政治题(考点梳理)
- 岭南版六年级美术下册教学工作计划
- 门诊常见疾病护理常规课件
- 数字化时代的智慧课堂建设与应用
- 初中九年级美术期末艺术测评指标试卷及答案
- 药品经营质量管理制度样本
- 有机农业概述课件
- 沙子检测报告
- 2023-2024学年部编版必修下册 1-1 《子路、曾皙、冉有、公西华侍坐》教案2
评论
0/150
提交评论