版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据仓库与数据挖掘课程实验u 课程实验课程实验部分安排八个有代表性的上机实验与课程内容相呼应,每一个实验安排两学时。学生应在实际操作中规范地完成各项实验。更深入理解数据仓库及OLAP系统工作原理,构建数据仓库、熟练掌握OLAP操作。实验完成后,教师在实验结束前,现场验收学生的完成情况,并给出现场评定,最后结合实验报告给出实验成绩。实验一 认识sql server2000 一、 实验目的1、 通过某个商用数据库管理系统的安装使用,初步了解DBMS的工作环境和系统构架。2、 熟悉对DBMS的安装。搭建今后实验的平台。3、 了解所选DBMS系统的主要组件。4、 理解数据库、数据表、属性、关键字等关系
2、数据库中的基本概念。5、 熟悉利用管理器创建数据库、数据表并向表中插入数据6、 查询数据表中数据。二、 实验平台操作系统:windows2000或者windows XP 数据库管理系统:国产如KingbaseES,国外如:MS SQL Server, Oracle。三、 实验内容及要求1. 安装和启动i. 根据安装文件的说明安装数据库管理系统。在安装过程中记录安装的选择,并且对所作的选择进行思考,为何要进行这样的配置,对今后运行数据库管理系统会有什么影响。ii. 学会启动和停止数据库服务,思考可以用哪些方式来完成启动和停止。2. 初步了解DBMS的安全性i. 这里主要是用户的登录和服务器预定义
3、角色。可以尝试建立一个新的用户,赋予其数据库管理员的角色,今后的实验可以用该用户来创建数据库应用。3. 数据库系统的构架i. 了解数据库系统的逻辑组件:它们主要是数据库对象,包括基本表、视图、触发器、存储过程、约束等。今后将学习如何操作这些数据库对象。4. DBMS的管理和使用了解DBMS如何通过它提供的工具对数据和数据库服务器进行管理和使用的。i. 学会运用控制管理器和企业管理器进行操作。u 利用管理器创建school数据库,创建关系数据库SCHOOL表:u 学生表student(sno,sname,ssex.sage,sdept,grade),u 课程表course(cno,cname,c
4、pno,chour,ccredit),u 教师表 teacher(tno,tname,email,salary)。u 其中,Sno,cno,tno分别是各表的主键,具有唯一性约束u 向各个数据表中输入适当的数据。u 查询表中的数据。ii. 了解系统其他管理工具熟悉数据库的备份与还原工具的使用。对创建的school数据库进行备份和还原操作。实验二、 设计数据仓库并利用DTS工具建立数据仓库一、 实验目的熟悉数据仓库的设计过程,并能够利用DTS工具建立数据仓库。二、 实验平台操作系统:windows2000或者windows XP 数据库管理系统: MS SQL Server三、 实验要求1. 实
5、验数据采用SQL SERVER2000 提供的pubs 示例数据库作为OLTP源系统。2. pubs是一个图书出版公司的数据库,记录图书出版及销售等各个方面的信息。该公司的销售部门给予实用数据仓库为销售策略作辅助支持,采用自底向上的开发模式。先为销售部门设计一个数据集市。3. 分析需求:a) 希望针对每个出版社作图书销售业绩分析b) 希望针对每个国家的出版社图书销售业绩分析c) 希望针对每个州的出版社图书销售业绩分析d) 希望针对每个城市的出版社图书销售业绩分析e) 希望针对每本图书做销售业绩分析f) 希望针对每类图书做销售业绩分析g) 希望针对每年出版的图书做销售业绩分析h) 希望针对每位作
6、者所编写的图书做销售业绩分析i) 希望针对每个书店做销售业绩分析j) 希望针对每个州的书店做销售业绩分析k) 希望针对每个城市的书店做销售业绩分析l) 希望针对年、季、月做销售业绩分析4. 设计事实数据表和维度数据表,创建数据仓库。四、 实验内容1. 分析pubs数据库的架构,画出关系图。 分析pubs数据表含义。序号数据表名称作用1Publishers出版社表记录出版社的基本信息2Pub_info出版社信息表记录出版社的标志和其他信息3Employee雇员表记录雇员的基本信息4Jobs工作表记录工作的基本信息5Roysched版税表记录图书的版税情况6Titles图书表记录图书的基本信息7T
7、itleauthor图书作者表记录图书和作者之间的关系8Authors作者表记录作者基本信息9Sales销售表记录图书在各书店的销售信息10Stores书店表记录书店的基本信息11discounts折扣表记录书店的打折信息2. 针对需求进行归纳,发现分析的角度可以分为出版社、图书、作者、书店和时间5大类。确定的主题是销售。3. 数据筛选:a) Publishers所有字段应当加入到数据仓库中。b) 不需要出版社详细资料,所以Pub_info不必加入数据仓库。c) 不需要出版社中员工的信息,所以employee和jobs不需要;d) 同样与税率相关的roysched表和titles表中的roya
8、lty和titleauthor表中的royaltyper字段排除掉。e) 也不需要图书的预付款、年销售量、出版日期、摘要说明等信息,排除了titles表中的advance,ytd_sales,notes和pubdate .f) 对于书店表,公司只对书店的地理位置感兴趣;暂不考虑折扣情况。4. 可用的数据:a) Publishers所有字段b) Titles(title_id, pub_id, title, type, price)c) Authors( au_id, au_lname, au_fname)d) Sales( stor_id, title_id ord_num, qty, ord
9、_date)e) Stores( stor_id, stor_name, city, state)5. 识别事实数据与维度数据事实数据维度数据规模几百万笔/上亿笔数据远比事实数据少数据标识拥有多个外键只有单一主键数据类型数值数据字符数据数据性质不会改变经常改变系统分析的范围归纳为出版社、作者、图书、书店和时间5大类,维度就是数据分析的角度,可以分为5项:u 出版社:publisher表中的全部字段属于出版社维度,city,state,country有层次结构。u 作者:author表中的属性为图书维u 图书: sales.title_id, title表中除了price其他title_id,t
10、itle,type,pub_id为图书维。Price为事实。u 书店:store全部字段为图书维度,sales.store_id,u 时间:sales.ord_date 关于事实:sales中的ord_num和qty字段。事实表:sales(pub_id,stor_id,title_id,ord_date,qty, unitprice,total)维表:publishes(pubIid,pub_name,city,state,country) Books(title_id,book_name,type,pubdae) Stores(stor_id,stor_name,stor_city,sto
11、r_state) Authors(title_id,au_id,au_name) Time(ord_date)6. 利用DTS实现数据库数据的加载u Sales事实表:select p.pub_id,st.stor_id,t.title_id,s.ord_date,s.qty,t.price unitprice from publishers p,stores st,titles t,sales s where t.pub_id=p.pub_id and s.title_id=t.title_id and s.stor_id =st.stor_id关于total字段的数据处理 function
12、 Main()DTSDestination(total) = DTSSource(qty)*DTSSource(unitprice);return(DTSTransformStat_OK);u Publishers维度表与源publishers完全一致u Books维信息来源于titles表Select title_id, title, type, pubdate from titlesu Authors表Select ta.title_id,ta.au_id,a.au_fname,a.au_lname from titleauthor ta, authors a where ta.au_id=a.au_id修改表明为authors,删除au_fname和au_lname字段,并添加au_name字段。DTSDestination(“au_name”)=DTSSource(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024杂志广告刊登广告合同
- 专题02成语、熟语辨析-2022-2023学年四年级语文上册期末复习知识点精讲精练(部编版)
- 2024河北劳动合同范本
- 深圳大学《音乐教学法》2023-2024学年第一学期期末试卷
- 采购订单终止合同模板(2篇)
- 香蕉转让合同范本(2篇)
- 养老院阿尔兹海默症协议书(2篇)
- 关于考试的检讨书
- 出纳人员年终工作总结
- 企业发生火灾应急预案(6篇)
- 教科版三年级科学上册《第1单元第1课时 水到哪里去了》教学课件
- 通信技术工程师招聘笔试题与参考答案(某世界500强集团)2024年
- 国际贸易术语2020
- 国网新安规培训考试题及答案
- 2024至2030年中国节流孔板组数据监测研究报告
- 黑龙江省哈尔滨市师大附中2024-2025学年高一上学期10月阶段性考试英语试题含答案
- 第六单元测试卷-2024-2025学年统编版语文三年级上册
- 【课件】Unit4+Section+B+(Project)课件人教版(2024)七年级英语上册
- 青少年法治教育实践基地建设活动实施方案
- 绿化养护续签合同申请书范文
- 教科(2024秋)版科学三年级上册2.6 我们来做“热气球”教学设计
评论
0/150
提交评论