




已阅读5页,还剩123页未读, 继续免费阅读
(管理科学与工程专业论文)基于联机分析处理技术的销售管理系统的研究与开发.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 在服装行业日益激烈的竞争过程中,我国的服装企业面临着如何有效地整 合产业链上的各类信息,将业务流程电子化;以实现供应链的快速反应的问题。 随着企业规模的不断扩大,市场竞争的不断加剧,企业的运营层如何把正确的 信息、在正确的时机、提供给相应的决策层,以及决策层如何及时准确地获得 必要的决策参考信息等问题将成为一个紧迫而复杂的课题。 随着信息技术的高速发展和仑业界需求的多样化、复杂化,数据仓库技术 应运而生。数据仓库提供了一个数据平台,在此基础上可以进行强有力的数据 分析、数据挖掘和报表处理,以支持管理决策。虽然很多公司相继推出了数据 仓库产品,但对数据仓库技术的研究仍然方兴未艾。数据仓库的建设不是一个 简单的技术问题,而是一项复杂的系统工程。联机分析处理是数据仓库的一个 最典型的应用。它能将数据仓库中的数据按照不同的粒度进行聚合和预计算, 从而在用户面前展现多维数据视图。同时,联机分析处理还提供了较直观的多 维分析操作,包括切片、切块、上卷、下钻和旋转等,使用户能多角度、多层 次地观察数据仓库中的数据。 , 首先,本文利用实际研究与理论归纳相结合的手段,对论文的研究背景进 行阐述,总结了国内外的研究现状,探讨了研究的目的和实际意义。之后,通 过综合国内外学者的研究成果,对数据仓库和o l a p 技术的理论原理进行全面 地分析,并研究了数据仓库、o l a p 和数据挖掘三者之间的关系。进而在理论 研究的基础之上,结合服装行业的背景和我国某服装企业销售业务的具体需求 分析,提出了基于联机分析处理技术的销售管理系统的总体解决方案,该解决 方案分为两大主要部分,一部分是销售管理系统( o u r p 系统) ,另一部分是在此 系统基础之上,运用数据仓库技术将数据库中的数据通过转换、加载与清洗到 销售o l a p 分析数据仓库中,而开发的销售o l a p 分析系统。并构建了解决方 案的总体结构以保证系统的设计方案具备较高的实用价值和技术可行性。然后, 东华大学管理学硕1 :学位论文 通过对销售管理系统的功能结构和数据库的分析与设计,利用s u a lb a s i c n e t 与s q ls e e r 2 0 0 0 开发实现所有功能模块。并在所开发的销售管理系统的基础 上设计和建立了数据仓库和0 乙廿模型。最后,通过对o l a p 前端应用程序开 发方法的研究,用a s p 结合m d x 和a d 0m d 开发并实现了基于w 曲的销售 0 l 廿分析系统,结合该系统运行效果的分析说明了系统的有效性和现实意义。 本论文的主要贡献在于结合我国服装行业某龙头企业销售业务的具体需 求,研究了数据仓库和联机分析处理技术在销售管理系统中的应用原理;建立 了数据仓库三级模型和四个主题的多维分析模型;提出了基于联机分析处理技 术的销售管理系统整体解决方案;最后开发实现了相应的原型系统。为企业进 行销售与营销决策提供了支持,辅助决策者快速制定正确的销售策略,尤其是 全面提高了服装企业销售与营销的决策水平和市场竞争能力。本研究成果对在 我国服装,行业乃至其他行业中实施数据仓库的解决方案有一定的实际参考价 值,可显著地提高企业的经济效益和科学决策水平。 关键词数据仓库;联机分析处理;销售管理系统;多维分析模型 a b s t m c t a b s t r a c t t h ec o m p e t i t i o nb e c o m e sm o r ea n dm o r ed r a s t i ci nr a gt r a d e t h ed o m e s t i c e n t e 叩r i s e sf a c c dt 0m 锄yp r o b l e m ss u c ha sh o wt 0i n t e 黟a l ev 撕0 u si n f 0 彻a t i o n si n j n d u s t r yc h a i ne f f e c t i v e l y a st h es c a l eo fe n t c r p r i s e sb e c o m el a r g e r t 1 l ep r o b i e m t h a th o wt h eo p e r a t o r p r o v i d et h er i g h t ,i n f o r m a t i o na t t h er i g h tt i m et ot h e d e c i s i o n m a k e r si nt h ee n t e 叩r j s ea n dh o wt h ed e c i s i o n - m a k e r sg e tt h er i g i l t i n f b 珊a t i o ne x a c t l yw i l lb e c o m em o r eu r g e n ta n dc o m p l i c a t e d a st h er a p i d d e v e l o p m e n to fi n f o 咖a t i o nt e c l l i l 0 1 0 9 y 孤dt h ed e m a n d0 f e n t e 叩r i s e sb e c o m em o r ed i v e r s ea n dc o m p l i c a t e d t 1 l et e c h n o l o g yo f d a t aw a r e h o u s e i sp r e s e n t e d d a t aw a r e h o u s e p r 0 v i d e sad a t ap l a t f 0 咖w | ec a nd od a t aa n a l y s i s ,d a t a m i n i n ga n df e p o np f o c e s s i n gt 0s u p p o r tt h ed e c i s i o n m a k i n gb a s e d 伽t h i sp l a t f 6 姗 伽t h o u g l lm a n ye n t e r p r i s e sp r 0 v i d es o l u t i o n so fd a t aw a r e h o u s e ,m er e s e a r c ho ft h i s t e c h n o l o g yj s s t i l lg o j n go n 0 l a pj st h et y p i e h la p p l i c a t i o no fd a t aw a r e h o u s e i t c a np r o c e s st h ed a t ai nt h ed a t aw a r e h o u s et 0s h o wt h em u l t i m e n s i o n a ld a t av i e wt 0 u s e 硌a tt h es a m et i m e ,o l a pp r o v i d e st h em o f ec o n v e n i e n to p e r a t i o ni i l c l u d i n g , s l i c e ,d i c e ,d r i l la i l ds 0o n t h eu s e r sc a no b s e r v et h ed a t af 】r o md i f f c r e n tl e v e l s f i r s t ,t h i sp a p a rs e tf o r t ht h eb a c k g r o u n do fr e s e a r c ha n ds u m m a r i z et h ec u h e m r e s e a r c h ,d i s c u s st h et a 唱e ta n dm e a l l i n go ft h i sr c a r c h t h e n ,t h r o u g l li l l t e 伊a t i n g t l l ea c h j e v e m e n to fm a n ys c h o l a r s r e s e a r c h t i l l ea u t h o ra n a l y z e st h et h e o 巧o fd a t a w a r e h o u s ea n do l a pa sw e l la st h er e l a t i o n s h i pa m o n gd a t aw a r e h o u s e ,o l a pa n d d a t am i n i h g b a s e do nt h i sr e s e a r c ha n dc o n ,b i n et h eb a c k g r o u n do fr a gt i a d ea n d d e m a n do fac e n a i nc o m p a n y ,t h ea u t h o rb r i n gf o r w a r daw h o l es o l u t i o no ft h es a l e s m a n a g e m e n ts y s t e mb a s e do l l0 l a p t h i ss o l u t i o nc o n t a i nt w op a r t s :0 n ei s s a l e s m a n a g c m e n ts y s t c m ( o i j p ) a n o t h e ri ss a i e so l a pa n a l y s i ss y s t e mb a s e do nw e b i c o n s t r u c t e dt h ew h o l es t r u c t u r et oc n s u r et h ep r a c t i c a l i t ya n dt e c l u l i cf e a s i b i t i yo ft h i s 1 1 1 东牛人学管理学硕i j 学位论文 s y s t e m a f t e rt h a t ,t h ea u t h o ru s ev i s u a lb a s i c n e t 髓ds q ls e e r2 0 0 1 0d e v e l 叩柚d r e a l i z ea l lf u n c t i o nm o d u l e s b a s e do nt h i ss y s t e m ,t h ea u t h o ru s ea s p ,m d xa i l d a d om dd e v e l o p 柚dr e a l i z et h es a l e so l a ps y s t e m f i n a l l y t h ea u t h o r 柚a l y z e s t h ee 仃e c to f s y s t e ma p p l i c a t i o n n l e m a i nc o n t r i b u t i o no ft h i sp a p a ri sr e s e a i h i n gt h ea p p l i c a t i o np r i n c i p l eo f d a t aw a r e h o u s ea n do l a pi nt h es a l e sm a n a g e m e n ts y s t e mb a s e do nt h ed e m a n do fa c e n a i nc o m p a n yi nr a gt r a d ei no u rc o u n t r y s e t t i n gu pad a t aw a r e h o u s e s3l e v e i m o d e l sa n d4t o p i c so fd i m e n s i o n a la n a l y s i sm o d e l s ,p r 0 v i d i n gaw h o l es o l u t i o no f s a l e sm a n a g e m e n ts y s t e mb a s e do no l a pa n df i n a l l yd e v e l o p i n g 勰dr e a l i z i n gt h e s y s t e m n ea c h i e v e m e n to ft h i sr e s e a r c hs u p p o n st h ed e c i s i o n - m a k i n gi ns a l e sa i l d m a r k e t i n g ,a s s i s t st h ed e c i s i 9 n - m a k e re s t a b l j s h e st h er i g h ts t r a t e g y e s p e c i a l l y i t i m p r o v e dt h ed e c i s i o nl e v e la n dm a r k e t i n gc o n l p e t i t i v ec a p a c i t y0 ft h ec o m p a n i e s s a l e s 蕊dm a r k e t i n gb u s i n e s s t h ea c h i e v e m e n to ft h i sr e s e a r c hh a sac e 渤i n r e f e r e n c ev a l u eo fi m p l e m e n t i n gt h ed a t aw a r e h o u s es o l u t i o ni 1 1r a gt r a d eo ro t h e r i n d u s t r j e s k e y w o r d s d a t aw 耵e h o u s e ;o l a p ;s a l e sm a n a g e m e n ts y s t e m ;d i m e n s i o n a l a n a l y s i sm o d e l i v 东华人学管卫l ! 学硕十学位论文 图目录 图2 1 数据仓库的数据组织结构:1 0 图2 2 数据粒度级的权衡1 3 图2 3 数据仓库系统的基本体系结构1 5 图2 4 销售数据多维立方体2 0 图2 5 切片示意图2 l 图2 6 钻取标示图2 2 图2 7 旋转标示图2 2 图2 8m o l a p 结构:2 4 图2 9r o l a p 结构2 5 图2 1 00 l a p 系统的应用体系结构,。2 8 图3 1 “自顶向下”的办法? - 4 6 图3 2 “由下至顶”的办法一4 7 图3 3 联合型数据仓库开发方法:4 7 图3 4 基于0 l a p 的销售管理系统的总体结构5 1 图3 5a n a l y s i ss e r v i c e 体系结构5 3 图4 1 销售管理系统业务流程图+ 5 6 图4 2 销售管理系统的功能结构图5 7 图4 3 产品信息管理模块界面5 9 图4 4 合同管理模块界面6 l 图4 5 销售发票管理模块界面6 2 图5 1 数据仓库设计步骤6 5 图5 2 企业控制系统模型6 6 图5 3x y 集团公司企业数据模型:6 6 图5 4 销售事实分析星型模型图:! 7 6 图5 5销售分析立方体数据示意图7 7 图日录 图5 6 顾客分析星型模型图7 9 图5 7 顾客分析立方体数据示意图8 0 图5 8 发货分析星型模型图。8 l 图5 9 发货分析立方体数据示意图。8 2 图5 1 0 应收帐款分析星型模型图:j 8 4 图5 一1 1 应收帐款分析立方体数据示意图8 5 图6 一l 数据透视表服务8 6 j 图6 2a d om d 对象模型9 l 图6 3 数据展现系统的三层体系结构:9 3 图6 4 业务分析流程:9 4 图6 5 销售图表分析界面:9 6 图6 6 销售分析界面9 7 图6 7 顾客分析界面9 8 图6 8 发货分析界面:9 9 东华大学管理学顾i j 学位论文 表目录 表2 一lr o l a p 与m o l a p 结构比较,2 6 表2 22 0 0 2 2 0 0 5 年前1 0 名o l a p 服务提供商3 2 x 东华人学学位论文原创性声明 东华大学学位论文原创性声明 本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的 学位论文,是本人在导师的指导下,独立进行研究工作所取得的 成果。除文中已明确注明和引用的内容外,本论文不包含任何其 他个人或集体已经发表或撰写过的作品及成果的内容。论文为本 人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律 结果由本人承担。 学位论文作者签名:丢写 日期:私唧年月7 ,日 东芦大学学化论文版权使用授权书 东华大学学位论文版权使用授权书 学位论文作者完全了解学校有关保留、使用学位论文的规定, 同意学校保留并向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论 文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印或扫描等复制手段保存和汇编本学位论文。 保密衫在二兰年解密后适用本版权书。 本学位论文属于 不保密口。 第1 章绪论 1 1 研究背景 第1 章绪论 加入世界贸易组织后,我国企业面对国内外市场的巨大潜力和激烈竞争, ? 机遇与挑战并存。为了适应客观条件的变化,。企业必须借助已有的数据资源 和现代信息技术,提高综合运作能力和决策水平,实现技术创新、管理创新、 制度创新和知识创新。信息化在一定程度上改变了企业生产、经营及服务的 新方式,它把企业与企业、企业与客户紧紧地联系起来。信息系统已经为众 多企业的发展提供源源不断的动力和良好的保障。 目前企业应用的信息系统的主要功能是通过对大量数据的实时汇总和计 算得到相应的报表,数据的处理速度有了较大提高,对生产和销售数据的查 询也比较容易获取。信息技术的广泛应用提高了企业管理的技术含量和自动 化程度,在一定程度上避免了盲目决策。但在市场经济环境下,企业面临着 如何开发新的产品、提高产品质量、降低生产成本、为客户提供个性化的服 务并有效地扩大市场份额等一系列问题,企业需要处理的信息呈爆炸式增长。 对于高层管理者来说则需要来自企业内部各部门、各个时期以及市场等 方面的及时i 准确的信息来支持决策,但是从规模庞大、数据完整但“事无 巨细的信息系统中直接获取对他进行宏观决策时所需的数据是很困难的。 只有使用综合企业内部各种信息资源以及企业外部的信息,以形成一致的数 据结构才能满足这种需求。而以事务处理为主的信息系统是力所不能及的。 随着社会经济的不断发展,科技的进步同新月异,而经济的发展又促使 市场向多元化方向发展。这一系列的变化迫切需要将新技术注入到企业的现 代化经营决策中来,从而辅助企业经营者及相关人员解决企业各方面的难题。 调查表明,造成决策质量不佳的一个重要原因是数据被分散地储存在企 业组织内各个独立的数据库。数据仓库完全能够帮助企业冲破数据库的桎梏, 东牛大学管理学硕i j 学位论文 实现即时存取制定决策所需的数据,进而做出正确决策,实时掌握盈利表现, 客户忠诚度及其他重要运营指标的能力。 在激烈的市场竞争中,经营战略与策略的研究与开发决定着企业的命运, | 正确决策的制定与实施是企业经营的核心所在。正确及时的决策足企业生存 和发展的最重要环节。现在,越来越多的企业认识到,要想在竞争中取胜, 获得更大的收益,必须利用网络、数据仓库等计算机技术,深层次地挖掘、 分析当前和历史的业务数据,以及相关的环境数据,自动快速地获取其中有 用的决策信息,为企业提供快速、准确和方便的决策支持。 1 2 国内外的研究现状 近年来,数据仓库理论研究已经逐渐成型,o l a p 和数据挖掘作为数据 仓库最主要的两项应用技术引起了学术界和企业界的广泛关注。由于这两项 技术具有极高的实用价值和理论价值,凶而成为学术界研究的热门领域。从 逻辑上讲,数据仓库就是一个多维数据库。o l a p 以多维分析为基础,刻画 了在管理和决策过程中通过对数据仓库的访问,实现对数据多层面、多角度 的分析处理;并以直观易懂的形式将结果提供给决策者1 1 】。 数据仓库和联机分析处理( o l a p ) 是在1 9 9 0 年以后提出的词汇和概念。一 般来讲,联机分析处理是一个软件工具,使用这一工具,数据被储存为“多维 数据”的形式,并对多维数据进行查询和浏览【列。而数据仓库具有更广泛的意 义,它描述一个过程,在这一过程中根据特定策略组织数据,使用户可以通 过使用在线数据查询技术来有效地获取信息和支持决策。 随着计算机硬件技术的快速发展,多维数据分析这一在大型机中采用的 技术逐渐向以p c 为基础的数据库发展。在1 9 9 9 年微软推出m i c r o s o f ts q l s e r v e r 7 0 时,至少己经有l o 个以上的公司提供各种在线数据查询的工具。1 9 9 7 年美国市场调禽表明,有关数据仓库项f 1 的平均成本是2 0 0 5 0 0 万美元。这些 资金主要用于硬件扩充,软件开发和人员培训。1 因而那时只有大型公司才有 第1 章绪论 可能发展数据仓库及其集成应用系统。1 9 9 8 年以后,人们的注意力转向组建 便宜、快捷的中小型数据仓库应用系统;2 0 0 0 年以后,数据仓库应用系统的 开发与应用达到了高潮。 目前,o l a p 技术广泛应用于医疗保健、金融、制造业、商业零售、电 信、公用事业等行业中,其他有能力的企业也在迫不及待地建立自己的o l a p 系统。由于看好0 l a p 技术的发展前景,专家们对o l a p 技术的研究成果 越来越多,o l a p 产品的提供商也在不断的改善产品性能、增加功能和升级 产品。国外的许多厂商都推出了比较成熟的数据仓库与o l a p 解决方案和产 品,如m i c r o s o f t 公司的a n a l y s i ss e i c 矗,i b m 公司的i n t e l l i g e n c 9m i n e r , o r a c l e 的d a 刑i n 等。这些系统既可以对数据进行快速的多维查询( 0 l a p ) , 还可以对数据作深度挖掘,得出令人感兴趣的结论,为企业决策支持提供了 数据基础和理论根据。国际上许多重要的学术会议,如超大型数据库国际会 议( v l d b ) ,数据工程国际会议( d a t ae n g i n f e e r i n g ) 等,都出现了专门研究数据 仓库、联机分析处理( o l a p ) 和数据挖掘( d m ) 的论文。许多研究机构也相继 推出自己的原型系统,如加拿大s i m o nf r a s e r 大学的教学系统 d b m i i i e r l 3 1 ,中科院计算所的m s m i n e f l 4 1 ,复旦大学的a m i n e r l 5 1 等。 对于数据仓库应用领域而言,虽然取得了很大的进展,但目前在某些具 体应用上还有许多值得探索的方面。如在原型系统的开发中,几乎不可能自 己去开发数据库引擎和0 l p 引擎,这样就需要借助于某个中间件( c o m ) 来 完成这项工作,这就存在方法和体系结构的问题。在相关性分析中,针对大 数据集的分析的效率问题。另一犬研究热点是:如何将o l a p 技术与数据挖 掘技术以及在多维数据库中发现知识集成在一起,形成联机分析挖掘 ( o l a m ) 。此外还有超立方体计算与传统挖掘算法的结合,o l a p 基于w e b 的应用,。分布式o l a p 技术,基于高级数据库的o l a p 技术等研究方向都是 目前o l a p 领域内的研究热点。 迄今为止,国内还没有成熟的o l a p 产品,国内的研究还有很多空白有 东华火学管理学硕十学位论文 错填补,国内企业对数据仓库的成功应用也不多,而国外的产品由于语言、 习惯、价格等因素,不一定适合国内的企业。因此研究高效的数据仓库应用 系统并使之实用化已势在必行,具有非常重要的理论研究意义和应用推广价 , 值。 1 3 研究的目的和意义 虽然数据仓库技术在国内的应用己开始形成热潮,但与发达国家相比还 存在着很大的差距。由于我国国内企业信息化基础建设起步较晚,用于信息 化建设的投资力度较低,因此,要使数据管理上升到数据仓库水平会遇到一 些麻烦。虽然国内很多企业在实施数据仓库项目,但成功的案例并不多,其 中存在各方面的因素。 实施数据仓库是一项复杂的系统工程,目前市场上已有的数据仓库产品 基本上是解决所有商业模式的通用系统,数据抽取、净化与转化等数据仓库 工具不能完全适应应用需求,实施数据仓库的方法也不能很好的满足具体企 业的需求。因此,必须根据企业实际和行业特点,针对企业实施数据仓库的 关键问题和关键技术进行分析,提出企业数据仓库的解决方案。 在实施数据仓库的企业里,企业管理者和一般员工对实施数据仓库系统 的认识不够,无法提出准确的需求或者不知如何表示需求;由于缺乏有效的 交流,开发人员不能很好地把握客户提出的要求,导致开发效率低,甚至失 败。数据仓库存储的对象是商务数据,商务数据在本质上是多维的、灵活的、 多样的。快速的查询要求使得数据仓库的数据结构非常复杂,数据模型是数 据结构的典型表现,建立伸缩性强的数据模型是建立数据仓库系统的核心和 难点问题。本论文采用多维数据建模技术,建立分层的数据模型结构,即概 念数据模型、逻辑数据模型和物理数据模型,有效地提高系统的开发效率和 成功率j 将数据仓库产品应用到企业实际,需要进行深入的应用研究。本论文以 第1 章绪论 国内一家休闲服装行业龙头企业销售业务的需求为背景,在研究了数据仓库 与联机分析处理的关键技术的基础之上,探索适合企业实际的数据仓库体系 结构、设计方法、实施策略及应用技术。并结合企业决策的具体需求,完成 ii 基于联机分析处理技术的销售管理系统的设计与实现,完成相关应用系统的 开发。 通过本次毕业论文的研究,从理论和实践上提供一套有效的方法和工具, 为企业全面进行数据仓库、联机分析、数据挖掘、决策支持系统的研究与开 发提供参考。企业成功的建立数据仓库,不仅能有效提高企业数据利用率和 信息利用能力,而且能全面提高企业创新能力和国际竞争力,推动企业管理 决策水平的提高。本课题的研究具有重要的实际应用价值。 1 4 论文的主要工作 1 4 1 研究内容 本文根据企业的实际需求,结合企业决策需求的目标,以业务分析为切 入点,深入研究和分析了基于联机分析处理技术的销售管理系统中的o l 心 技术、数据仓库模型的设计方法、实施策略等。本文的主要工作是: 本论文首先通过对研究背景的分析,得出了本论文研究的必要性和实际 意义。研究了创建数据仓库的理论及技术,然后在数据仓库理论的指导下研 究了创建商业企业销售数据仓库的方法、模型和步骤。 在销售o l a p 分析系统数据仓库设计中,采用概念模型、逻辑模型、物 理模型三段式数据模型设计方法来创建销售数据仓库。创建多个立方体,不 t 同的立方体对企业销售数据仓库中数据的分析角度不同。 在结合某集团公司的具体业务需求分析的基础上,给出了企业基于 o l a p 的销售管理系统的总体解决方案,并实现了基于联机分析处理技术的 销售管理系统的了于发与应用。 东毕久学管珲学顾+ 1 ,! 纠节论殳 通过对销售业务的完成情况及有关环境数据进行多角度多层次的分析, 基于o l 廿的销售管理系统可以使商业企业经营决策者及时掌握销售内部的 运行情况和发展趋势,并对制定销售计划和长远规划提供理论指导,提高企 业的管理水平和竞争优势。 1 4 2 论文创新点 本文主要创新点,如下所示: ( 1 ) 结合我国国内服装行业具有代表性的企业的销售业务的具体需求, 建立了一套完整的基于o l p 技术的销售管理系统解决方案,该解决方案不 仅包括基于数据仓库的销售0 l 垤分析系统,还根据企业销售业务流程的实 际特点,建立了基于数据库的销售管理系统做为整个解决方案的底层。体现 了该解决方案的完整性和实用性。 ( 2 ) 根据企业销售业务分析的具体需求,建立了销售分析、顾客分析、 发货分析和应收帐款分析四个分析主题,建立了数据仓库的概念模型、逻辑 模型和物理模型,并在此基础之上,建立了四个分析主题的星型模型、事实 表和维度表等。 t ( 3 ) o l 心技术与w e b 技术的结合是目前数据仓库与商业智能分析领域 研究的热点,基于0 l a p 技术的销售管理系统解决方案包括了基于c s 结构 的销售管理系统和基于b s 结构的销售o l a p 分析系统。 1 5 论文的组织结构 第一章绪论。首先介绍了论文研究的背景,以及国内外研究的现状,然 后探讨了本论文研究的必要性和实际意义。 第二章通过对大量资料的汇总研究,阐述了本论文中销售管理系统研究 与开发的技术基础数据仓库与联机分析处理技术,对其概念,体系结构 等方面进行了介绍,分析了o l a p 技术的三种数据组织方式,并对商业智能 ( b i ) 的主流技术数据仓库、o l a p 与数据挖掘的关系进行分析,最后介 第l 章。绪论 绍了业界内主流的o l a p 解决方案。 第三章首先通过对服装行、l k 背景的研究,并结合了某服装企业的具体情 况,着重分析了其销售业务的需求,在此基础之上,提出了基于联机分析处 理技术的销售管理系统的总体解决方案,本解决方案分为两大主要部分,一 部分是销售管理系统( o u 阿系统) ,另一部分是在此系统基础之上,运用数据 仓库技术将数据库中的数据通过转换、加载与清洗到销售o l a p 分析数据仓 库中,而开发的销售o l a p 分析系统。为保证系统的设计方案具备较高的实 用价值和技术可行性,在本章还构建了解决方案的总体结构。 第四章对销售管理系统的功能结构和数据库进行了设计,并利用v i s u a l b a s i c n e t 与s q ls e r v e r 2 0 0 0 开发与实现。 第五章首先在建立了企业数据模型的基础上,构建了数据仓库的三级模 型概念模型、逻辑模型和物理模型,并建立四个分析主题一销售分析、 客户分析、发货分析和应收帐款分析,然后根据四个主题详细地进行了o l a p 模型的建立,包括实体关系模型的建立、维表和事实表的设计、多维分析模 型的构建和数据立方体的生成。 第六章在第五章的基础上研究了前端应用程序的开发,并用a s p 结合 m d x 和a d 0m d 开发了前端应用,并对系统的效果进行了分析。 第七章全文的总结和展望。总结了本文的主要工作、研究方法及创新成 果,并对未来的应用发展和开拓方向进行了进一步展望。 东毕一:学管理学硕f j 学位论文 第2 章数据仓库与o l a p 技术理论研究 数据仓库以及o l a p 是数据库系统在信息时代发展的产物,它有别于传 统的数据库应用技术,更加注重对信息的分析与挖掘,为企业决策提供支持。 本章首先介绍了数据仓库概念与特点,详尽地分析了它的数据组织结构与方 式,然后通过对数据仓库的体系结构进行了较为深入的分析,为建立数据仓 库应用系统建立了框架。 0 l a p 是本文研究的重点,、也是数据仓库技术在实际中的一个重要应用。 本章第二节对o l a p 的概念及其技术特点做了介绍,同时,分析说明了0 l a p 的应用设计原理。这为以后的应用分析、开发奠定了理论基础。 2 1 数据仓库技术 2 1 1 数据仓库的概念和特征 数据仓库是近年来兴起的一种新的数据库应用技术。1 6 j i 艮难对数据仓库 给出一种严格的定义。宽松地来讲,数据仓库是一个数据库,它与组织机构 的操作数据库分别维护,数据仓库系统允许将各种应用系统集成在一起,为 统一的历史数据分析提供坚实的平台,对信息处理提供支持。 业界公认被誉为数据仓库之父的w h 1 n m o n 博士在建立数据仓库书 中将数据仓库定义为:“数据仓库就是面向主题的、集成的、不可更新( 稳定) 的、随时间不断变化( 不同时间) 的数据集合,用以支持经营管理中的决策 制定过程【7 卜。与其他数据库不同的是它并非一个现成的产品,而是一个综 合的解决方案。它是对原始的操作数据进行各种处理并转换成有用信息的处 理过程,主要用来帮助有关主管部门做出更符合业务发展规律的决策。1 8 j 这个定义简洁而又全面的指出了数据仓库具有以下四个主要特征【引。 ( 1 ) 面向主题性( s u b j e c t o r i e n t e d ) 数据仓库的面向主题性与传统数据 第2 章数据仓库与。乙”技术基础 库的面向应用相对应。主题是指用户使用数据仓库进行决策时所关心的重点 方面,是一个在较高层次上将企业信息系统中的数据综合、归类并进行分析 利用的抽象。每一个主题都对应一个宏观的分析领域,比如销售情况、库存 状况、人事状况等。而面向主题是指数据仓库中的信息是针对主题区域,比 如销售、库存等,进行数据组织的,为主题进行决策而提供信息。 ( 2 ) 集成性( i n t e g r a t e d ) 数据进入数据仓库之前,必须经过数据加上和 集成,这是建立数据仓库的关键步骤。首先要统一原始数据中的矛盾之处, 还要将原始数据结构做一个从面向应用向面向主题的转变。对于数据仓库的 数据源来自于几个分散的应用系统,各个源应用系统中的数据有多种不同的 表示方法,在编码、命名习惯、实际属性属性度量等方面是不一致的,因 此当数据进入数据仓库时,要通过数据集成,来消除应用问题中的许多不一 致性。 , ( 3 ) 非易失性( n o n v o i a t n e ) 是指数据仓库反映的是历史数据的内容,而 不是日常事务处理产生的数据,数据经加上和集成进入数据仓库后是极少或 根本不修改的。操作型数据是一次访问和处理_ 个记录,可以对操作型环境 中的数据进行更新。但数据仓库却不同,数据仓库的数据通常是一起载入与 访问的,而且在数据仓库环境中并不进行一般意义上的数据更新。 ( 4 ) 随时间的变化性( t i m e v a r i a n t )数据仓库中的数据并不是反映企 业某一时间点或者当前的情况,而是反映的某一时间点到当前这一时间段上 的情况,可以对企业的发展状况和未来趋势做出分析和预测。数据仓库的随 时间变化的特性要求数据仓库中的数据保存时限能满足进行决策分析的需 要,而且数据仓库中的数据都要标明该数据的历史时期【1 0 l 。 2 1 2 数据仓库中的数据组织 2 1 2 1 数据仓库中的数据组织结构 数据仓库是存储数据的一种组织形式,t 数据仓库中数据存在着不同的细 节级:早期细节级、当前细节级、轻度综合数据级( 数据集市) 以及高度综合 东华大学管理学颐l :学位论文 数据级【1 l l ,如图2 1 所示。 g 高度综合级 , 车 轻度综合级 f e 3 当前细节级 c 3 早期细节级 图2 1 数据仓库的数据组织结构 f i g u r c2 1t l l _ ed a t as t m c t u r eo fd a t aw a r e h o u s e 首先从传统数据库中获得数据源,源数据经过综合之后,先按照辅助决 策的主题要求形成当前细节级,并根据综合决策的要求进行进一步的综合, 从而进入轻度综合级乃至高度综合级,随着时问的推移,由时间控制机制将 当前细节级转为早期细节级,老化的数据将进入早期细节级,由此可见,数 据仓库中存在着不同的综合级别,一般称之为“粒度”。粒度越大,表示细 节程度越低,综合程度越高。 “ 整个数据仓库系统的结构由元数据来组织。元数据【1 2 】是关于数据的数 据,它对数据仓库中的数据进行解释和管理。正是有了元数据,才使得数据 仓库的最终用户可以随心所欲地使用数据仓库,利用数据仓库进行各种管理 模式的探讨,是数据仓库的应用灵魂,可以说没有元数据就没有数据仓库。 元数据按其内容可以分为四个基本类型: ( 1 ) 关于数据仓库的数据来源信息包括现有的业务系统,可得到的外部 数据和目前手工维护的信息。 第2 章数据仓库与o l p 技术基础 ( 2 ) 关于数据模型的信息包括业务实体关系,企业规则及数据模型。 ( 3 ) 关于业务数据和仓库数据结构问的映射信息只要某些来源中的一 个数据元与数据仓库建立了映射关系,就应该记录下这些数据元问的逻辑联 系以及发生的任何变换和变动。 ( 4 ) 关于数据仓库中信息的使用情况了解这类信息对更好地调整仓库 性能,使用现有查询以及理解仓库中的信息怎样用于解决企业中的问题是很 重要的j 根据数据仓库构建形式的不同,元数据还可有所变化。有些研究者或公 司也把元数据按其它的标准分类,如根据使用对象和应用范畴分为技术元数 据和业务元数据两大类1 1 3 】,但它们包含的总体内容基本是相同的。 2 1 2 2 数据仓库中的数据组织方式 数据仓库的数据组织方式可分为虚拟存储方式、基于关系表的存储方式 和多维数据存储方式三种【1 4 1 。 ( 1 ) 虚拟存储方式它是虚拟数据仓库的数据组织方式。它没有专门的虚 拟数据仓库数据存储,数据仓库中的数据仍然在源数据中,只是根据用户的 多维分析需求形成多维视图,临时在源数据库中找出所需要的数据,完成多 维分析。这种组织方式比较简单、花费少:使用灵活。但它有一个弱点,就 是只有当源数据库的数据组织比较规范、数据完备并没有冗余,同时又比较 接近多维数据模型时,虚拟数据仓库的多维语义层才容易定义。而一般的数 据库的组织关系都比较复杂,数据库中的数据存在许多冗余和相互矛盾的地 方,在实际中这种组织方式很难建立有效的、为决策服务的数据支持。 ( 2 ) 基于关系表的存储方式它是将数据。仓库的数据存储在关系型数据 库的表结构中,在元数据的管理下完成数据仓库的功能。这种组织方式在建 库时有两个主要过程用以完成数据的抽取:首先要提供一种图形化的点击操 作界面使分析员能对源数据库的内容进行选择,定义多维数据模型,然后再 编程序把数据库中的数据抽取到数据仓库中。这种方式的主要问题是通用性 较差,难维护。 东华人学管理等:形学位论殳 ( 3 ) 多维数据库存储方式它直接面向o l a p 分析操作所需的数据组织形 式,在数据仓库中对海量数据从感兴趣的视角、抽象层次上进行概括,便形 成了针对不同目标的多维数掂视图。它是对决策目标意义较为完整的描述, 能够精确地为用户提出的问题进行分析处理服务。多维数据视图一般包括一 组对分析感兴趣的度量,如客户和费用,每个度量包含一组具体化内容的维, 如客户的类别、信用度等。多维的层次划分,基本上确定了每个垂直的汇总 路径,可形成关于任一路径的分析。这种数据库产品也比较多,其实现方法 不尽相同,其数据组织采用多维数组结构文件进行数据存储,并有维索引及 相应的元数据管理文件与数据相对应。 2 1 2 3 粒度与分割 在数据仓库的设计过程中,有三个非常关键的问题:粒度、分割和模型 设计。粒度和分割问题是设计数据仓库的最重要的方面。 ( 1 ) 粒度 粒度指的是数据仓库中数据单元的详细程度和级别1 1 熨。细节程度越高, 粒度级别就越低;相反,细节程度越低,粒度级别就越高。例如:销售管理 系统中一个季度内销售商品金额的细节属于低粒度级,而一个季度内销售商 品金额的综合则属于高粒度级。 粒度问题是设计数据仓库的最重要的方面,这是因为它会深刻影响存放 在数据仓库中的数据量的大小以及数据仓库所能回答的查询类型【1 6 j 。在设计 数据仓库时,必须要在数据仓库中的数据量大小与所能回答查询的细节级别 之间做出权衡。 如图2 2 所示:数据粒度级别越低,细节程度就越高,所能回答的问题的 数量就越多,但数据仓库中数据的量也就越大。当要查询综合度高的问题时, 就要从大量细节数据中综合并计算答案,查询效率会很低。相反,数据粒度 级别越高,细节程度就越低,所能回答的问题的数量就越少,但查询效率会 提高。 所以,在数据仓库中,多重粒度是必不可少的。由于数据仓库主要用来 第2 章数据仓库与o l 廿技术基础 做决策分析,因而其大部分查询都基于一定程度的综合数据之上,而只有极 少数的查询涉及细节。所以应该将大粒度的数据存储在快速设备( 如磁盘) 上, 这样对于大部分查询,性能将大大提高。而,j j 粒度的数据则可以存储在低速 设备( 如磁带) 上,万一有对细节的查询,也可以满足。当然这样的查询代价 会很高,它并非数据仓库的典型应用。鉴于费用、效率、访问的便利和能够 回答任何可以回答的查询能力,数据双重粒度级是大多数机构建造数据仓库 细节级的最好的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- it项目采购合同样本
- 中英投资合同样本
- 买卖标准合同样本
- 共用线路三方协议合同标准文本
- 个人租赁土地合同样本
- 代购柴油合同标准文本
- 住房代理销售合同样本
- 中石油用工合同样本
- 个人坟墓购买合同样本
- 住房公积金购房合同样本
- 湖北省十一校2024-2025学年高三第二次联考数学试卷(解析版)
- 《手工制作》课件-幼儿园挂饰
- 人武专干考试题型及答案
- 2025届高三化学二轮复习 化学反应原理综合 课件
- 2025年北京五湖四海人力资源有限公司招聘笔试参考题库含答案解析
- 常见的酸和碱第2课时酸的化学性质 2024-2025学年九年级化学人教版(2024)下册
- 欢乐购物街-认识人民币(说课稿)-2024-2025学年人教版数学一年级下册
- 2025年中国南方航空股份有限公司招聘笔试参考题库含答案解析
- 疫苗与接种管理制度
- 电子商务案例分析知到智慧树章节测试课后答案2024年秋西安邮电大学
- 《通信用开关电源的元器件降额准则-》
评论
0/150
提交评论