数据仓库技术概述_第1页
数据仓库技术概述_第2页
数据仓库技术概述_第3页
数据仓库技术概述_第4页
数据仓库技术概述_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1数据仓库技术概述数据仓库技术随着数据库技术的日趋成熟以及应用系统逐渐完善,无论是利用早期的RDB、Dbase,还是后来以其领先的核心技术日渐垄断关系数据库市场的Oracle、Sysbase、DB2,企业已经积累了大量的数据,这些数据信息为企业的开展提供了客观依据。毫无疑问,在竞争剧烈的商业环境下,信息将是取胜的关键因素,决策者必须能快速可靠、随时自主地访问企业数据,才能有效地做出方案和决策。在这种需求牵引下,形成了数据仓库〔DataWarehouse〕的新概念、新技术。1数据仓库的概念数据仓库的提出是以关系数据库、并行处理和分布式技术的飞速开展为根底,是解决信息技术〔IT〕在开展中存在的拥有大量数据,而其中有用信息贫乏的综合解决方案。数据仓库是一种新的数据处理体系结构,是对企业内部各部门业务数据进行统一和综合的中央数据仓库。它为企业决策支持系统〔DSS〕和经理信息系统〔EIS〕提供所需的信息。它是一种信息管理技术,为预测利润、风险分析、市场分析以及加强客户效劳与营销活动等管理决策提供支持的新技术。矛数据撑仓库呜技术生对大滤量分缩散、究独立耕的数散据库投经过年规划禾、平案衡、厚协调年和编另辑后坛,向束管理呢决策册者提丧供辅惠助决础策信焰息,蛙发挥升大量娃数据边的作召用和斗价值采。芬概括避地说痛,数吐据仓真库是岁面向君主题乘的〔璃Su膨bj所ec鸟t-垫Or香ie棵nt批ed尸〕、叹集成糕的(它In谅te阅gr晋at圈ed划)、缺稳定番的(屋No亩nv仰ol叨at馅il及e)拌、不偿同时希间的伸(T谎im岩er师-V近ar似ia驳nt名)数距据集耗合,飞用于害支持改经营嚼管理抗中决岛策制对订过李程。悄数据京仓库棚中的笛数据坟面向旗主题所,与新传统南数据饰库面氏向应呀用相馒对应亦。主飘题是怎一个球在较况高层昆次上增将数梨据归饮类的摘标准暴,每写一个纲主题症对应西一个洁宏观寺的分葱析领与域:牲数据捉仓库挂的集孕成特视性是犬指在胶数据模进入密数据膨仓库房之前温,必代须经观过数肆据加谦工和孟集成配,这阵是建布立数斯据仓伞库的系关键匆步骤勉,首纤先要渠统一魂原始肆数据页中的睬矛盾睡之处花,还轨要将挪原始森数据无结构质做一叶个从跨面向虎应用协向面刑向主糠题的使转变居;数伐据仓缘库的伤稳定拜性是役指数炕据仓镰库反小映的当是历慢史数昆据的威内香容侮,而誉不是懒日常乏事务愚处理遵产生裂的数私据,员数据六经加亡工和茅集成菌进入镰数据宅仓库叶后是酿极少司或根狸本不柔修改土的;匙数据烤仓库温是不漠同时千间的富数据宾集合咳,它肥要求泉数据晶仓库畅中的甘数据石保存打时限驶能满欠足进劳行决倦策分鲜析的孟需要想,而保且数瓣据仓服库中卵的数呆据都浮要标拜明该浇数据政的历那么史时傍期。络

捉懂数据怪仓库匆最根半本的配特点您是物捷理地奶存放陡数据川,而盘且这膛些数辰据并谣不是载最新带的、孩专有椅的,依而是耗来源系于其借它数串据库壤的。民数据艰仓库命的建后立并俘不是文要取铺代数叶据库日,它纵要建碧立在工一个俘较全棒面和沫完善忍的信糟息应邪用的孕根底呆上,贫用于贫支持娱高层水决策润分析互,而科事务踏处理满数据致库在锯企业嗓的信宜息环虑境中稠承当蹲的是不日常剧操作吧性的袍任务帐。数训据仓叔库是截数据错库技却术的哈一种今新的粘应用饭,而任且到伐目前段为止袜,数烈据仓瓣库还承是用泡关系慌数据惯库管偶理系引统来兴管理贫其中护的数暂据。录传统泥数据嫁库用策于事驻务处双理,废也称杠为操蒜作型牧处理碌,是侨指对逝数据脏库联奉机进尝行日蔽常操帆作,胁即对薯一个悄或一织组记恩录的缴查询核和修岔改,凡主要值面向庭企业众特定鱼的应付用服虚务。惕用户准关心袜的是肿响应踢时间围、数凉据的作平安仰性和鼻完整斩性。虏数据绕仓库链用于身决策贞支持弊,也页称分乐析型宫处理弄,它证是解丑决决卡策支启持系揭统的球根底常。喇数架据仓且库的腰数据量概念腹模型敌是数测据的离多维腰视图衫,它进直接妈影响妈到前血端工导具、姨数据虚库的间设计勉和联岗机分杆析处逼理〔复On同L理in培e秒An泛al述yt跪ic古al弄P防ro或ce厉ss哪in暴g,诊O绩LA眯P〕沈的查渗询引轿擎。而在多只维数于据模保型中划,一记局部绕数据横是数育字测假量值稳,而灰这些脆数字绞测量屡值是他依赖涝于一表组维番的,服这些峡维提险供了究测量羽值的聋上下阻文关附系。发因此涉,多推维数杠据视亦图就垂是这宗样一丑些由蹦层次煮的维构构成智的多记维空脖间中岸,存臭放着侮数字郑测量升值。迫多维殖概念古模型鞋的另拴一个精特点殃是对圣一个久或多农个维卡所做援的集游合运聪算。均这些泛运算纺可以天包括坑对于招同样色维所上限定虎的测慕量值仇的比印较。岗一般沈来说待,时竿间维渔是一乖个有嘴特殊济意义财的维养,对卷决策艘中的野趋势茫分析很很重穿要。亭针锈对多疼维模熄型产拍生了税OL益AP番分析坊方法布,包苦括以饼下三脚种:密旋转票:即霞将表浙格的魔横、嚼纵坐夹标交叠换〔沈x、闸y〕较→胃〔y迅、x内〕.胁上钻度和下版钻:直对所翁关心震的数颤据根送据维经的层杆次提定升或秀降低辞观察最的层锡次。球切片奖和切猜块:悟主要烘根据暂维的看限定妇做投怜影、宜选择贷等数执据库由操作葱获得免数据罩。也2数搭据仓去库的阀数据四组织惭一个鱼典型暮的数扒据仓颜库的阁数据妇组织狭结构田如图热2.壳10堵所示玻:镇数据桑仓库萌中的鹿数据荐分为香四个禁级别畅:早殃期细著节级米、当碌前细抱节级惧、轻码度综带合级看、高困度综岔合级洽。源剂数据武经过夺综合陶后,质首先疾进入牺当前每细节陕级,员并根假据具银体需妨要进攀行进桌一步聚的综宿合,席从而改良入稀轻度撤综合并级乃锈至高殖度综秤合级缝,老估化的暗数据居将进极入早腰期细攻节级瞧由此什可见逃,数盈据仓夏库中括存在供着不惨同的附综合鹅级别宣,一卵般称虾之为喇"粒联度"框。粒般度越塔大,掀表示舍细节砍程度秀越低逝,综慎合程睛度越脖高。纠锅图资1重DW条数据痕组织狠结构币数据时仓库些中还顾有一文种重辉要的行数据撑--促元数锐据〔壤me忘ta市da艘ta咏〕。狗元数悔据是诉"关迟于数祖据的租数据滚",列在数那据库影中,躲元数练据是吊对数揭据库望中各鹊个对砖象的渐描述初;在裕关系奴数据让库中肥,这配种描府述就槽是对某表、赶列、嘴数据水库、呀视图松和其眯他对贱象的亦定义旁。缎从广宿义上壤讲,蜓数据愁仓库味元数柳据代懒表定站义数宇据仓纠库对夜象的甘任何森东西互,无炼论是挂一个谈表、疏一个赶列、张一个曲查询火、一宪个商怖业规逼那么,秒还是浩数据漫仓库洁内部俱的数佛据转向移。勺元数评据是礼数据幕仓库韵中所裕有管呢理、滋操作疾数据糕的数禽据,连是数欠据仓殃库的研核心那。数遣据仓惯库反移映的猪是企穷业数印据库沫的业滋务模谁型,溉其核窗心是快管理挪元数卵据。杰数据沿仓库福元数臂据被完分成吧三类很:乘管理涛元数命据夫。它匹包括迁所有幻建立仆和使忆用数袜据仓废库的丘信息贩,源污数据叙库的遇描述梢,后炉端和驰前端便工具北选择蜜,定投义数铜据仓注库的帅模式纺,综竖合数室据、池维和猜层次馅信息赠,预霞定义叫的查司询和够报表锐,数谱据集蠢市的膜位置敌和内高容,畅数据格存储读的物赛理组脾织、雁分段驳,数血据抽矩取、座清洗赖、转婶换的梯规那么续,数尼据刷粪新的薪策略丢,数覆据存消取的萌权限天、用避户等密限定妨。津业务敞元数织据。染这一营局部列有业鄙务流利程和想定义狱,数担据所提有关邀系和续存取群控制微策略搂。从操作荐元数缠据。选它是岩数据胳仓库剑在运咏行时总的管姜理信湖息,鬼记录娱数据江在进区行层敏次分部析时尾的层钱次位陆置、苦现在捕数据假设仓库朋中的月数据乒信息泪、监俘测信压息〔刊包括茄使用舅统计倦、错漠误报罢告等裹〕。加衫数据滩仓库夜的数新据组秒织方猴式共杜有三岭种:捞虚拟宪存储雷方式筒、基具于关摧系表妥的存强储和副多维捏数据土库存那么储方圈式。沸虚拟膀存储镜方式纷是虚街拟数胁据仓迷库的音数据宽组织律形式弯。没土有专早门的工数据涨仓库脖来存舟储数遗据,泰数据稼仓库笑中的屿数据拨仍然弦在源即数据恋库中价,只院是通改正语索义层漫工具墓根据晃用户桂的多炭维需炕求,赢完成烤多维穴分析档的功访能。吼这种暮方式拍组织都比拟驾简单绩,花至费少骨,用遇户使森用灵德活。浪但同式时这臣种方意式也茎存在膛一个墨致命舞的缺颠点:售当源搁数据逝库的猴数据仗组织细比拟谨标准劣,没劣有数差据不鞋完备琴、冗坑余,甲又比淘较接介近于宾多维昏数据估模型结时,而虚拟条数据灭仓库仰的多绿维语增义层互就容钢易定爱义。祝而一怨般数虑据库雾的组黑织关卵系都嚼比拟靠复杂懒,数德据库探中的抽数据饭又有颈许多睛冗余撕和冲象突的唉地方刚。在倚实际阀组织错中,虾这种贺方式最很难惹建立蹲起为插决策染效劳锐的有火效数刑据支声持。专关系车型数勉据仓浇库的吩组织确是将盏数据不仓库较的数辆据存师储在纹关系弄型数障据库笨的表坐结构破中,荡在元愿数据议的管貌理下问,完梨成数羡据仓蚀库的佳功能补。这签种组新织方独式在购建库睬时,飞有两无个主船要过杜程完薯成数搂据的超抽取挺。首去先要望提供废一种挥图形穗化的筛点击援操作支界面落,让僚分析绍员对码源数监据库封的内响容进深行选你择,骂定义妖多维飞数据杜模型席。然堪后再翻编制帆程序臣把数耳据库凝中的遮数据复抽取尽数据支仓库遇的数迹据库误中。径多维糊数据避库的丸组织链是直色接面循向O杨LA冤P分映析操那作的据数据点组织优形式掀。这抽种数澡据库吉产品逃也比拣较多碰,实模现方请法不猫尽相野同。筝其数傅据组哀织采晨用多充维数青据结阀构文靠件存毯储数抄据,痒相应伏有维尿索引郑及相馅应的廉元数瓦据管蜡理文膨件与欲数据详相对柿应。彻1〕钻、维折表烟多维济概念梳模型深可以械被多勺维数资据库检直接临实现贸,然寒而,择对于狂采用卧关系计型O欠LA愧P方拣式,冷那么只声能将换多维后概念巾模型环和多瓣维操犁作映旅射到弄关系饶和S销QL肯查询竭上。除大多讲数数宪据仓樱库都醋采用许星型肢模型些来表庆示多敞维概白念模陈型。侨数据搁库中技包括董一张哨事实三表〔炭Fa勒ct带T闹ab缘le理〕,权另外灵对于弯每一汇维都罪有一抱张维控表〔丛Di避me酬ns奖io削na倾l困Ta丰bl饿e〕素。事焦实表析中的惰每条令元组熄都包杯括保跪证多势维关歌系的吐指向营各个叛维表槽的外园键和去一些宾相应任的测奸量数醒据。猴维表飘中记爷录的蚀是有脑关这污一维旱的属唯性。驾星型沟模型微使O毯LA馒P的雀复杂妙查询膏可以仍直接勉通过戴各维吴的层销次,预执行俩比拟杰、上泼钻、翼下钻粘等操棒作。翻在数方据仓衔库中可除了登维表宽和事列实表亦的数欧据之拘外,做数据逆仓库团中应痰当包工含一理些预看处理添过的但综合寒数据拳。预乡综合吗数据跳的组垂织可端以有蹈两种学形式锈:增见加概呢括表坟方式手和使御用多口重编组码的毅方式爬。闭这种升数据猜组织贯方式睬存性在数这据冗形余、窃多维誉操作失速度拦慢的问缺点肉。但苹这种妥数据务组织楼方式厅是主印流方先案,社大多叹数现坡存数亩据仓胸库集萝成方手案都追采用勉这种陷形式加。钩2〕苏、多礼维数罩据库徐数据经组织核各公峰司多话维数完据库横产品昏的数冤据组骨织不浇完全凡相同拌,A揭ro刷b公括司的民EE夫Sb宗as冰e多雄维数村据库姿是一锯种具麻有代教表性婶的产畏品。脊例如都下面必的这罩种组架织方司式,和可以债说明访多维身数据枪库的搬数据姿组织其:用指于分绘析的巧数据港从关练系数胆据库茄或关魂系数携据仓梁库中缺抽取箩出来青,被律存放踪到多葱维数雾据库敢的超曲立方尝结构偿中皮—公多维紧体。裤这各屠种多状维体弹是以补多维摩数组喜方式艺记录汁各数穴值测商量值虹的具宰体值哭。相政应各殿维有播一定国的记职录维乔及维蚁内层盲次的碰元数兼据结侄构。控这种锄数据桃组织外方式次消除诉了大朽量数役据库点表中姜的空邮穴造福成的倦空间斩浪费袄,又棍没有鸭了在讽每个悼元组年中在青存储垮的外码键信恰息,扰而由仁统一闯的维冬与数液组的梁对应蒜系数址来限序定数效据,够大大季减少约了存而储空事间。屯当使要用多通维数份据库倚作为歌数据底仓库挪的基多本数蠢据存饿储形级式时耻,最途主要疤的缺拆点是膏使以寄维为浑根本瞒框架边的存蓄储空简间大燕大减品少,库针对英多维颜数据佩组织飞的操所作算猾法,该大大活提高因了多滋维分荒析操汇作的瑞效率钳。但缘多维柄数据拼库产软品还截没有莲统一开的标素准,芦应用粪还较爸少。住3〕南、两凯种数努据组燃织的自等价耗性菊关系穴数据渡库和备多维兵数据碗库两捞种数挤据组娇织方裂法可昼以构善成等孤价的补多维拣数据宵模型怜。多赶种数管据组裙织方金法的许等价贡性的瞎数学帝依据现是:过多维肌空间外中各本点在煎离散雨坐标核中一厘一对赛应于鸟多维添数组李。湖数据旋的存恶储同芒样是砌有层变次性清的。帆对一龄个系筑统的拐多维熊视图饿定义辜是存赴储方显式的才概念茫形式滴,是尽最高耐层次漏的模角型。更采用桑什么食样的居存储妻方式荒〔即惑前面购提到贺了关秒系数裳据库娇、多臣维数惧据库役两种骗形式型〕是逮物理塑数据荡组织寨的最岗高层健,它晚们都返能实目现对宏多维惰数据钩模型径的存另储。判关系股型数雷据库英的组饱织形玩式和曾方式保不尽凶相同抱。数密据的捉具体珠物理画存储乏〔如音数据替文件窜的结蜜构、坦索引辛、编惜码等披技术此的采顽用〕节是物循理存告储的屡最底促层技尼术和动方法权。对丑于数低据文哭件的涝不同弯组织让方法紫形成弹关系牛型数拳据库葵或多电维数奥据库萄,这首两种亲数据锻库又雄都能增完成铃数据勉仓库早的数祖据组臂织,疫即实隙现多俗维数讨据的栗存储洋。凤4〕执、虚脾拟数逐据仓帖库畅虚拟虫数据忌仓库魔〔V驼ir熔tu蛇al桨D槽at取a孕Wa蚊re闪ho让us派e〕浩,即屋构造仅一个尤透明唉的访忌问机暮制〔除De两ma退nd沟D握ri掘ve冻n〕位,使郊用户促以习绘惯的细方式饶及时课、直女接地慧访问如大型谢企业毫数据愉库。培虚拟篮数据存仓库居策略桥允许柔用户沾使用腐一些昼工具鼓通过愤网络凝获取剖数据纹。因功此这乳种方嘱法最取终会河使提百取和败维护享大量传数据筒的开朴销最洲小。灰这种起方法哥为用爪户提平供了丑最多欠的非附预先楼准备正好的韵查询充可能做。角虚拟美数据净仓库作是在银应用懒层上柜进行科研究烂的,求其组假设织形都式是妈用原引有的剑关系谜表模慰拟多博维数悔据。祝用户竞通过逃可视恳化的幼维定忆义工黄具,流定义释数据叨仓库套中的罗各维颗,但意在物册理存赴储上歇并不曲实际丽进行较数据愚仓库未的组锈织,痛而只怜是在掠用户存进行膨数据射查询如使用孙时,钻临时享从网瓣络和趟数据壶库中犁获取放数据冠源定贷义的纯各维摇数据闸。由改于采易用虚烦拟的子方式略,无次需建描立大悬量的橡数据挨存储伪,虚涂拟的种数据投访问抗方式本着眼容于最孩终用魔户对狡数据壳的直肥接访横问,丸其特漂点在啊于用冻户可老以直荷接访犯问数答据而隐无需首做大柔量的犬分析氏和结炭构映转射。弓3数屯据仓布库系匀统结虽构纸数据评仓库腥是在度原有醋关系滩数据响库基猫础上桥开展躲形成伟的,千但不警同于催数据趋库系集统的其组织戒结构选形式绸,它竿从原摘有的仙业务朴数据瓶库中暴获得族的基桃本数竿据和仰综合李数据团被分偷成一最些不赞同的弱层次骨。一原般数幻据仓朽库的夏结构拖组成粮包括乳当前物根本兔数据返、历然史基走本数度据、血轻度拍综合添数据盏、高且度综没合数毅据、迫元数永据。造当前恰根本粱数据征是最忧近时葱期的猜业务爬数据法,是已数据鄙仓库慎用户匪最感按兴趣蓄的部镜分,惭数据龙量大某。当刑前基怀本数越据随鄙时间精的推毫移,粗由数誓据仓秧库的所时间顺控制工机制值转为纱历史针根本前数据秀,一屈般被清转存贼于一夺些转响换介护质中昏,如抖磁带告等。处轻度余综合浮数据福是从蚊当前顿根本模数据住中提捷取出遗来的成,设喷计这招层数吉据结粮构时蔑会遇坏到蚊“喷综合励处理芝数据工的时渴间段兰选取款〞耻、奋“燥综合崇数据喝包含付哪些谨数据调属性位〞塌和准“痛内容猾〞激等问良题。连最高混一层纸的数失据十胸分精夫练,工是一生种准致决策絮数据闷。泪数据投仓库上系统鼻是一溜个广糊义概蓬念。洪整个尖系统南包括肤从操蛋作数他据库购和外拼部其森他数被据源姨的提津取、化转换眼工具栽、数祸据仓酒库数延据部帽分〔淘主要淋指构伟成数茅据仓止库数具据存带储的在数据稠库和干数据仔仓库霞管理渠系统浅〕、掠基于旦数据府仓库按的数镰据分洒析工控具以帜及与膏以上躬各部轮分相拣关的图管理送综合清部件宏,构坑成了犯整个聚数据瓶仓库版系统祖。验数据祥仓库皆系统跨所要傲完成赚的功努能包曾括辅喜助用诊户设翻计建祥立数愿据仓事库系绢统的床数据袜组织乓和存梦储;划管理澡、维慨护数妨据仓窗库的脾正常啦工作币,即斧完成振数据躲仓库扇效劳梯器的铃管理崇,接包受用贡户查乒询数责据的维请求反,使肢数据戒仓库渗数据私与操现作数酒据库岔中的类数据摩保持印有效价同步染等工粉作;材综合滚集成董多种锯分析舰工具军〔包耻括数潮学统萍计分什析工庭具、姨OL纱AP坦多维宅分析碗工具畜、数侧据开就采工菊具〕事,完侍成用矮户根值据决宅策需殃求对尸数据灿仓库夕的有灭效使氧用。童数据绞仓库咳系统桥的总送体结犹构如雹图2蕉.1息1所安示:峰图2到数吨据仓花库系静统的槽总体哑结构族从图丝中可物以看匙出数察据仓悲库系隐统包恢括以蛾下内烛容:愉数据畅抽取摊和转斥换工寄具,饲它们沟可以混完成奖对数悲据源伤的抽疼取、侦清洗撞、维遥护等幼功能轧。呀数据捷建模净工具酸,用朴于建翅立数芽据仓坛库与哲源数以据库罢间的蒸概念垄模型疮。脉模型确、元丢数据泉。垫能够场支持秃高速拢存取唉、有猫效地贯支持梁多维纺数据包模型错的前陵端工图具。芝这样钱,整材个数半据仓跑库的黄组织冤大致代分为鸡三个枣局部努:数玻据在钉进入驾数据声仓库蛮的存拐储体惕之前棚,包捐括源掏数据篇库、光外部螺数据款文件光的清惕洗、泥变换献、装份载和卫刷新洪的工穴具,数这是仇第一逃局部喘。第现二部伐分是警数据番仓库秋的具浪体数塑据、蚂元数双据的莲存储僻和数也据仓堆库服砌务器劈〔包痰括数慰据库取效劳众器和加OL日AP话效劳蝴器〕掀。第牲三部桐分是僻基于歼数据惠仓库促的查温询工饱具,盯主要狭包括棵数学停统计球分析窃、O弓LA在P查私询和开数据关开采闪三类经工具滚。帐数据恳仓库丰的建锯立首截先是锈根据搁数据狸库〔践包括半关系啊数据恋库和絮其他伙数据奸源〕俱使用衫多维帽视图旗定义晨工具种完成控数据索模型迈的设身计,斩再通段过较“须抽取谣〞眼工具值将数公据库提中原翠始数妄据转贼入数杯据仓胡库的匹存储海结构墨〔有菌关数头据库辉和多领维数界据库变两种拳存储睛形式棵〕中梁。这卵局部偏要完推成清导洗、填变换途和集孝成数钓据,慌将数限据装夏载到缸数据弄仓库府中,鸣定期拉清理怠数据属仓库牲,消观除数费据仓违库与孤源数冰据库键的不城一致塔,清响除失移效数茄据等夫。在句数据茎初次誓提取门和以泊后数丛据同俘步时不,需册要花津费的万时间来开销旦大,灰需要损留出语充裕绒的时远间。农而且脸,这课一部潜分的母程序家可能沟是数权据仓葛库中梳最难罩管理斜的,敢并且侍有可占能是剑各类脖软件玉组成惯的集瞎成体振。数度据仓灿库中怨另一栏个比拐较重技要的顺局部姻是元题数据耽管理拖部件矩。数歼据仓叨库中泥数据逆的存腊储和剂管理诸由多懂维数衡据视秤图来棕表现恨,是勇元数勤据的赤最主商要部恋分。仪元数网据存感储有欠数据挪仓库库的结成构信异息,悲相应饺也有垃一些每工具礼程序昏完成哗对多该维视序图的秘定义逗,元筛数据毕的管焦理、贡存储值,对万整个飞数据喇仓库居的检蛇测和吼管理湾。数洲据仓祸库系窄统是奇为决允策支断持服煮务的塌,在娱数据声仓库调的数站据存积储建弃立以器后,爆用户泡可以进使用串系统短提供萍的多窑分析适工具识完成春对数找据的钱操作艇,获张取个霉人需帖要的概信息驼。丹4制数据漏仓库币的关涨键技陷术慕旅与关伸系数警据库哑不同职,数止据仓摩库并伯没有铲严格腊的数似学理掌论基样础,橡它更肌偏向悠于工彻程。吗由于帐数据蚁仓库绩的这床种工车程性耻,因驼而在模技术动上可所以根珍据它职的工番作过暖程分今为:哨数据亡的抽怕取、弊存储敬和管懒理、瞧数据榜的表浙现以令及数蕉据仓牵库设大计的哀技术涉咨询砖四个机方面煌。秒数据痰的抽挎取谜数据器的抽敌取是租数据融进入录仓库胖的入艇口。萌由于镜数据骡仓库意是一勾个独寄立的赏数据蠢环境例,它惑需要简通过销抽取帅过程令将数线据从友联机匹事务剖处理网系统冲、外查部数摘据源餐、脱填机的起数据充存储吗介质际中导造入到版数据挤仓库祥。数哀据抽杨取在劳技术棵上主资要涉弦及互框连、女复制辈、增稻量、摆转换层、调逆度和秆监控塑等几塞个方亩面。壳数据霜仓库话的数仗据并五不要计求与需联机颈事务格处理抽系统浆保持喜实时桥的同镇步,芹因此叨数据怜抽取色可以赠定时魔进行略,但岗多个己抽取劝操作时执行观的时急间、湿相互痕的顺挂序、腥成败傲对数酸据仓催库中起信息晃的有浊效性电那么至菊关重运要。芳郊在技州术发分展上缩,数饭据抽鼓取所翠涉及牌的单岸个技些术环算节都跃已相年对成麻熟,宽其中刘有一我些是瘦躲不驰开编权程的搞,但洗整体维的集呈成度叉还很搅不够处。目叠前市递场上封所提涛供的争大多逮是数务据抽骨取工摊具。扒这些场工具街通过女用户傅选定嫁源数联据和杂目标慕数据介的对帅应关数系,凤会自震动生宅成数鞋据抽载取的骗代码而。但辞数据仍抽取皮工具节支持甩的数睛据种婚类是鸽有限夹的;阁同时窝数据寄抽取杠过程脂涉及圈数据压的转挑换,矮它是欺一个辨与实燥际应衬用密铺切相昆关的仗局部零,其劈复杂被性使凭得不热可嵌名入用卫户编胖程的茂抽取圣工具振往往奸不能赶满足匙要求赏。因晶此,煤实际寻的数邀据仓肠库实页施过播程中碎往往偿不一择定使搭用抽圾取工根具。固整个耍抽取露过程秤能否纽因工唐具的跌使用扇而纳娇入有射效的英管理信、调奶度和催维护刘那么更便为重组要。要从市坛场发巾展来帖看,枕以数标据抽诚取、诚异构冤互连猫产品祥为主席项的护数据嚼仓库静厂商娘一般机都很府有可勉能被秤其它于拥有害数据葵库产唯品的伟公司夸吞并尚。在敌数据享仓库慢的世酬界里秘,它追们只蜜能成拌为辅娘助的跑角色笼。当2〕陆、惊数君据的享存储令和管日理娱霸数据吓仓库今的真生正关畜键是繁数据休的存布储和周管理币。数利据仓堪库的刑组织蜜管理帐方式排决定登了它端有别奖于传暗统数待据库高的特程性,冈同时舒也决夺定了热其对尽外部灭数据促表现呆形式膝。要渣决定北采用即什么员产品仓和技趟术来窑建立阵数据躲仓库督核心签,那么税需要控从数乌据仓时库的泻技术陵特点木着手阻分析景债床数据免仓库攻遇到危的第泥一个揪问题疑是对逐大量悉数据败的存地储和固管理伙。这助里所颈涉及哥的数手据量丝比传视统事丝务处败理大叛得多总,且盾随时促间的辆推移削而累绝积。级从现绑有技菌术和慧产品甘来看晒,只却有关膝系数粮据库扔系统嫩能够睛担当眠此任坑。关弃系数昼据库匹经过犯近3洽0年五的发龄展,较在数踩据存妹储和挽管理顷方面贡已经待非常医成熟辽,非步其它贤数据竞管理剃系统筒可比巾。目暮前不竹少关栋系数票据库含系统胶已支问持数瓣据分袄割技瓣术,牵能够荷将一友个大款的数笔据库着表分忆散在皮多个斥物理习存储班设备贿中,务进一叛步增词强了科系统致管理帅大数玉据量钥的扩碎展能打力。喂采用纸关系现数据瓶库管溉理数翅百个迈GB僻甚至秩到T阀B的少数据能已是愚一件急平常籍的事渣情。字一些阿厂商窗还专勉门考毙虑大笑数据拣量的杆系统蛛备份良问题没,好沿在数轿据仓喇库对迹联机恭备份展的要丧求并乎不高犬。

紧链数据仍仓库煎要解息决的基第二浆个问稠题是慌并行滥处理奥。在校传统滩联机讲事务暗处理恶应用功中,恒用户浅访问意系统枕的特蔽点是草短小罪而密贴集;绸对于浩一个串多处泪理机鉴系统挽来说菊,能鸟够将溜用户云的请击求进签行均静衡分公担是亏关键狡,这涌便是虫并发吧操作旨。而揉在数杂据仓男库系父统中稳,用带户访男问系互统的讽特点膜是庞射大而督稀疏貌,每链一个展查询萌和统曲计都宫很复壁杂,那么但访蹦问的鸣频率轧并不封是很愿高。盆此时迹系统惠需要毒有能禾力将妥所有浑的处者理机锐调动牢起来贯为这码一个店复杂聪的查鼓询请脱求服掏务,栏将该赞请求砖并行鞠处理饱。因姑此,湿并行持处理眠技术稳在数排据仓捆库中燃比以正往更钳加重夏要。城

歇妙默在针做对数消据仓群库的叼TP摇C-者D基杏准测须试中权,比淘以往鸦增加扇了一鸽个单嘴用户妹环境排的测匹试,咏成为斧"系腊统功骑力"迁〔Q粒PP各D〕臭。系庆统的臣并行姜处理寨能力眨对Q至PP宜D的疫值有茫重要害影响舅。目悔前,适关系垄数据期库系呜统在顿并行顾处理卧方面务已能阻做到惕对查出询语础句的诱分解示并行恶、基宏于数猾据分始割的迫并行恼、以艳及支壶持跨羽平台匆多处哪理机主的群斜集环叨境和盏MP慰P环昨境,另能够习支持劳多达丛上百嫩个处陶理机烦的硬安件系洞统并这保持望性能如的扩径展能花力。亿

仆孙数据芹仓库缴的第看三个貌问题淘是针群对决像策支样持查沈询的甚优化滤。这惠个问芒题主倍要针愧对关律系数协据库述而言晃,因逗为其伯它数短据管饭理环责境连明根本执的通指用查荡询能伪力都怎还不祖完善贪。在舅技术缘上,距针对泄决策映支持钱的优承化涉俱及数焦据库果系统惨的索聪引机德制、说查询润优化彩器、许连接岭策略鉴、数搁据排饲序和鼻采样乏等诸端多部昏分。艘普通染关系伞数据姜库采晚用B察树类什的索废引,楼对于茅性别森、年轰龄、车地区雷等具工有大辽量重蹲复值哀的字驱段几渠乎没扇有效冷果。解而扩良充的劈关系延数据穴库那么洒引入骡了位吵图索坑引的皱机制斗,以帮二进矿制位铅表示浑字段秩的状枝态,宰将查竿询过秘程变园为筛挠选过鞋程,梳单个些计算点机的炒根本敏操作站便可屿筛选描多条糠记录馋。由鸡于数早据仓距库中邪各数化据表啊的数洋据量广往往讯极不斯均匀凑,普仅通查命询优枪化器沫所得羡出得席最正确袜查询辫路径痕可能选不是速最优午的。干因此记,面戏向决累策支功持的踩关系明数据壤库在购查询犯优化焦器上描也作门了改钓进,吩同时于根据涝索引劳的使写用特湖性增虹加了蔬多重链索引娃扫描刘的能竖力。娘躺以关春系数叫据库粱建立大的数俗据仓盲库在蕉应用岩时会忘遇到饼大量侄的表祝间连贫接操涛作,矩而连聪接操嗓作对恶于关细系数绕据库象来说佩是一男件耗炎时的法操作蒸。扩歪充的抹关系柱数据膨库中菜对连现接操临作可著以做侍预先宪的定怠义,损我们幕称之丘为连惰接索盼引,香使得慎数据雪库在孤执行唇查询俱时可卡直接工获取纹数据景而不惯必实早施具浩体的锅连接爱操作树。数挨据仓咐库的钢查询硬常常滑只需期要数视据库平中的颠局部默记录肚,如蚕最大樱的前军50爬家客并户,睁等等命。普闯通关暗系数概据库避没有坑提供鞋这样宁的查良询能密力,尼只好鱼将整赴个表扇的记站录进议行排胖序,替从而还消耗犹了大宪量的鼓时间能。决葡策支泰持的注关系稀数据捕库在决此做社了改巧进,缝提供尘了这样一功拣能。甚此外章,数潮据仓卖库的党查询绩并不苦需要基像事茧务处阳理系疲统那斧样精厨确,割但在梁大容邮量数私据环泛境中拌需要完有足盛够短狼的系敌统响湿应时幸间。街因此唱,一奏些数激据库纪系统鸡增加匹了采腔样数茫据的骂查询塘能力逮,在夫精确类度允党许的渣范围姨内,驱大幅鱼度提净高系盗统查狸询效库率。证纳抖总之剪,将剧普通倚关系血数据墓库改业造成迷适合润担当香数据凑仓库浅的服扁务器畏有许爆多工愁作可斑以做慢,它华已成泉为关券系数咏据库幻技术垂的一匆个重检要研冰究课谱题和蜻开展阻方向售。可乌见,铅对于梦决策况支持涨的扩况充是渠传统母关系浪数据识库进乡入数猪据仓休库市隐场的窃重要茎技术它措施春。输数据烛仓库悄的第鹿四个屡问题歌是支自持多裳维分飞析的斑查询日模式霸,这梢也是爸关系引数据徐库在阅数据燥仓库蛙领域歉遇到愚的最斯严峻令的挑竟战之怕一。纠用户豪在使偶用数坚据仓宜库时寒的访窃问方醋式与桂传统钞的关呢系数善据库雕有很园大的时不同我。对优于数伯据仓盟库的醉访问购往往索不是送简单芦的表搅和记检录的遵查询让,而造是基脆于用畅户业凡务的钢分析犁模式仙,即延联机诞分析甲。如库图疾2蹈.贩12冶所示缠,它沃的特净点是卧将数蝴据想嫌象成误多维鬼的立厌方体穴,用声户的朽查询形便相他当于邪在其拍中的梅局部蚁维(洁棱)拔上施赖加条夜件,烦对立芹方体押进行买切片屿、分喉割,宴得到饱的结凝果那么庆是数秋值的最矩阵倾或向物量,用并将狐其制拼成图病表或貌输入种数理寄统计悦的算笨法。少殊图狭3测联机疗分析芝数据耕处理悟示意今图知词关系浩数据严库本沸身没祥有提温供这稼种多悲维分框析的熄查询削功能艘,而箱且在邀数据戴仓库需开展雨的早畜期,板人们叠发现猪采用浪关系恒数据程库去振实现烘这种炕多维竟查询根模式尾非常泊低效旅、查风询处每理的负过程淘也难欺以自碧动化聋。为重此,逃人们环提出馆了多泪维数造据库走的概遮念。签多维什数据羞库是搅一种隆以多基维数熄据存徐储形尝式来盲组织与数据拐的数知据管择理系皆统,它它不环是关奔系型号数据交库,意在使想用时艺需要班将数台据从单关系五数据属库中旺转载亚到多熄维数傲据库遥中方弓可访减问。级采用萍多维透数据寄库实彩现的劳联机年分析见应用插我们枣称之五为M闪OL疤AP齿。多谁维数墓据库奔在针妹对小汉型的增多维倚分析旷应用杰有较胁好的独效果学,但行它缺葬少关胞系数企据库妻所拥垄有的点并行缎处理奥及大搅规模负数据基管理脉扩展闷性,谢因此咽难以肝承当誉大型须数据摘仓库城应用夕。这西种席状态它由仿"星两型模哪式"晋在关云系数轻据库雁设计政中得更到广急泛的躁应用度才彻什底改呀变。洁几年弓前,稿数据帖仓库遗专家竿们发巷现,辱关系卧数据终库假设奸采用邻"星铺型模庆式"飘来组递织数捧据就握能很厅好地违解决套多维路分析炭的问剩题。闭"星捐型模谅式"邪只不鸟过是徐数据冻库设堵计中恰数据累表之堆间的感一种们关联菌形式群,它宰的巧责妙之谜处在加于能潜够找狗到一巡个固什定的柏算法荷,将林用户成的多条维查阴询请恭求转暴换成扯针对锡该数勾据模为式的眯标准伍SQ堪L语态句,故而且券该语夏句是星最优强化的高。"浊星型擦模式焦"的公应用把为关雁系数说据库仪在数购据仓楚库领两域打况开绿就灯。福采用指关系帅数据验库实免现的之联机姻分析坦应用净称为东RO脉LA醉P。催目前头,大阿多数级厂商茅提供钉的数赵据仓担库解弟决方罚案都葱采用攻RO橡LA览P。雷在数启据仓宋库的井数据岩存储昂管理筹领域框,从伍当今糖的技载术发斯展来量看,做面向削决策危支持叫扩充初的并孙行关续系数携据库盏将是忆数据休仓库紧的核桃心。东在市雾场上遗,数羞据库灿厂商哗将成阿为数引据仓显库的非中坚父力量毁。剧押3〕桑、段数据描的表想现恐数据护表现做是数缴据仓折库的钞门面陈。这摧是一总个工住具厂谜商的蜂天下鄙。它喝们主丙要集市中在腾多维侄分析谢、数租理统能计和罗数据弄挖掘食方面功。乞多维杂分析精是数女据仓对库的娱重要语表现昨形式使,由贝于M荡OL闹AP稀系统舍是专吐用的魂,因智此,惠关于擦多维雁分析只领域胡的工湖具和例产品株大多网是R晓OL奴AP宝工具衫。这坟些产完品近秀两年翻来更戒加注武重提物供基廉于W泽eb速的前坛端联炊机分俘析界堪面,倾而不雪仅仅叶是网蹦上数戚据的绪发布碎。蝇数理役统计缺原本降与数针据仓直库没诚有直摆接的镰联系别,但芦在实溉际的附应用拣中,世客户碧需要越通过演对数础据的使统计谱来验林证他称们对雄某些蔑事物奔的假秩设,捏以进倍行决堆策。付与数面理统少计相狡似,刺数据备挖掘泡与数形据仓穷库也姿没有犬直接膊的联领系。粪而且育这个廊概念镰在现姿实中室有些主含混蝶。数每据挖墨掘强得调的判不仅近仅是悟验证飞人们恋对数祝据特塌性的垫假设棵,而偶且它号更要脂主动捎地寻词找并慨发现牺蕴藏久在数鸽据之阵中的昼规律令。这芽听起晓来虽犹然很锋吸引屋人,腥但在鸦实现女上却浅有很炒大的朵出入丛。市峰场上短许多决数据土挖掘话工具豪其实拜不过可是数老理统乔计的幸应用兰。它形们并判不是辞真正繁寻找绒出数剑据的鸣规律驾,而六是验披证尽瓜可能挣多的家假设玻,其蚕中包见括许锻多毫捞无意慢义的从组合灯,最愤后由摇人来妄判断就其合众理性哀。因叼此,途在当唤前的隶数据押仓库今应用膏中,旷有效台地利僚用数饰理统校计就态已经挪能够昌获得裹可观威的效臂益。嫌4〕懂、蚂数据岛仓库杀设计科的技职术咨搁询温

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论