FoodMart商务智能_第1页
FoodMart商务智能_第2页
FoodMart商务智能_第3页
FoodMart商务智能_第4页
FoodMart商务智能_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、叮叮小文库13Food Mart的商务智能背景介绍Food Mart是一家跨国食品超市,每天有成千上万条来自世界各地的销售、库存等记录 在其Food Mart数据库中诞生。基于大数据的背景,该公司的管理层决定为Food Mart建立数据仓库,期望能从庞大的数据中挖掘出有商业价值的信息,来进一步帮助管理层进行决策。由于数据仓库的建立是个漫长的过程,需要分期进行。在项目初期,管理层决定:先用销售数据建立数据仓库;然后,在新建的数据仓库上进行OLAP(联机分析处理);接着,基于数据仓库建立一个数据挖掘模型,挖掘(研究)办理不同会员卡的老客户有怎样的特征,进而根据新客户的信息,为新客户推荐不同的会员卡

2、,给公司带来利润;最后,用Food Mart库存数据扩展上述数据仓库的内容,并完成上述相似的工作。需求分析现在,需要先用销售数据建立数据仓库,Food Mart数据库中记录销售数据的主要是sales_fact_1997表,如下图所示:/ 5QLQuery2,ql - (1 administrator (S3)/* Script for SelectTopNRQWs coinr.and froir. SSMS */ SELECT TOP 1000 prcducc idrt c:口3tomer_idf promocionidf Jstoreid,store_sales,孑匸亡匸,unic_sale

3、sFROM Foaditart 200S . dfcc . JsaleB fict 1997口结果匕消息product jdcustomerjdpomobondstonejdstojcost unit_saJes1|nm ;! 529595351306STS3 5916425095W6927067.W3.80436GD6176715DG3.4C2 343从图中可以看出,sales_fact 1997表有五个外键:product_id, time_id, customer_id,promotion_id ,store_id,所以还需要五张表:product, time_by_day, custo

4、mer, promotion禾口 store。进而,初步分析得出,目标数据仓库有一张事实表:sales_fact_1997,并以product,time_by_day, customer, promotion 禾口 store 这五张表作为维表,而 sales_fact_1997 表中的 store_sales, store_cost和unit_sales属性作为事实表的度量。建立数据库由于Food Mart公司已经有数据库,并且为我们提供了 1997年和1998年的数据库备份foodmart.bakfcodmart.bak,所以我们只需要把数据库备份文件导入到我们的数据库中就可以了。,弹出如

5、打开 SQL Server Management Studio(J : SQL Server Management Studio下界面:安 Microsoft SQL Server Management Studio文件旧輪辑E视圏工具(刀裔口阿社区Q 帮助HMicrosoft*SQLServer2008數据库引擎PC-201409101844inistrator朋务器类型(X): 朋务器名称:身悅验证(A):用户名:密码():记住密码(M)连接(jc)取消帮助选项按上图选择和输入相关信息,点击“连接按钮”,进入数据库引擎界面:Microsoft SQL Server Management S

6、tudio文件CD扁辑旧視图M TMlI)董口 (W)社区 曙助凹J二愠愠曲f A庁翌匸戏象艇背逞器 4 X皱I 酸穷 T 3(local (SQL Server 10.0,1600 - PC-20140910国_j啟薮擔库 U加倬快黑 | J Report&erver I.Re portSe rverTem pD B13 口妄全性LJ韻务器跖* _l复制(5 口設国站SQL Server代理接着按下图方式打开Analysis Service (此步骤方便对 Analysis Service更好理解)Mkroseft SQL Server Management Studfo文件旧馨議踽M TJ

7、im産口社区(C)J Wfie(N)由岀泌岳亡曰忍孑对普送谆苣坯器斗X逾9(0严|岂加Il JJ说库弓擎(D)+“d服附h!. Analysis ervigwAiintegration Services(l).+爲 Reporting Serwes(R)+ j SQL Server CompacttC,.i Ca宜全性號 Microsoft SQL Server Management Stijidio文件(F)購諭Ei视團何 Tfi(T) an(W 社呂口 WttiH)理,新斫那4丨必丨逮陪笑R茂諒 與m童到限务黔1 (local) (SQ izitsff+ ._!至菽国i确J J Rep 刃

8、 J Rtp l _J宾全性 l _j焦翩就SQL $e朋务塞称:身陆鉞E用户容:湮冯(D:MicroswfrSQL Serve20%Ift)圉呦 服需 | 帮跡 j&J如Microsoft SQL Server Management Studio文件0 幅ii观囹加 ISCD SE(W 丿併塚目a塑泌务前占z杜区g ffisoiw日氏近聿资渡音理髀* X述回*售徑 f固屋心 0址册(SQL Server 1&.0.1600 PC2D140910 日丄ESSE十n斂耀空E 口逐岸腐+ J ReportServer|Repo rtServtrTEmpDB1 _J宜全性tl _J眼务器对#(3 一

9、| 夏 *!1+ _j &t(local) (MioroEpft AnalysiE Server 1O.0.16D0J田晶EQL险窗代理 :3-1二数邸.:j DMAddinsDB-_1融卑-(J (loCBf) (SQL Server 10,0,1600 - PG2014092现在,进行数据库备份的导入: 右键点击“数据库”,选择“还原数据库”-;: Microsoft SQL Server Mdnerrkent Studio文幣F) 區左旧4斷建壹洞(N)祝费(V) xacrUJ M 皿 to)有口 (W)m Lzf -杜区(SS)(H)J叫 H XI J I q.辛子遣芥定禹N;陌口曲附

10、加3”还原文絆和文件爼(E)JB动 PowerShell(H)ffiSfPJJdl I I Relj jl SQL Si0 (locap (Microsoft Analysis Server 10.0.1600JE) CJ玫跆v jj DMAddinsDB*匚j fi序集E百宜忘R的目标械序操1嘶现肖苗相斥的锄躺(人苗曲UI5越那*目抬諛雷乍屯J:+目翩冏臣:很近瞬诬H的迺播定用于还!I的甘份耐果和曲f*冊血电I.歸用于赶鼻前普俏KU):点击上图的“”按钮得到如下弹出:錠还臣爆作的爸常操体晨闿位蛊*爵份姒悻:交甘F备 W(eB(L)44Adi确宜S1消揺助点击“添加”按钮,把数据库备份文件fo

11、odmart.bakfoodmart.bak添加进去:J定位备俏文件 PC-2014091D1344选择文件:I 一j 120国!2 曰赳E“589日081Tbai du doviLlo-a.ilic&ftfie.MsiT 二j FiviteVideeT 二 k&nkm丄J Left_4_d ad_2:+.二丄 Nedii NSDC acheQ J Prosram ?31ceAdoboCScl ips s-bd.t-wi nfi* H&oZipJavaMX7LABMicros*ft Officeffl-ffl-a-回回回El-:s:Mi eros-oft SQL Serverij 1HJ:+

12、_1 KSA510.临 SQLSERVER h-Q USES ID.临SQLSERVER .-.HSSQUO HSSQLSERVEH白a MSSXIJ口口口三 : -11 -Lt 一 :T1:TEinn3MTH PTDitiInstill JOES Logo o dhi git t. b xkifi迭暗径迥:E件拱製; 更件直.E:Frop-m FiltsMicrclft SQL SrvirMSSQL10.MSS奋苗交件帆b*:* iriiJ点击“确定”按钮:这时候,Foodmart 2008数据库便导入到了我们的数据库中。m(苗 icn 啬口 筈讯卜S QhT - Microsoft ViS

13、Aisl tu占or弄嚏1M(NJ ?坝副P-.Cvl+hiR*N n - 5打幵网 H(Wk.Shift+Ak *NJ文的环-QH + N文件旧骗辑(E)视冒俚)IM 畫口曲社区.新匹育理2忸慢遢iJ对鑑资源眾器连克幻袈r園雷Foodmart 2008SQL Server 代理F 8 (local) (Microsoft Analysis Server 10.04600J 曰口站库. 匚丿 DMAddinsDBi LJ程序買新建项目打开 Microsoft Visual Studio 2008Microsoft Visua Studio 2D08,新建一个项目:tudiO2008幅丹丹我人推

14、卿樹詹新痼直下牡測M 左血t可1B用RSS a .也紳I却 Service UElSJT-XEy M;c8i Customer dbo: _ product (dbo) _ promotion (dbo) _J sale5_fact_1997 (dbo) J store (dbo) _1 time_by_d3y (dbcQrL frnsl jv% B*1 bE_f hC,3140*1 ctmclici mH* iw_-idiiua-aiDii斗2CK%diSZSSajE jlSSiSf!_j M丄呻这里,我们就初步建立好数据源视图。但是, 可以发现这些表都是独立的, 互相之间没 有关联关系,这

15、是因为数据库中的数据表并没有设置主键和外键。 因而,接下来的工作是给 这些表建立主键和表与表之间的联系。首先,为这些表设置“逻辑主键”:Cust&inerproductpromoti onsal54ctw1997t izc_i d ::*:&: zzsrid prs-isn_id+Estoretim*_by_day_0 CuitMtrIiElllisllmDEEntCCOiUJltfh*s*;rff=cst jjiii_salESisJ.nFrrf-C;:; t没畫卿主刚K)f曙建关盔(P)gDI測翅曲(X)Qim &4dri4idrs-i3ftdidrtiiis l*t*_prGviiktt

16、 pt.al_oduner i dIname即SJ w n ti l 1与上述操作类似,设置其它表的“逻辑主键”,得下图:1+-1 Cue tons 电f0 V prodiictT1 productwcl&sproduct! d関,brand_nsmfiproduct ji am eSKUsaQ表l)()tDCustomerproductprurnoti onpriomot i on i dpromtion_di strict_i d pr omoti onjiame rndi a tvnefElla!s tore_name store numberUICIGIE3 1 za沁 g 血;lar

17、.Japgss田田田国田曰Custom er product promoti ons_fac t99Tstore timebydiaytime i d因为sales_fact_1997表将要作为事实表,而 product ,time_by_day , customer, promotion ,store五张表将要作为维表。所以将sales_fact_1997表放在中间,product, time_by_day ,customer, promotion , store 五张表围绕着 sales_fact_1997 表放置:RBRff生成试也懂式回 J?摇库曲轴滩磋TSCD超口誓他凹Develop

18、mei 审prono-ticii pronDt:cn._id prcnot i L_di Etr i. R祈卅5呻_上禹色 rredi &e dostend_d.-iteJ 讥fiia_by_dpytlhe_datettiedaydftYjf jnosdhqn4r ter叩施玳 f preducVid pro ducted &351 d tr UiLELATW prouct_F!* SO 5BT flESJA-i Lght nel_veight re.EtOtTd5trt_tjTe regi on._3 d Et Ord_CiAnfl sUre_huftbtr e jlreet. stoirf

19、litystorepotal.St0IT4_C0initirjr狂ITe- E+ ,:A 丄止eDjDeNaNa,FC4dMam接着,建立表与表之间的联系,把sales_fact_1997表的“ product_id ”属性拖曳到 product表的product id ”属性上:store f itore_ stcre_ regi on stcre_ Etore_ store_Ar *productproductid pr q due t_cl as s_i d brand_name pr o due tUiam eSKUSRF gross_w电丄芝hlrecycl*blt_p4. SMpr

20、 oducti d time i d然后把 sales_fact_1997 表的 time_id , customer_id , promotion_id 和 store_id 属性分别与 time_by_day , customer, promotion 禾口 store 的相应属性连接:prodtict学 product_idproduct_cl d brand-name product_Ttam& SKUSRPgrosswei ght nat_weightrecyclable_pa., lowfatproihoti onpromotional d promoti ondis tri. p

21、romoti on._n.Qine medi cost stiart_da t 电 enddate| ti.naiaMby_dayJ tiime_idt ht_da t 电the_dython thth色电ar| 531es_dct_i deus t &ifter_.i d premoitionid store_id store_sales storecost unit| storeY stwre_idstorrgi cm_i dstQre_naineEtore_numberstore_street,.rstore_ci tystore_pc5t.=il_.s t or e_c

22、cmntryCustomerf customer_id accouiitnum lnam&这里发现, product表有个product_class_id ”属性,它是 与 product_class 表 的 product_class_id ”主键相连,而product_class表里存放了产品不同层级的分类信息,这些信息对于维表的层次结构建立非常有利,所以需要引入。SQLQueryLsql - (IAdministrator (53)/* Scripc for SeleccTopURows coitmand from SSMS *#*/ SELECT TOP 1000 product cl

23、ass idf (froduct_subcategoryfproduct categoryrproductdepartmentt |(protluct;_f ait! ly |- FROM |Foodir.azt 2008 . dbo - product_cla53-结果_J消息pruduct_class_iproduct _5ubcategoryprwkict_categarypraduct_departmentprodudjamily1丨1 NutsSpecialtyProduceFood22SheVtehSedoodSeafoodFood33Canned FruitFruitCanned

24、 ProductsRood44SpicesBkinp GoodsBaking Go&dsFood55PastaSanchy FoodsStarchy FoodsFood右键选择添加/删除表”,把product class表引进来:)皈 IS(闵 S3E 弄根壘(豹 UlfT) &ss_w eight net_wei ght r e cycl abl ej a. low fatpromoti on? prcimoti c*n_i d prcmioti on_di str i,. promoti an_nam电 iredia_type coststrtdatej salesfact, prduct

25、_i d t ime_i d右键选择“排列表”,来整理一下视图:工JUG 2|W1 Mfc.wi且恋ME咄Jr*P tlw (IMF it*r i torf |M4i4rh_iq| KM4lbML_kltjFI PTB4tb*|_M|l4 4l Vf jrpbt- C$ltttc &理KBKD|Kr4dhiFttvi.4 中*ikO.MFt筍4电盖tMr4TM4t 1 Odi 118DM# SqDewrirpNiirnetWjRFJfcrWc* 更-心g wSprrwr fcdfc?_?edOT fsnUpsrlri建立维表右键点击“维度”来“新建维度”::三空J區X海方畔他理忍厚冥.越 L0

26、_ | FoodmartB 4 * Foodmjri 20Q8diG- eKJKMSa也 Foodrndrt 20G8.dsvJ JSE 羊进舷”V 聲鲨幘進氓晝ay-G NKtefPl戟環匕淮度向导尧成向导“为薪维團逢人茗粽r验证趣结构然器单击”完战”琢進庫名称(N);BEBH预颇咋1/ CustomerE二雇性P Customer Id:Crtyj State Provincei Country:Marital Status:Yearly IncomeGenderS Total Children:Num Children At Hcmj EducationMember Card:Occup

27、ation:HouseownerJ Num Cars Owiedccufia.t3ihr#vincTcktftl 0111曲*“Ta arly 1(:44cnstartr.i diddrs:xl弘ubOhmh IfiUnA friAJTiaHd维虫绪枸|匡用性关|14 fell U浏英器 IB婭丨回幻題丨臥Q*勺现在为Customer维表建立层次结构,将Country” (国家)作为顶层,拖曳到层次结 构窗口中:Developmei M 次.画 口 * ;Cu ito flier出 im i&it Foodma rt 2DO8.dsv 设计醪维厦结构 血厲性关剖滋詡译世岁聲Educati mi

28、 层性 is. 创,至isGanderMuri tai Si at as.Mefnlber Cai dNqjti Cars Owned.Nwn Children At HomeOccnpati onSt at 4 FrovincTwttl Childj*4sYearly Irtc:。亡常维度结构1毘屈性关系1逐翻译 阻 浏览器同和1頂”xl也丨国Q 八厂属性层次结构I/* Customer:Cit? Country誇 Custonttr Id Educat ion lender Kcusaowiisr Marital Status层次结构E* Cfluulry接着,分别把State Provi

29、nee” (省)、“City” (城市)、“Customer Id ”(具体客户)以同 样方式拖曳到层次结构中:欠H:hCustomer.dmart 2008.dsv 岛十JK维度结构|坯富性关系滋翻译|诚浏览器 3) 艺象资薄苣理器 4 x连接gp韶如|+) .一|音理 适 SQL Server 代理(local) (Microsoft Analysis Server 10.0.16I _ j DMAddinsDBl-i j Foodmart 日加潭*/ Foodmart 2008 -I裁据賊图蜩 Foodmrt 2008 一j冨淮站廉曰R超t/ Customer J髄结构+i U角色 一程

30、序集a 一I程序集回到 Microsoft Visual Studio 2008Microsoft Visual Studio 2008中,点击下图的“运行”按钮:这时,出现了如上图所示的错误。 为了进一步理解错误产生的原因,我们根据错误信息,:SQL Server Management在 SQL Server Management StudioStudio中查找customer表属性为city,而属性值为Richmond的记录:M JF| | 10| -Ril | WJJ | state_province-city 有存在 一个矛盾,“ Richmond ”到底是属于“Canada”国家“B

31、C州呢,还是属于“USA国家“CA”州呢?这里,我们仅仅做简单处理,就是把错误忽略掉:Foodmart 2OO8.dsv 15 Customer.dim ifii+起启文 is维辭构|底属跌系翻吊I卷戲用冇!* 三三|叵世速构:昴层富这恂+ CanadaJf M3cico日“ DP J San AndresS) d Santa .Ai ta+) 0 Santa Te国d Ti囂叩弧El J Gurr电tol J Jalisco+1 J Mexico1+ J Oaxaca+1 J Sinaloa1+ J VeracruzE lucatan1+ J Zacat唱c呂USA+ Unknown在 SQ

32、L Server Management Studioj : SQL Server Management L乡? Studio中刷新下,右键点击Customer ”的浏览”iMdUMflMflHHLHi u* 峠 k*6 阳1 (SQL Server 10.0.1600 - PC 2014110 (IocaI (Micfosoh An川用 Srwr 10.0.1600J 丄切G穿* Q DMAddinOB hi 血 FoodmrtH*:* FwMmrt 2008Izi J曲沖也Focdmrt 200 -J禹色 _i tiffMSQLQucryLfql /* St EJ SELECT c: FRO

33、M FProduct Departme nt-Product Subcategory-Bra nd Name-Product IdCategory-Productpromotion 维表:Media Type-Promotion Id匚-F=IIW属性Store:Stere;Store:t Store; Store Store;Stor* StoreCity Country IdMg包訓SqftStateType层炭结构惑结箱 J StoreStore* Store:StareCountryStateCityid级别store 维表:Store Country-Store State-Store City-Store Id属性E*结构层次结枸(g4 Suarter* The Mgth 暮 * Th D&y苓:Tig ia齐嘲级别Quarter;The Day! The Month 豺 Time IdTime_By_Day 维表:Quarter-The Mon th-The Day-Time IdE-巳数摒壺*+ Foodmart 2OO8.dea-菽振源视图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论