Informatica完全快速学习手册要点_第1页
Informatica完全快速学习手册要点_第2页
Informatica完全快速学习手册要点_第3页
Informatica完全快速学习手册要点_第4页
Informatica完全快速学习手册要点_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、iNFORMATiCAInformatica学习快速入门文档Informatica学习快速入门文档1 Informatica 概述 32 安装 Informatica8.6.1 32.1 服务端安装 32.2 客户端安装 73 配置管理服务器 93.1 创建知识库和集成服务 93.2 客户端到集成服务端的连接 124 PowerCe nter Desig ner学习 134.1 概念和基本定义 134.2 Mapping 设计和组件的使用 1 54.2.1 实例一:聚合抽取 154.2.2 实例二:取TOP前三条记录 164.2.3 实例三:抽取 XML源 194.3 WorkFlow的设计和

2、使用 204.3.1 仓U建 Session 204.3.2 设计 WorkFlow 224.4 Repository Man ager 23Informatica学习快速入门文档INFORMATICS1 Informatica 概述Informatica 一直致力于为客户提供具有强大的元数据管理、数据集成和个性化分析递送功 能的世界通行标准的统一数据服务平台。In formatica的基础设施产品以可伸缩的、可扩展的企业级数据集成平台为特点,并广泛支持来自Informatica和其他的领先商务智能提供商的数据仓库基础设施和分析型应用软件的开发和管理,提供元数据管理解决方案,帮助企业集成、优化

3、、审核信息资产以提高运营效率,增加客户收益,取得竞争优势。I nfnnnat 1d详见文档:2 安装 Informatica8.6.1pcI i e nt.wi n 3 2 xS6,zi p旨 pc 861_H otFix8_Cl ient.zi p§ p c861_H otFix8_wi n 3 2_xS6.zip总 pc861_win32_xB6.zip这里以 Informatica8.6.1 为例:2.1服务端安装找到安装目录 pc861_wi n32_x86.zipServerWi ndowsDisk1In stData'VM下I irstall.exe点击安装Inf

4、ormatica学习快速入门文档选择安装语言,这里以中文版为例点击下一步,并选择安装 PowerCe nter8.6.1必须选择事先准备好的安装密匙iNFORMATiCAInformatica学习快速入门文档选择安装路径HTTPS配置,配置管理控制台与配置管理器的安全通信(如果没有使用该端口就采用默认)Informatica学习快速入门文档配置好Informatica 域并进行下一步,取掉为特定用户启动Informatica Services ,点击完成安装Informatica学习快速入门文档2.2客户端安装选择安装设置安装路径Informatica学习快速入门文档安装完成后可以看到包含的所

5、有工具Informatica学习快速入门文档3配置管理服务器3.1创建知识库和集成服务接下来我们主要是配置知识库管理服务器,PowerCenter数据整合引擎是基于元数据驱动的,提供了基于元数据驱动的元数据知识库(Repository ),知识库是 PowerCenter的核心。在Informatica Services 启动的的情况下,我们可以通过管理控制台来操作。Informatica PcwerCenter 86.1ClientServicesJ Informatica Orchestration SerPowerCenter Administration 匚从控制台里我们可以看到很多选

6、项,我们主要是创建存储库服务(Repository )和集成服务,存储库服务(Repository)存储所有的ETL元数据,包括:源、目标表的物理和逻辑元数 据,ETL转换规则,知识库用户权限,ETL任务运行历史信息等元数据。创建*1 或详细信忌:Donmin_hhaivuan PCEl也 Metridata ManagerReference Table Manager 服轄SAP EW腿务Web SerwietS Hub上就更匙时湧:星期四五月6 11:0:3? 2010存错库IE务U交件夹聂网格空节点许可证nudeOl_lilidiy.,.浚削诙首先我们创建一个用于测试学习的存储服务器,事

7、先在 Oracle中建好要用到的数据库此处如果无法创建成功有以下可能:1.需要设置环境变量,将C:In formatica'PowerCe nter8.6.1Serverbi n; C:I nformatica'PowerCe nter8.6.1RepositoryServer'bin;移到 Path 最前边2.代码页一定要如下选择INFORMATICSInformatica学习快速入门文档MS Windows Simplified Chinese, superset of GB 231Z-80, EUC encoding、3.设置知库链接用的数据库用户要有DBA角色权

8、限连接字符串设置为当前的Oracle服务名节点nodeO lJihaiyuiin-PC正在运行黄闭st建存儒库雋势以下顷的抿作状态创建內吝:砖血灯U第1页,共70保存 关闭存储库膈务在以独占蓮戒运行,淆重翦启动存诸库服务以更改为普通樫式©创建内容换作(在存储障学习刑式用例库1上)开始于05/06/2010 14:19:09.DROP TABLE OPB_REPOSITDROP TABLE OPB_SUBJECTDROP TABLE OPbZpICDS匚DROP TABLE OPB_SRC_FLDDROP TABLE OPBlSCHEMADROP TABLE OPB_SRCDROP T

9、ABLE OPB_SELINFODROP TABLE OPB_TARGDROP TABLE OPB_TARG_FLDDROP TABLE OPB_FLDLiNKDROP TABLE OPB_TARGINDEXDROP TABLE OPB_TARGINDEXFLDDROP TABLE OPBRTSEQDROP TABLE OPB_DBDDROP TABLE OPB_LQAD_SESSIONDROP TABLE OPB_LQAD_FI|_ESDROP TABLE OPBZbTCH_SESSIONDROP TABLE OPB_LOAD_BATCH-*in 卜易INFORMATICSInformati

10、ca学习快速入门文档接下来创建集成服务,因为集成服务是依赖于知识库的,注意关联的存储库服务选择刚建好的学习测试存储库,存储库默认要设置用户名和密码为:Admi ni strator至此,打开 PowerCenter Designer就可开发使用了也可以建至次我们完成了服务端的基本配置,服务端可以对知识库备份和恢复等很多功能,立其相应的服务,这里不再多述!Informatica学习快速入门文档3.2客户端到集成服务端的连接我们开发ETL要使用到PowerCenter Designer 工具,详细的介绍在概述中有,接下我们配 置好Designer与集成服务的连接从客户端工具中打开 PowerCe

11、nter Repository Man agerniormatic Pwf匚芒唯己只己pofitU'从菜单上选择存储库 配置域如下:这样就连接上集成测试用例库,选择学习测试用例库, 从文件夹选项目创建文件夹,相当于在集成库下的一层子目录iiiiuriiidLiLd ruveivt" Irfpu-KU'y ividridyei - l子丁JhJ存储库(R)扁辑童看(V)文件夹(F)版本控制安全性分析(A) j鼬宦肩园督Ifcjal !OO曲O 存储库辱航器学习测式用例库名称注释£?尹组件用iNFORMATiCAInformatica学习快速入门文档4 Powe

12、rCe nter Desig ner 学习4.1概念和基本定义最基本的ETL包括源的定义,目标定义,和映射,另外我们还可以创建可以重用的Mapplet。源分析器:目标设计器:使用到的工具如下映射设计:庐卜舀环裁歸1 r | r -Kb ! r传输件设计:gallon Dr. dlop-r芒学悬區妙Mapplet 组件设计:源分析器是用来定义源的结构,这里的源虽然是从某个数据库导出进来的表结构也可以是某个XSD定义的XML结构等等,但是仅仅绑定了数据库类型,并不是指定了链接要从那个 数据库里抽取数据。这里我们从菜单可以导入表结构,Informatica 提供了 ODBC的方式链接多种数据源INF

13、ORMATICAInformatica学习快速入门文档我们以一个DW事实表为例:;谨名称数据类型长.,:PRIHT_BOCUNEirr_COI)EvarcharS20*: SHOUlf PAT nOciHEMT CODEv&rchar220:REPORT MONTH IDnumber (p, e)6=:BVSSIWESS_FARTHER_IBnumber (p,呂)15?: COKTRA£T_ACCOWIT_IDnumber (p, s:)15i : CONTRACT_IBnumber (p, e)15:TRADE IBnumLer (p, s)15:DEPAKTME町 ID

14、number s)15:COBSU1!IE_KIHD_IDtkumler s)IS:CO»SWE_TYFE_IDnujiiber Q,s)IS:READER IDrvumber s)15nxunber e)6:OIE_CmGEnwinber (p* e)IB:PAYMENT DAE IDnumber (p, s)IS:CREATE_BATEdate19同样我们可以定义目标结构,常规也是导入表结构,我们也可以在Mapping设计中自动创建目标表结构,源定义和目标定义中,我们可以对导进来的表名以及表的结构进行修改以满Informatica学习快速入门文档足我们的设计需求,但是我们在Wor

15、kFlow中实现数据抽取中对应的源和目标要和此结构相 同,如果要满足变化的源和目标,可以通过Visio设计来转换为 Mapping来实现。4.2 Mapping设计和组件的使用PowerCenter Designer 通过Mapping来完成从源到目标的转换,Mapping设计器中包含了大量的转换组件&昭厨伽导盘2J工p®匸沪鼻肚匪鑒耀ISQFOFS ALQ Ms关于组件详尽的说明,可以打开文档具体学习:D.D1 rausformal 1 onffMfippin幽件详解.d川说0LHDU转换组件一般包含,转换、端口、属性、以及元数据扩展转换:可以对该转换更改名称和附加具体说明

16、。端口:转换组件大都包含转换输入端口和输出端口以及特定的操作或表达式。属性:该转换组件的特定设置元数据扩展:下边以两个实例来讲解组件的使用4.2.1实例一:聚合抽取从源到目标,我们中间用聚合 组件,对OWE CHARGE 进行SUM并按几个维组来聚合, 如下图:Informatica学习快速入门文档deeiiitdLdaciihiLL deeinaldacim q± decinaldecim&l dtcinal de-canal數吗英型string decsnsldtciaikldec 3ral名称PEIMT_DOCUNiEin_CODESHQlO_FAY_B0Cl.fflE

17、Brr_0CIDE 1£PORT_MOHTK_ID BVSSIRSS.miKKJD COHTKACT=ACCCilfflTrD COMTRACTJDTRKDE.nC strmwEffr_iii COHSWrtE_KMJ_ID COWSUME_TMPE_III KEAJEE_ni EJnER.UCCOlfln.MOWTLD OiE.CWMCT TATIEW:_OWE_II) CRZATIjmTRAHEJD DEFAJ17nEJrr_ID coHsimi jz. COHSlffiEjr. KEADEKJD EUn_CIWB_clL . weZchak'JEKErflTJWOWT.

18、TLTUikbi&tr t:TKADE.fDntm 蛀 r (lnTintur (;:COJTSlfflE_Kli.nxud 艳 r IjCOMSVME_TMP.B.un'b Er (.:KEW3ER_rDnunib 电(i:01E_CHMfe3EajifibtL (1*卜WQKT_MUETT .TEKD;JD DEFiLRTflEHTJD OHSlfflE jerk.CMSlflnjYP .BEADER Jd s(0IE_CHA.从下图我们可以看到该组件端口中字段属包含:I、0、V、表达式、GroupBy等属性,对于OWE_CHARGE 字段我们仅设置输入,创建自定义属性端口

19、SUM_OWE_CHARGE ,其表达式为SUM(OWE_CHARGE),对于维度键勾选 GroupBy,这样实现了细粒度到粗粒度的聚合I¥GfOujpBp-EEPu5T_Exnrn5do-cizia.1-£0JzRAIE.ID£e:cizia.l077J7fl-DEFAKTSESTID110Ml制圜ptC0M5inE_KOT_ICdecimal13k詞圍p-K5;SE_TliTE_IDdv-rizul15a03 1n7KEADE1.IDlSA-tloM.11A071n6.us_«T«_eharie-S-tFl?lgL:回n&U9 :O

20、Wa_CHAKE?OTE_CyAKEdi»ciauLl303菇换类型:.Agp-EditorStiAigaJ:确走1取消 I 翻I fflb I每种组件都有自己特定的属性和特定的端口属性,我们通过属性设置或表达式来实现组件的特性,不同组件的搭配来完成整个Mapping的设计422实例二:取TOP前三条记录源表数据Informatica学习快速入门文档目标:取 Scorel TOP 前3条记录、和 Score2 TOP 前3条记录实现:对源表分别用两个 Rank组件,Rank组件有分组排序取前 N或后N条记录的功能,如下图Q Q埶摇粪型隹idlnatt er (p, s)1Hi證nui

21、kt er (p, s)IAicwtlnvn'btr 血 s)2»rnuhtfir (jpj e)31fiANJZHDIX 血Hftr* 电 13-c«rZSQRankSauz f SC-LITCC二岂ffl帘称Saffig 型id id2decan-il decinlb-nddeinilb-cc«r«2如i.Jb,匸 /_p-L2Z*idlidZua* 1T1-1 l>I*¥id! id2 jertLr*:-.k_TnzBrt_&rou.i:I-Qfj7#ra-t Ps-finltHwi埶is类型*:idllDunb4r

22、e)!>:idZnunb4rs)-scpre!nunb«r 氐片 a)-scorednunb<r ©申 s) Rviklndxnunber (p a):i .dl id2Ki-;-勺rr2用-scorel-scoreS-RarJIhdeK305 翹 2T1 nm/b 銘s)"luiiBer (f ,s);nov ber (p,s)*limber5)?nuih'bei1 Cpjs)三端口属性如下:Ranklndex 为自动产生的 Rownum,score1 后的R表示以此排序组件属性设置如下:Informatica学习快速入门文档 top/bot

23、tom :取前或后 Number Of Ranks :取多少位抽取结果:ID1ID2SCQKE1SC0R£2KAHKIHEEJI15S8T7T1245577S235S515T345S8777154557752&5551573iNFORMATiCAInformatica学习快速入门文档423实例三:抽取XML源雇员DTD定义:<'ELEMENT XHL_EMPLOYEES EMPLOYEE+)><ELEMENT EMPLOYEE (LASTNAME. FIR5TNAME, ADDRESS, PHONE+> EMAIL*, EMPLOYMENT)&

24、gt;<ATT匸工ST EMPLOYEE ZMFID 匚口直丁益 +REQUTREDDEFTID CDATA #REQUIRED<? ELEMENT LA5TNAME #PCEtATA>< 'ELEMENT FIR5TNAME 护匚DATA) ><'ELEMENT ADDRESS (STREETADDRESS, CITY, STATE, ZIP><ELEMENT STREETADDRESS (#PCDATA)><!ELEMENT CITY (tFCDATA)><!ELEMENT STATE < *PC

25、DATAj >< ELEMENT ZIP (#PCntRTA><'ELEMENT PHONE (fPCDATA)><1ELEMENT EMAIL (#PCDATA)><!ELEMENT EMFLOYHENT (DATEOFHIRE, SAZAKY+)><!ATTLIST EMPLOYMENT EMPLSTAT (FF|PF|TF|TF|O)"FF">< ELEMENT DATEOFHIRE (# PC DATA) >ELEMENT SALARY (#PCDATA>设计如下:导入XML

26、源结构为源,通过 SQ分别将雇员信息分解为雇员表,雇员电话,雇员邮件,雇员薪水,具体设计如下图:INFORMATICS学习快速入门文档容称EMPLOYEEI f XFKJMPL. / 0EP7ID知 EMPTU t>LASTHA!E OFIRSTNMIE OSTKEETM. ” f>CITT|J_EMPLDTEE)./eUEPTID./®EMFID./LASTWAME ZFIRSTWE./AHHMSS.- ” /AiDDRESS.OSTfcTE. /ADDRESS.t>2IF,/M)DRESS.6'WLSTC. /EIPLOTM-nATEQFKIEE I F

27、JWWI-jKrE_rMOHI,/EFFLDTM. .PHONE)QFNDNE . 匡 ENAIL (J_EWXIL) 7«PK_ENAILCf FK_EWP.OEHAIL 互 SAIAKY il_SALART) rXPJLS*.df FK JllF.(J>SJlLART .1 ( MLraQ_IiiL&E»loTMS yfJs4L Sqoti;« Qui-lifitrIFalh苫 X EMPLOYEE*MXFK-EKFL .gEFTJID./enEmo卜.ElflPID./»SHFD»11OLA5THWIE.FLASTIWMEf

28、F町 JETHAME./riRSTBWflEOSTREETAD./ABDRISS .OCIT¥./ABDKESS.7|ESTATE./ASDRZSSOZIF./JUKDKES3.*<?EKIPl£TAT./empld .1-ODATEOFKIKE./EMFLOYM.: K_FHDKE»"lXFK.PMOHEh|-FK_EMPLOZEET|QFWHE1苫 X EMAIL1 rvXPJ?_EHAILh滓FK EMFLQ.* EHATLVi、i K_SAmrr-XFK SkLARTb-*邛 FELEWLOFOSALART卜薛名酚1埶提类.XFK.EBFL

29、OTKEnujhbi皂亍:HEFTEDvafith-e!;EWFID:LA5TNWIEvareht:FIESTBWvarch-e TPTfffTAn nPKEIT1一丄上丄丄上V . XFK_FHDlfEt FK_EMPUYEE:FHOXEwarch站I丨 山asa殛罪.KPILSMAE?电:FK_EMFL(JYEE1 :EALAEY麹据类霑imber (j number (j vu-chu-4.3 WorkFlow的设计和使用4.3.1 创建 Sessio n在做完Mapping设计之后,我们要抽取数据,接下来的任务就是WorkFlow的设计,在WorkFlow设计器中,数据抽取的基本组件是

30、 Session, Session是映射的一个具体实例, 在创建一个Session时必须指定一个映射,并由这个 Session决定了数据抽取的默认源和 目标。我们打开 WorkFlow设计工具,从工具上选择,这样我们就可以创建Session ,INFORMATICSInformatica学习快速入门文档Sfl_SZDI_FATBIrr !- 弘世" qn«li£icT从库中选择已经设计好的 Mapping,确定TWKMsNT_CMB - DC Ccmnection»_BiECreE*l5r_tes.t.SUi_SZBI_FAIil!lT_0Tf双击已经创建好的 Session ,设置默认的映射,源,以及目标实例,例如在设计源的时候,我们的源是Oracle表结构,在这里相应的设置数据库连接即可,如果源是文件,则要指定路径和文件名,我们将源的Tracing Level设置为Normal , Tracing Level为数据抽取监控日志的级别常规踐射|组件丨元孰摄甘展IStXSkOTL冋車用J连抿$內存童生$文件目录和命令 日口弭dgTW3aw_PA?ffi b 自-遇® GTW強二 B 口彼茹甞 MEIPANS 陆 RMCTPAJ酉I

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论