Informatica快速入门_第1页
Informatica快速入门_第2页
Informatica快速入门_第3页
Informatica快速入门_第4页
Informatica快速入门_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、INFORMATiCAInformatica学习快速入门文档INFORMATICAInformatica学习快速入门文档INFORMATiCA1 Informatica 概述 32 安装 Informatica8.6.1 32.1 服务端安装 32.2 客户端安装 73 配置管理服务器 93.1 创建知识库和集成服务 93.2 客户端到集成服务端的连接 124 PowerCe nter Desig ner学习 134.1 概念和基本定义 134.2 Mapping 设计和组件的使用 1 54.2.1 实例一:聚合抽取 154.2.2 实例二:取TOP前三条记录 164.2.3 实例三:抽取 X

2、ML源 194.3 WorkFlow的设计和使用 204.3.1 仓U建 Session 204.3.2 设计 WorkFlow 224.4 Repository Man ager 23Informatica学习快速入门文档1Informatica 概述Informatica 一直致力于为客户提供具有强大的元数据管理、数据集成和个性化分析递送功能的世界通行标准的统一数据服务平台。In formatica的基础设施产品以可伸缩的、可扩展的企业级数据集成平台为特点,并广泛支持来自Informatica和其他的领先商务智能提供商的数据仓库基础设施和分析型应用软件的开发和管理,提供元数据管理解决方案,

3、帮助企业集成、优化、审核信息资产以提高运营效率,增加客户收益,取得竞争优势。DInfcuznat i c. d详见文档:-2 安装 Informatica8.6.1pc861_cl ient_wi n 3 2_x85.zip3 p c8&l_H otFixS_C li entzip倉 p c8 51_H otFii8_wl n 3 2_x& 6.zipI匚 8&l_win32_j(86,2i p这里以 Informatica8.6.1 为例:2.1服务端安装找到安装目录 pc861_wi n32_x86.zipServerWi ndowsDisk1In stDataVM下l in&tall.e

4、xeInformatica学习快速入门文档iNFORMATiCA点击下一步,并选择安装 PowerCe nter8.6.1必须选择事先准备好的安装密匙选择安装语言,这里以中文版为例Informatica学习快速入门文档选择安装路径HTTPS配置,配置管理控制台与配置管理器的安全通信(如果没有使用该端口就采用默认)INFORMATiCAInformatica学习快速入门文档配置好Informatica 域并进行下一步,取掉为特定用户启动Informatica Services ,点击完成安装Informatica学习快速入门文档2.2客户端安装选择安装设置安装路径INFORMATiCAInfor

5、matica学习快速入门文档安装完成后可以看到包含的所有工具INFORMATICAInformatica学习快速入门文档3配置管理服务器3.1创建知识库和集成服务接下来我们主要是配置知识库管理服务器,PowerCenter数据整合引擎是基于元数据驱动的,提供了基于元数据驱动的元数据知识库(Repository ),知识库是 PowerCenter的核心。在Informatica Services 启动的的情况下,我们可以通过管理控制台来操作。In crmatlG Pc?werCenter 8.6.1Cliert.Services_ Inforrriatica Orchestration Ser

6、PowerCenfter Administration C从控制台里我们可以看到很多选项,我们主要是创建存储库服务 (Repository )和集成服务,存储库服务(Repository)存储所有的ETL元数据,包括:源、目标表的物理和逻辑元数据,ETL转换规则,知识库用户权限,ETL任务运行历史信息等元数据。皙建X面M MPidddlci Mrindr 舟-keference lable Manager 甲sap aw服勇 暮 WpIi Serviues Huh亡文件夬;冋幡7许何城汗爼怡岂 “inrt!ii_Hbnivii PrI如誉时间公荊刃于戶0 11;04;39 2010首先我们创建

7、一个用于测试学习的存储服务器,事先在 Oracle中建好要用到的数据库此处如果无法创建成功有以下可能:1.需要设置环境变量,将C:In formaticaPowerCe nter8.6.1Serverbi n; C:I nformaticaPowerCe nter8.6.1Reposi toryServerbin;移到 Path 最前边2.代码页一定要如下选择Informatica学习快速入门文档ms windows Simplified Chinese, supers of gb 2312-ea, ew ?ncod*ng3.设置知库链接用的数据库用户要有DBA角色权限连接字符串设置为当前的O

8、racle服务名ECF的握年状态创建内容:施助o【口第1页,共帀韵 保存 关田存憐障腥勢在隨隹占槿我运行,洁重新启动存當底鹿务以更矗为普隧槿戒。创建内窖操作(在存储库呼习测贰用例库】上)开始于05/0&/2010 14;酉:DDR.OP TABUE OPB_REPOSLTOROP TABLJE OPBSUBJECTDR.OP TABLE OPB_PICDSCDR.OP TABLE OPB_SRC_FLDDR.OP TABLE OPB_SCNEMADROP TABLE OPB_SRCDROP TABLE OPB_SELINFCDROP 伽LE OPB_TARGDROP TABLE OPB_TAR

9、G FLODROP TLE OPBZFLDLINkDROP TABLE OPB_TARGIMDEX。建0口 TAELE OPB_TARG1MDFLDDFLOP TABLE OPBRTSEQDROP TABLE OPB_DBDDROP TABLE OPB_LOAD,SES5IONDROP TABUE QPB-LQAD.FILESDROP TABLE OPBBTCI-LSESSIONDKOP TAELE OPbZl,OAD_BATCH-T“I |MlInformatica学习快速入门文档接下来创建集成服务,因为集成服务是依赖于知识库的,注意关联的存储库服务选择刚建好的学习测试存储库,存储库默认要设

10、置用户名和密码为:Admi ni strator也可以建至次我们完成了服务端的基本配置,服务端可以对知识库备份和恢复等很多功能,立其相应的服务,这里不再多述!Informatica学习快速入门文档3.2客户端到集成服务端的连接我们开发ETL要使用到PowerCenter Designer 工具,详细的介绍在概述中有,接下我们配 置好Designer与集成服务的连接:从客户端工具中打开 PowerCe nter Repository Man agerLnfo rmatka Pow.eRepos itIV 吕从菜单上选择存储库 配置域如下:K这样就连接上集成测试用例库,选择学习测试用例库, 从文件

11、夹选项目创建文件夹,相当于在集成库下的一层子目录LU-V Is*-ciMdyfr -叮川*号诵库巒(E)査看W剤恢旧版本控制安牡甘折罔滋宦肩凰嚅産|去|存储库导航器Q P基衣组件朗钢学习5配置 M至此,打开 PowerCenter Designer就可开发使用了Informatica学习快速入门文档INFORMATiCA4 PowerCe nter Desig ner 学习4.1概念和基本定义最基本的ETL包括源的定义,目标定义,和映射,另外我们还可以创建可以重用的Mapplet。使用到的工具如下源分析器:映射设计:传输件设计:T就血Ff也叵1匚兀辺矽!P检勖画抄Mapplet组件设计:血紳皿

12、匚占浮他源分析器是用来定义源的结构,这里的源虽然是从某个数据库导出进来的表结构也可以是某个XSD定义的XML结构等等,但是仅仅绑定了数据库类型,并不是指定了链接要从那个 数据库里抽取数据。这里我们从菜单可以导入表结构,Informatica 提供了 ODBC的方式链接多种数据源INFORMATICAInformatica学习快速入门文档连摟到数据屋ODBC 数擴源(P); 110.10,5,21 (Orde m ODblOg_homeiy田 a左 fi n-I備定取消Mapping设计中自动创我们以一个DW事实表为例:工下 r-.YXEM 、吒i : _=窖称粗畝型1怅1IB*FKIHTJOC

13、UMENT.COBE74rch.4r220H_SHBULD FAY BOC UNENT 匚DDEv ar charS209RETORT 血肛H IDnumber (p,訂6BUSSIHESS PART ITER II(pf s)15a*cowrRACT_iicoinrr_iDnumb e r 丫 eJ15:CONTRACT IDnumber (p, e)15r*JMTRAM JEDnumber (p* s)151-DETAKTHIEMT IDnumber (p, s)15J-JCQBSVNI_KIin)JDnumber (p* s)15J!*COlJSUMInPEJDnumbersj苗9KEA

14、DER_flnumtsr b IS3ENTER ACCOUBT WORTH IDrnunber (p,叮c-CO_匚 URGEnumb8r (p, sDL6PAIMEH OWE IDnumber (p, 3)15wIB*JQCRIATE DkTE19討_=同样我们可以定义目标结构,常规也是导入表结构,我们也可以在 建目标表结构,源定义和目标定义中, 我们可以对导进来的表名以及表的结构进行修改以满Informatica学习快速入门文档足我们的设计需求,但是我们在WorkFlow中实现数据抽取中对应的源和目标要和此结构相 同,如果要满足变化的源和目标,可以通过Visio设计来转换为 Mapping

15、来实现。4.2 Mapping设计和组件的使用PowerCenter Designer 通过Mapping来完成从源到目标的转换,Mapping设计器中包含了. .Trails fornKil iouff!MiipKigRSlfl诽解.ddecoc转换组件一般包含,转换、端口、属性、以及元数据扩展转换:可以对该转换更改名称和附加具体说明。端口:转换组件大都包含转换输入端口和输出端口以及特定的操作或表达式。属性:该转换组件的特定设置元数据扩展:下边以两个实例来讲解组件的使用4.2.1实例一:聚合抽取从源到目标,我们中间用聚合组件,对OWE_CHARGE 进行SUM并按几个维组来聚合, 如下图:I

16、NFORMATICAInformatica学习快速入门文档INFORMATiCAlEETijxtcr1EP7HTJ1OT . 邙口-亦 JEPWirflHTJB coraJMjn s CDIiUIIE_IT . luxjd Ef E!!.曲1IE卿fudtl jjccuwanjcni imjJOCUIEKjCCfflEKEMW_mffTH_TOi.n fel强ssmIsuxEt顾卫曲ecinhlEW 側CTCCOUfflIiie-cind.茁冊雄ir_ttJ-CLnwllUOI IDdhecLn&lDIPWTNEITnELR.1n)N3ifVE_imO_IDlifrcLncLlLU恥鼎dkcx

17、ntLRE軋rfecinalFiotifTniu jmmfjnms_cikfiGEdccinblFMM泄丁卫处DdkeinBlhi抑飞联 Tctr.iiziinr TUEI 33 MrMlfflZBTJD LllM.ETK CZ JEintt ITT. JttALIb;_in w mw ria.-;i从下图我们可以看到该组件端口中字段属包含:I、0、V、表达式、GroupBy等属性,对于OWE_CHARGE 字段我们仅设置输入,创建自定义属性端口SUM_OWE_CHARGE ,其表达式为SUM(OWE_CHARGE),对于维度键勾选 GroupBy,这样实现了细粒度到粗粒度的聚 合转劇 询|帀

18、丄册頁)宀_山上亠71=口挛琢1t:汗 T-jmrjro也鈕IDE:fiPa二US -1513c5;L3: jLZ2T.1Tz izizl1 =define 1TJ田二吐二口靶:a:13hH.亡衣-二上虹盖二it-in;1C舟认乍C.1 ;64閒如聊宅 I 魁消 II 宛宦 U每种组件都有自己特定的属性和特定的端口属性,我们通过属性设置或表达式来实现组件的特性,不同组件的搭配来完成整个Mapping的设计422实例二:取TOP前三条记录源表数据Informatica学习快速入门文档对源表分别用两个 Rank组件,Rank组件有分组排序取前 N或后N条记录的功能,如下图蛀皿bl dkrii lL

19、 a! clecitBlLdlLdZ cccratsc-irei-id i. 3C*Te2u专5:1叮 心期匕岂p.Tnbtr l,p,. i.l BSE址 If, il (i临hdF enrH.EW.F a1 4 I? wkJTi sikffscwrec: bi4r_jd._3e:trliI.J.31: ifliill 1 Ufa1 FTHlhfttf l(a放掲粗-ini ber 如匸 J 曲 Mr (f , .) nui bsr l血 eras her匚 11 duj ber j 匸 J端口属性如下:Ranklndex 为自动产生的 Rownum,score1 后的R表示以此排序组件属性

20、设置如下:INFORMATiCA抽取结果:ID1ID2SCOttElSC0RE2MKIBDEXt L55STTT1455TT5235551573N.55STTT15455TT52555515T3Informatica学习快速入门文档 top/bottom :取前或后 Number Of Ranks :取多少位INFORMATICAInformatica学习快速入门文档423实例三:抽取XML源雇员DTD定义:! ELEMriJT! ELEtGMTEMELOYEE (LASTNAME, F工RSTNAME, ADDRESS, PHONE+, EMMJLj EMPLOYMENT)EXELOYEE

21、ZMPID CDATA 4REQUIRZDDEPTID CDATA #REQUIKED! ELEMEiJT FIRSTNAME (#P亡DATA. A! ELEHZNT ! ELEMZNT ! ELEMENT ! EJLEMNT 5TREEIADDRE55匚。玄丁必 ACIIY (#PCDATASTATE2IF (#PCDATA)! ELEMENT EMAIL (#PODATA) I E LEEENT CATTLI5T :ELEMENT EHELOYMENT EHPL5IAT (EF|PP|iy|TP|O) nPFnDATEOFHIRE (tPCDATA)SALARY (|PCDATA:i设计

22、如下: 导入XML源结构为源,通过 SQ分别将雇员信息分解为雇员表,雇员电话,雇员邮件,雇员薪水,具体设计如下图:Informatica学习快速入门文档EIPLD/EE rXHLElFLIJ BUTLJCYICJ-WID/num in丿颐产讥禹TIAff!/r*snriflTb丄上上. JUJli/FLESTtfiflIOsnnTO./MIK1ES.CEY/MTDffSS/UUIMSS,C . ZQ1/adheess./EffiWVh.LAIEUFMIEIB旬?H03E(1 ?H3HE:| - kl. Lfi!1酗皿牡11少iUL|rE_EB?.iH.SKLAfiY1 于IT rnr|:SAL

23、AX?血吃卄 SujiljificrKF让n x fflrwri!下貯5JL ,BZPfXD./QJEPTLDIroswrt/orarro9 USniAMi./usrjiiWtVRSDWE/JTRSTSWED: SREEIM.7KWESSS .tciri.rnuks 刘-.h*STMT皿HZ辽.*匕riFnjizsst却炳 FLSTJlil.ZEHPbJffll.Ik-WBonaDi./IRPUffl.KI xjwnh 12 I?K FH.KElb訂 JLEMtLCY 肛fePJ 5 口1?KJMAIL*:冷肛LK辱 1 K SALaK-p r*K mast aiFLL. 亏s3rVIIPh直

24、.XTUUH:J;_-IL_JilL rnAZL訂禹坦三igI 廿已i紙XTE_EII?LDrEE EJTIU mm.osjjjjhe.nE571MflE君标1 Ii_ELiY.EZ IBF|*T DT*T UFurl:V-fcT CA :? irK_SM-A17 f : JK.3WPL0IBIJ :SK1ARTJh JJiLm&E J. 工4.3 WorkFlow的设计和使用4.3.1 创建 Session在做完Mapping设计之后,我们要抽取数据,接下来的任务就是WorkFlow的设计,在WorkFlow设计器中,数据抽取的基本组件是 Session, Session是映射的一个具体实例, 在创建一个Session时必须指定一个映射,并由这个 Session决定了数据抽取的默认源和 目标。我们打开WorkFlow设计工具,从工具上选择这样我们就可以创建Session ,Informatica学习快速入门文档从库中选择已经设计好的 Mapping,确定双击已经创建好的 Session ,设置默认的映射,源,以及目标实例,例如在设计源的时候,我们的源是Oracle表结构,在这里相应的设置数据库连接即可,如果源是文件,则要指定路径和文件名,我们将源的Tracing Level设置为Normal , T

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论