Informatica Powercenter安装与配置参考文档_第1页
Informatica Powercenter安装与配置参考文档_第2页
Informatica Powercenter安装与配置参考文档_第3页
Informatica Powercenter安装与配置参考文档_第4页
Informatica Powercenter安装与配置参考文档_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Good is good, but better carries it.精益求精,善益求善。Informatica Powercenter安装与配置参考文档项目需求规格说明书Informatica Powercenter安装、配置及简单使用文档文档控制变更记录4日期作者版本变更参考c目 录文档控制I1概述11.1读者对象11.2参考文档12软件简介22.1概念22.2作用23安装准备43.1系统要求43.2数据库账户53.3注意事项54POWERCENTER安装64.1服务器端安装64.1.1运行安装向导64.1.2选择安装类型74.1.3选择License Key84.1.4选择安装路径10

2、4.1.5设置https协议104.1.6域选择与配置134.1.7配置节点154.1.8选择System账户164.1.9安装成功164.2客户端安装184.2.1运行安装向导184.2.2选择安装类型194.2.3选择安装路径204.2.4安装成功225POWERCENTER配置245.1服务器端配置245.1.1启动登陆页245.1.2安装密钥255.1.3登陆服务器285.1.4创建应用服务305.1.5验证应用服务355.1.6创建用户355.1.7赋予用户权限365.1.8备份资料库内容375.2客户端配置385.2.1添加主机串385.2.2连接服务器385.2.3登陆服务器40

3、6功能介绍426.1客户端的服务426.2在 Repository Manager 中创建 Folder436.3引入数据源结构446.3.1456.4引入目标结构476.5设计 Mapping486.6设计 Workflow。546.7运行 Workflow606.8查看作业运行情况617详细介绍627.1参数文件的使用627.1.1什么是参数文件627.1.2添加参数文件637.2从FTP取文件667.2.1创建mapping667.2.2在session中设置687.3菜单说明697.3.1source Analyzer菜单说明707.3.2Target Definition 菜单说明7

4、07.3.3Transformer菜单说明717.4事务控制717.4.1创建事物控制组件717.4.2事物的逻辑处理737.5表的关联747.5.1相同结构表的关联747.5.2不同结构的表的关联767.6版本控制787.6.1开启版本控制787.6.2使用版本控制788开发介绍798.1 Source798.2 Target828.3Mapping838.3.1Lookup848.3.2Joiner858.3.3Rank888.3.4Source Qualifier918.3.5Update Strategy938.3.6Expression948.3.7Filter968.3.8Aggr

5、egator97581 概述本文档可作系统管理员安装PowerCenter时参考指南,安装人员最好具备一定操作系统、关系数据库、数据库引擎相关知识。1.1 读者对象开发人员;1.2 参考文档PowerCenter官方文档PowerCenter 8.6.1 Documentation;互联网PowerCenter论坛。2 软件简介2.1 概念Informatica PowerCenter 是Informatica公司开发的世界级企业数据集成平台,也是业界领先的ETL工具。Informatica PowerCenter使用户能方便地从异构的已有系统和数据源中抽取数据,用来建立、部署、管理企业数据仓

6、库,从而帮助企业做出快速、正确的决策。此产品为满足企业级要求而设计,可以提供企业部门数据和电子商务数据源之间的集成,如XML,网站日志,关系型数据,主机和遗留系统等数据源。此平台性能可以满足企业分析最严格的要求。PowerCenter 提供了一个环境,允许您将数据载入集中地点,例如数据集市、数据仓库或操作数据存储 (ODS)。您可以从多个源提取数据,并根据您在客户端应用程序中构建的业务逻辑转换数据,然后将已转换数据载入文件和关系目标。PowerCenter 提供了以下集成组件。1) PowerCenter资料库 PowerCenter 资料库是 PowerCenter 套件的核心部分。您可以在

7、资料库数据库中创建一组可供PowerCenter 应用程序和工具访问的元数据表。PowerCenter Client 和 Server 访问资料库以保存和检索元数据。2) PowerCenter Repository Server 能够管理从客户端应用程序到资料库的连接。它可以从资料库数据库表中插入、更新和获取对象。它还会保持对象的一致性。3) PowerCenter Client 使用 PowerCenter Client 管理用户、定义源和目标、构建带有转换逻辑的映射和映射组件,以及创建工作流以运行映射逻辑。PowerCenter Client 有以下客户端应用程序:Repository

8、Manager、Repository Server Administration Console、Designer、Workflow Manager 和 Workflow Monitor。4) PowerCenter Server 提取源数据、执行数据转换并将转换的数据载入目标。2.2 作用Informatica PowerCenter 是建立可伸缩、可扩展的Informatica数据集成平台的核心和基础。与Informatica PowerConnect产品一起使用,Informatica PowerCenter 可以提供对广泛的应用和数据源的支持,包括对ERP系统支持(Oracle, Pe

9、opleSoft, SAP),对CRM系统支持(Siebel),对电子商务数据的支持(XML, MQ Series),遗留系统及主机数据。Informatica PowerCenter 是最突出的分析性数据集成平台。Informatica PowerCenter 是可使大企业或组织能按其复杂业务信息需求读取,转换,集成遗留系统、关系型ERP,CRM,消息信息和电子商务数据的数据集成平台。图2.2.1说明了 PowerCenter 的体系结构:图 2.2.13 安装准备PowerCenter主要管理单元是域,域主要包括节点和应用服务。在某台计算机上安装PowerCenter过程中,会提示创建一个

10、域和节点,所有应用服务都在该节点下运行。安装前有些相关信息需要了解,更多安装配置信息可以参考PowerCenter官方文档。3.1 系统要求在安装之前首先要检查系统是否满足PowerCenter所需最低配置,表3.1.1列出了PowerCenter安装组件所需要的系统最低要求。表 3.1.1ComponentProcessorRAMDisk SpaceOperating SystemPoweCenter(Domain and all services)2CPU4GB3GBWindows 2000 / 2003Sun SolarisHP-UXIBM AIXRed Hat LinuxSUSE Li

11、nuxPowerCenter DomainRepository ServiceIntegration ServiceReference TableManager Service1CPU2GBWindows 2000 / 2003 Sun SolarisHP-UXIBM AIXRed Hat LinuxSUSE LinuxMetadata Manager Service2CPU2GBReporting Service1CPU512MBOrchestration ServerMetadata Manager Agent*1CPU220MBWindows 2000 / 2003PowerCenter

12、 Client Orchestration Client1CPU1.2GBWindows 2000 / XPWindows Vista (PowerCenter Client only) 请确认您的系统满足相应要求,如果达不到该最低配置,安装过程中很可能会遇到意想不到的问题。3.2 数据库账户PowerCenter需两个数据库账户,一用来存放域管理表结构和元数据,一用来存放etl集成信息表结构,其支持四种数据库类型:Oracle、SQL Server、DB2和Sybase。根据自己情况选择合适数据库类型,首先创建一专门用于域配置管理的数据库,在该库下创建两个具有管理员权限的账户。本安装使用Or

13、acle数据库,创建SID为ORCL数据库(配置网络服务名也为ORCL),在该库下创建两个账户分别为:infainstall和infaconf。其中infainstall是PowerCenter服务器端安装过程中需设置的账户,用以存放域管理相应表及元数据,infaconf是在服务器端配置,添加Repository Service时所需账户,主要存放客户端check in上来的数据信息。这儿的一些数据库及账户信息可以根据个人需要设置合适的名称。3.3 注意事项最需要注意的有两以下几点:1、 系统配置必须达到软件所需要的最小配置;2、 创建的两个数据库账户必须赋予其管理员权限;3、 PowerCe

14、nter会根据所选License及安装选项进行相应安装;4、 具备一些数据库和操作系统相关知识。4 PowerCenter安装PowerCenter软件自带了安装向导,该安装向导可进行全新版本安装或更新先前版本。目前BI项目PowerCenter软件使用版本为8.6.1,故本文档以该版本安装为准。如果第一次安装PowerCenter,则必须创建一个PowerCenter域和节点(在安装过程中会提示设置相应信息),在其他机器上创建节点后也可以加入该域。下载PowerCenter安装包,将其解压至某目录下,其中 “pc86_win32_x86”文件夹为服务器端安装包,“pc86_client_wi

15、n32_x86”为客户端安装包。PowerCenter安装分为服务器端和客户端,其可安装至同一台计算机,也可安装在不同计算机上,客户端则通过配置连接到服务器端。本文档讲述在Windows平台下PowerCenter的安装。服务器端安装复杂些,客户端和官方文档则较服务器端简单,安装过程类似。本文档会详细介绍三类组件安装过程。4.1 服务器端安装4.1.1 运行安装向导1、 双击“pc86_win32_x86”文件夹下“install.bat”批处理文件,运行安装向导,如图4.1.1。图 4.1.12、 安装准备进度达到100%后出现安装语言选择向导,如图4.1.2。图 4.1.23、 选择“En

16、glish”,点击OK按钮出现图4.1.3欢迎界面,显示了版权信息。点击Next按钮。图 .2 选择安装类型图4.1.4为安装类型选择界面,选择上方的“Install PowerCenter 8.6.1”进行全新安装,“Upgrade to PowerCenter 8.6.1”执行更新操作,第一次安装则选择上方选项,然后点击Next按钮。图 .3 选择License Key1、 在图4.1.5界面中点击Browse按钮找到合适的License Key,然后点击Next按钮进入下一步。一般安装包里自带License Key,本安装程序Key在pc861_win32

17、_x86中。图 4.1.5图 4.1.6图4.1.72、 图4.1.6和图4.1.7显示域配置数据库的四种类型及可能需要的磁盘空间,点击Next按钮进入下一步。4.1.4 选择安装路径在图4.1.8显示安装路径。修改默认路径(可选),安装在“D:InformaticaPowerCenter8.6.1”目录下。点击Next按钮。图 .5 设置https协议1、 图4.1.9显示https协议配置信息,保持默认设置,点击Next按钮。图 4.1.92、 如果弹出“Windows安全警报”点击解除阻止按钮,如入图4.1.10。图 4.1.10图 4.1.113、 图4.1.11汇总刚

18、才设这的选装选选项,如需修改点击Previous回退进行修改。点击Install按钮进行安装。图 .6 域选择与配置1、 安装过程可能需要几分钟,时间长短根据机器配置而定,安装完毕后进入图4.1.13域类型选择界面。首次安装PowerCenter则选择“Create New Domain”,若想加入已存在的域中则选择下方的“Join Existing Domain”。图 4.1.132、 装选择“Create New Domain”项。图4.1.14显示域设置,其中数据库类型提供了Oracle、SQLServer、DB2和Sybase四种,数据库URL已给出了格式,按格式修改

19、,即主机IP:端口号。用户ID使用安装前创建的infainstall,数据库服务名即Oracle配置的SID的网络服务名。注意:Database service name:在Sqlserver中填写 主机IP:数据库名 oracle中则只填写数据库名就可以了。图 4.1.14图 4.1.153、 数据库选择Oracle填写好相应的信息,其中数据库类型。填写完毕后,点击“Test Connection”,如果弹出如图4.1.15对话框,点击Next按钮继续。4.1.7 配置节点1、 图4.1.16界面设置节点的信息,设置好密码,其他保持默认,点击Next按钮。图 4.1.16图 4.1.172、

20、 图4.1.17该过程可能会进行几分钟,时间长短看计算机配置而定,此时主要对域和节点进行配置。4.1.8 选择System账户图4.1.18 选择是否使用Windows其他用户运行PowerCenter服务。取消“Run Informatica Services under a different user account”选项,让其在当前账户下运行服务。点击Next按钮继续安装。图 .9 安装成功1、 弹出对话框图如图4.1.19,若安装状态显示为:SUCCESS,则表示安装成功,点击Done结束安装,至此,PowerCenter服务器端安装完毕。图 4.1.192、 在浏

21、览器中运行::6001/adminconsole/ 或:8443/adminconsole/Console.do打开服务器管理登陆界面,如图4.1.20。图 4.1.20中间若提示“此网站的安全证书有问题”,点击继续浏览此网站即可。输入用户名:admin和密码admin,登陆进行服务器端设置。4.2 客户端安装PowerCenter服务器端安装完后,需要安装客户端,因为ETL的所有工作基本都是在客户端完成的,服务器端只是对资源池、集成服务的设置。4.2.1 运行安装向导1、 双击“pc86_client_win32_x86”文件夹下

22、“install.bat”批处理文件,运行安装向导。如图4.2.1。图 4.2.12、 安装准备完毕后,弹出安装语言选择界面,如图4.2.2。图 4.2.23、 选择“English”,点击OK按钮。弹出欢迎界面,显示一些版权信息,如图4.2.3,点击Next按钮。图 .2 选择安装类型选择第一选项全新安装,点击Next按钮进行下一步。图4.2.4显示客户端安装类型,第一选项“Install PowerCenter Client 8.6.1”全新安装,第二选项“Upgrade to PowerCenter Client 8.6.1”将现版本更新至8.6.1。图 4.2.4图 4

23、. 选择安装路径1、 更改默认安装路径(可选),点击Next按钮,如图4.2.6。图 4.2.62、 图4.2.7显示前几步设置信息,如修改点击“Previous”回退进行修改。点击Install按钮。图 4.2.73、 图4.2.8进行安装,该过程需要花费几分钟,时间长短依机器配置而定。图 .4 安装成功1、 若出现图4.2.9所示界面,Installation Status为SUCCESS,则说明安装成功。点击Next。图 4.2.92、 图4.2.10允许你当安装结束后运行的PowerCenter客户端组件。在希望安装结束后立即运行的组件多选框打勾。点击D

24、one按钮结束安装。图 4.2.105 PowerCenter配置PowerCenter配置分服务器端配置和客户端配置,服务器端主要是配置应用服务、管理账户,控制安全等,客户端配置主要是连接服务器,创建分类等,以满足ETL需要,为ETL过程创建快速、便利环境。5.1 服务器端配置PowerCenter服务器端配置主要使用Administration Console,其是管理PowerCenter域和安全的工具,可管理日志、域对象(services、nodes、grids、folders和License)、域报表、用户、组、角色和权限。服务管理器是一种管理所有域操作的服务,和Informatic

25、a服务一起运行,可作为Windows系统服务运行。当启动Informatica服务时,启动服务管理器。每个节点运行一个服务管理器,若该服务停止,则相应节点不可用。当在一台机器上安装PowerCenter服务,会将一台机器作为节点加入某个域。可向同一个域中加入多个节点。域中每个节点都运行一个服务管理器,管理本台机器上域操作。服务管理器运行的域操作取决于节点的类型。5.1.1 启动登陆页打开IE或火狐等浏览器,在地址栏输入下面格式的URL转到Administration Console登陆页。http:/<host>:<port>/adminconsole其中host代表任

26、一节点的主机名或IP地址,port即为相应服务的端口号。例如可以输入“http:/localhost:6001/adminconsole” 或“http:/localhost:6001/”,回车。若出现图所示界面,点击“继续浏览此网站(不推荐)”进入登陆页面。如果为Administration Console配置了https协议可以输入下面格式URL直接转到网站登陆页。https:/<host>:<https port>/adminconsole如输入“https:/localhost:8443”或“http:/localhost:8443/adminco

27、nsole”回车,若出现图所示界面,点击“继续浏览此网站(不推荐)”进入登陆页面,如图。图 图 5.1.2 安装密钥若节点配置的https协议使用了自签名的密钥,可能会出现警告信息,如图地址栏中显示“证书错误”,点击警告自己安装个自签名认证书,重启浏览器即可。1、 点击“证书错误”,出现图界面,选择查看证书。图 2、 点击“查看证书”后出出现图界面。点击“安装证书”按钮,出现证书导入向导。图 图 3、 两个单选按钮用哪个都可以,这里默认,点击“下一步”按钮

28、。图 4、 直接点击“完成”按钮结束安装,出现导入成功对话框。图 图 5、 重启浏览器,若证书错误仍然显示,不必理会,其可以正常工作。把IP换成主机名即可。如图。图 5.1.3 登陆服务器Administration Console登陆页出现,输入用户名和密码进入(使用服务器安装时设置的账户admin),如果有管理员权限,PowerCenter管理助手会出现,如图。“Configuration Assistant”打开应用服务安装向导;“Configuration Documentation”打开配置文档;“U

29、pdate Wizard”打开更新向导;“Update Documentation”打开更新文档向导“Administration Console”进入主界面。图 如果下次登录时不想再看到给界面,将“Dont show this dialog again”复选框选定即可。这里选择“Administration Console”直接进入主页面。如图。图 5.1.4 创建应用服务应用服务包括the Repository Service、Integration Service、Reporting Service、Metadata Manager Servic

30、e、 Web Services Hub、 SAP BW Service和 Reference Table Manager Service。当配置某个应用服务时,必须为其指定其运行的节点,该节点运行相应的服务器进程。服务管理器会对运行的每个服务器进程所在节点分配一个端口。不同的类型的应用服务同时可运行的服务器进程不同,如Integration Service可同时运行多个进程。其运行sessions和workflows。 Repository ServiceRepository Service其实就是包含元数据的数据库表的集合。下面对其创建并配置。1、 在域界面中,点击“Creat

31、e”下拉框,选择“Repository Service”。图 .12、 创建新的Repository Service,其中Service Name:即为名称,其在整个域中必须唯一,Location:将该Repository Service建在哪个文件夹下,可点击“Select Folder”进行选择,也可等创建完毕后进行更改。License:指定安装的key或其他的Key,如果没有License也可创建成功,但是运行Repository Service必须需要License,不同的License会使Repository Service运行时有不同的功能。Node即为某台计算机,每

32、个Node需要一个系统账户去运行,这里用安装时配置的Node。Database Type:数据库类型,有四种Oracle、DB2、SQL Server和Sybase。这里选择Oracle数据库。Code Page:编码,选择后不能进行更改,这里选择中文简体。ConnectString:DBUSER:数据库用户名,这里用安装前准备好的账户infaconf。DBPassword:数据库用户名密码。TablespaceName:只有DB2数据库时指定。图 .2 创建模式第一次创建选择“Create new Repository Content”,最后点击“Create”按钮进行创建。注

33、意:sqlserver中ConnectString需要填写主机IP数据库名,oracle则只填写数据库名。3、 创建成功,创建的过程其实就是在infaconf账户下创建了一写表结构,如图.3。若出现如图.4界面,则显示创建成功了。图 .3图 .4创建完毕,可能在左侧的浏览器中找不到创建的Repository Service,其实已经存在,切换到其他选项卡,如log,再切换回来就可以看到了。需要注意的是编码的选择,后面的某些应用服务会用到,必须是其编码子集,否则创建失败,如Integration Service。 Integr

34、ation Service集成服务是运行sessions和workflows的应用服务,运行前必须为Integration Service指定Repository,其为检索Repository中元数据,例如workflows和mappings。还有,必须为Integration Service指定编码,其必须为Repository编码的子集。1、 在域界面中,点击“Create”下拉框,选择“Integration Service”。图 .12、 弹出创建新的集成服务,配置完后点击“Create”进行创建。图 .2Service Name:集成服务名称,域内必须唯一

35、。Location:将该Integration Service建在哪个文件夹下,可点击“Select Folder”进行选择,也可等创建完毕后进行更改。License:指定安装的key,如果没有License也可创建成功,但是运行Integration Service必须需要License,不同的License会使Integration Service运行时有不同的功能。Node即为某台计算机,每个Node需要一个系统账户去运行,这里用安装时配置的Node。Associated Repository Service:指定一个Repository,这里用前面刚创建的rsinfaconf。Repo

36、sitory User Name:Repository用户名,使用安装过程中设置的admin。Repository Password:Repository密码。Data Movement Mode:选择Unicode。3、 若想创建完毕后直接运行,可将图.3复选框勾选,但是前提条件是其指定的Repository必须正常运行中,点击OK创建。图 .35.1.5 验证应用服务至此,ETL运行所需服务器端资源配置完毕,但需要验证是否配置成功,点击Domain选项卡,点击创建的Repository“rsinfaconf”,查看右侧是否正常运行。如正常运行则会有绿色“The

37、service is running.”若正在运行,点击“Disable”,一段时间后停止,然后重新启动,如果重启动正常,则表示Repository配置成功。对于Integration Service,点击“isinfaconf”,若正在运行,停止运行,然后重新启动,如重启后正常运行,则表示Integration配置成功。至此,ETL运行所需服务器端资源配置成功。5.1.6 创建用户客户端连接服务器必须需要账户,PowerCenter默认带了两个账户,一为Administrator,一为安装时设置的admin。1、 点击主页面右上角人头形按钮切换到用户创建页面。这里可以创建,删除或更改组、用户

38、、角色。2、 点击“Create User”按钮,弹出创建用户对话框,按着提示填写,点击OK按钮结束创建。图 5.1.7 赋予用户权限用户创建后必须赋给其相应的权限,其才能进行一定的操作。在Users框中展开Native,选中admin,在右侧界面中,点击rsinfaconf(其上划了黑色线表示admin用户对该Repository没有任何权限。)弹出对话框,切换到“Privileges”选项卡,将“rsinfaconf-RepositoryService”前的复选框勾选,将其所有权限赋给admin,使其具有对rsinfaconf操作的一切权限,然后点击OK按钮。图 5.1.7.

39、1使用同样方法对test用户赋权限,展开rsinfaconf-RepositoryService”,只勾选想赋给其的选项。5.1.8 备份资料库内容1、 选定资料库,执行Actions下Back Up Contents菜单命令。图 2、 配置相关选项,点击OK按钮即可。图 5.2 客户端配置客户端配置主要是配置连接信息,连接至服务器。5.2.1 添加主机串若客户端和服务器端在同一机器上则不添加也可。如不再同一机器上,用记事本打开操作系统上“C:WINDOWSsystem32driversetc”目录下的hosts文件。在末端添加IP 主机名映射字符串,如图5.2.1

40、.1。图 5.2.2 连接服务器1、 开始菜单启动“PowerCenter Repository Manager”或其他任意manager,点击菜单栏“Repository”,然后选择其子菜单“Add Repository”。图 2、 图中Repository填写服务器中创建的Repository“rsinfaconf”,点击OK按钮。主界面Repository Navigator中会多出rsinfaconf的图标。3、 右击该图标选择“Configuration Domain”,可能会弹出图界面,不用理会点击确定。图 4、

41、 在图中点击“Add a new domain”按钮。图 5、 其中Domain Name为安装时设置的域名称,点击OK按钮。图 6、 勾选上右侧的Integration复选框,点击OK按钮,结束配置。图 5.2.3 登陆服务器在“PowerCenter Repository Manager”主界面,双击左侧“rsinfaconf”绿色图标,出现图界面,填写用户名和密码,登入即可。图为登陆成功界面。图 图 至此,Informatica PowerCenter所有配置完毕!6 功能介绍

42、6.1 客户端的服务Informatica 提供基于对象的,无需编码的全图形化开发环境,最大地提高开发生产力,有 4 个客户端工具: nformatica PowerCenter Client工具介绍Power Certer Designer:定义源及目标数据结构设计转换规则,生成ETL映射Repository Manager:Workflow Manager:元数据资料库,依赖性分析,安全性管理等合理的实现复杂的ETL工作流,基于时间或事件的作业调度Workflow Monitor:监控workflow和session,生成工作日志及报告 图6.1.1 图6.1.2在整个设计流程中涉及的客户

43、端有: n Repository Manager n Power Center Designer n Workflow Manager n Workflow Monitor使用过程中涉及的概念:1. mapplet:源结构和转换组件的可复用逻辑。2. Mapping:源、目标、转换组件的逻辑组合。这里实现了数据转换的规则。6.2 在 Repository Manager 中创建 Folder在整个客户端操作中,创建Folder是最关键的一步,只有先 创建Folder才能继续操作以下的流程。创建 Folder 方法 如下: 单击菜单栏中的 Folder,选择 Create,如下图 所示: 图6.

44、2.1输入 Name 点击确定,系统提示成功创造文件 夹。6.3 引入数据源结构在 Repository Manager 的客户端系统中,点击工具栏上的绿色D按键,或者在菜单栏中点击 Tools 选择 Designer 就可以打开 PowerCenter Designer 客户端,如下图所示: 图6.3.1在上图中,Source Analyzer上方五个按钮分别是: Source Analyzer: 设 定 当 前 的 工 作 区 为Source Analyzer , 在 Source Analyzer 中引入和创建源表结构,如:平面文件, XML, COBOL, Application 以及

45、关系型数据源。 Warehouse Desinger: 设 定 当 前 的 工 作 区 为 Warehuse Designer , 使 用Warehouse Designer 定义 目标结构, 如:关系型表 , 平面文件 , XML 文件等。可以从关系型数据库、平面文件中引入结构,或者手工创建。 Transformation Developer: 设 定 当 前 的 工 作 区 为 Transformation Developer,使用 Transformation Developer 来创建可复用的组件 Mapplet Designer: 设定当前的工作区为 Mapplet Designer

46、,使用 Mapplet Designer 来创建 mapplet,Mapplet 就是一系列可包含源结构以及转换组件的可复用逻辑。 Mapping Designer: 设定当前的工作区为 Mapping Designer,使用 Mapping Designer 来创建 mapping,mapping 就是一系列包括源、目标以及转换组件的逻辑组合,在这里面实现了数据转换的规则。 引入数据源结构有两种方法: 6.3.11.点击 Source Analyzer,引入已经存在的数据源表结构。 数据源可以是 RDBMS、Flat file、Cobol file、XML file、ERP 等,对于 RDB

47、MS、Excel 等数据源需要定义 ODBC,通过 ODBC 连接。以 RDBMS 为例: 图6.3.2按照图中标注操作,数据源结构就显示在 Source Analyzer 工作区 2、手工创建表结构 在 Source Analyzer 状态下,从菜单 Sources>Create,弹出下面的界面:图6.3.3在上面的界面中选择 Database type,输入 Ta ble name,然后点击 Create>Done,这样就创建了一个空的结构。双击,进入 Column 定义界面 ,具体参见下图: 图6.3.4数据源表结构引入后,需要保存。6.4 引入目标结构接下来引

48、入目标结构。点击Warehouse Desinger,引入目标 结构的过程同“引入数据源结构”。主界面菜单栏的“Sources”变成了“Targets”。引入目标结构与引入数据源结构操作一致。如下图: 图 设计 Mapping到此,数据源结构和目标结构都已经引入,接下来就可以设计 Mapping 了。 Mapping 是 ETL 设计的开始,是具体的 ETL 规则设计,它包含三方面的信息:数据源信息、转换信息、目标信息。在 Mapping 中,主要工作就 是转换。Informatica PowerCenter 提供了 20 多种组件,100 多个转换函数,基本上能够满足正常的需

49、求;另外还可以调用外部的存储过程等。此处举一个简单的例子,用来说明 Mapping 设计流程。 需求描述:数据源是 GTZYBHTXT 库的 GT_HZXXB 表,字段有 ID、HZHM 等,目 标 是 Test 库 的 GT_HZXXB , 结 构 完 全 一 样 ; 转 换 的 规 则 是 将GTZYBHTXT.GT_HZXXB.ID 分别加一后缀“ _AA ” 后 赋给 Test.GT_HZXXB.ID,其它数据原样加载。 设计思路:从需求看,转换部分需要使用表达式组件,负责 ID 字符串处理。在表达式组件中增加一新的字段,用来作为存储转换后的表达式结果,新的字段是 ID_OUT,这个字

50、段作为输出字段,输入字段就是 ID(可以直接用鼠标从 Source Qualifier 将字段拖入表达式组件),转换的表达式即 ID|_AA。 1) 点击 Mapping Designer,将数据源和目标拖入工作区,如下图所示:图6.5.12) 将数据源和目标拖入工作区,如下图所示:图6.5.23) 点击工具栏上的f(x)图标,创建表达式组件,如下图所示:图6.5.34) 双击或编辑表达式组件,选择 Ports,见下图图6.5.4点击上图中红颜色标注 1 的按钮,新增一个 P ort, 命名 ID,修改 ID 为输入,ID_OUT 为输出。然后在图红颜色标注达式,见下图: 图6.5.55) 将

51、ID_OUT 传入目标表,见下图:图6.5.66)由于其它数据不做变化,直接加载,所以将 Source Qualifier 中的其它字段分别拖入目标Target Definition,也可以利用Informatica 自动匹配功能,具体见下: Mapping Designer 工作区,右键,弹出一个菜单,见下图 :图6.5.7选择Autolink,进入下图界面:图6.5.8From:表示连接的源头。To: 表示连接的目标。By: Name 是按照名称匹配;Position 是按照位置匹配。由于 此处的结构、名字完全一样,所以选择 Name 选项。最后选择“Apply Now”,字段关联完毕。7

52、) 到此 Mapping 设计完毕,保存。下一步就可以进入Step6:设计Work flow 。 【补充:根据需求情况,设计自己的 ETL 规则。整个过程是相 同的,不同的就是选择的组件不同,处理的具体规则不同而已】 。6.6 设计 Workflow。 这里全部引用 Sqlserver版的,与oracle版无区别。设计 Workflow 有三个主要环节: 1) 生成 Session(对应一个 Mapping) 2) 建立数据源和目标的连接 3) 修改 Session 对应 Mapping 首先介绍一下工作区,在 PowerCenter Designer 点击工具栏中的 橙色W 按钮打开 Wor

53、kflow Manager 见下图: 图6.6.1Task Developer: 设置当前工作区为 Task Developer Worklet Designer: 设置当前工作区为 Worklet Designer,Worklet 是一组任务的组合,它可以作为复用逻辑在多个 Workflow 中调用。 Workflow Designer: 设置当前工作区为 Workflow Designer,Workflow 是一组任务的指令,存储在知识库中,告诉 Informatica Server 如何执行抽取任务。 1) 点击 Workflow Designer,进入Wokflow 设计工作区 2) 利

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论