




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Informatica技术解决方案
彳申舛I数石马
DigitalChina
提交人:闫东
联系电话/p>
提交日期:2018-07-02
版本号:1.0
目录
序言1
1.1INFORMATICA公司介绍1
1.2INFORMATICA公司针对各行业的解决方案及特点3
2设计理念9
2.1设计理念的先进性9
2.2设计理念的符合性12
3基本功能14
3.1字段级的操作,主要包括:字段映射,映射的自动匹配,字段的拆分,多字段的混合运算,自动
完成时间类型的转换14
3.2记录级的操作,主要包括:去重复记录,记录间合并或计算,记录拆分等15
3.3表级的操作,主要包括:代理键的生成,行列变换,排序,统计,制造样品数据16
3.4数据库级的操作,主要包括:对各种码表的支持包括GBK(必需)、UNICODE(必需)、ASCII(必
需)17
4技术特点21
4.1跨异构数据库的关联、支持关联条件的复杂程度、自定义函数的实现、过滤条件的复杂程度21
4.2支持的数据类型,包括BINARAY、DATE/TIME、DECIMAL、DOUBLE.INTEGER,STRING>TEXT、
REAL、SMALLINTEGER等21
4.3抽取断点,支持参数抽取的灵活程度,如何抽取远程数据,抽取数据的事务处理支持,抽取的字段是
否可以动态修改,对抽取的环境变量配置情况,环境变量是否可以动态修改23
4.4是否支持脏读,数据的提交方式,支持各种数据库的批量装载功能包括ORACLE(必需)、
INFORMIX、DB2、SQLSERVER,针对不同数据库是否具有批量加载能力包括ORACLE(必需),INFORMIX,
DB2,SYBASE,TERADATA27
4.5在转换过程中是否支持数据比较的功能,在设计调试时能否对每个转换环节进行数据预览,在设
计调试时能否对每个转换环节进行性能监控,在转换过程中是否支持按行按列的分组聚合,能否提供直
观的视图、灵活的配置以及能否自定义功能,是否提供丰富的转换函数,是否支持诸如VALIDATE、
TRANSLATE,HIERARCHYFLATTERN,MAP,MERGE等转换功能,ETL过程中数据转换的可追溯能力29
4.6不同类型运算所耗的系统资源状况,包括常见的JOIN、LOOKUP、MAPPING>AGGREAGATION、
SORT、PIVOT、FILTER等40
4.7是否内置提供数据预览和数据质量评估的功能41
4.8是否内置提供具有强大的元数据管理功能45
4.9对于实时ETL及按需ETL的支持51
5整体架构53
5.1对平台的支持,支持主流的操作系统平台包括SUNSOLARIS,HP-UX(必需),IBMAIX(必需),
LINUX,WINDOWS(必需)等。53
5.2对数据源的支持,支持常见的数据源,包括ORACLE(必需),DB2(必需),INFORMIX(必需),
SYBASE,SQLSERVER,TERADATA,SAS,TEXT(必需),EXCEL,SAPR/3,PEOPLESPFT,SIEBLE,
IMS,VSAM,QSAMON390,用户自定义文件,FTP(必需),XML(必需),MESSAGEQUEUE,EMAIL,
WEBLOG,OLEDB,其它54
5.3支持数据库的种类、连接方式、配置方式及是否随产品打包,包括ORACLE(必需),DB2(必
需),INFORMIX(必需),SYBASE,SQLSERVER56
5.4产品自身并行处理能力,对并行数据库的支持情况如ORACLERAC/OPS,系统的线性可扩展性...56
5.5是否支持远端的数据抽取和加载功能59
5.6对错误恢复逻辑的支持,对异常情况的处理是否得当,对于出现差错的流程是否支持异常控制、
错误告警以及错误流程恢复的加载60
5.7对中间存储的支持65
5.8产品可编程的灵活性如何,模块化的设计能力65
5.9能否根据日志监测源数据的变化,是否支持增量抽取,增量抽取的处理方式,增量加载的处理方
式,是否提供数据更新的时间点或周期,以便可以灵活处理67
5.10对元数据的管理,主要包括:元数据存储的提取方式、元数据存储的开放性、元数据存储的可
移植性、是否提供多种方式访问元数据、元数据的版本控制程度、是否支持开放的元数据标准如
CWM、是否支持XML进行元数据交换、是否支持分布式的元数据访问和管理、是否生成元数据报表、
是否支持ETL过程的冲突分析、是否支持基于元数据的查询功能、是否支持ETL过程的流程分析等。68
5.11可以实现对所有主流关系型数据库的快速访问和,对本地数据访问模式的支持(这里本地指
NATIVE,如OCI等);通过利用本地数据库API高效实现ETL功能75
5.12对基本处理(如SQL)的支持76
5.13提供友好界面76
5.14具有使用内部函数或者用户定义函数的强大转换功能80
5.15是否提供强大的脚本和用户自定义函数开发和转化的功能84
5.16是否提供数据校验的功能,如空值处理、流程异常处理、异常值的处理等手段89
6接口与交换90
6.1支持通用接口,如ODBC、数据库本地接口等90
6.2是否支持各种主流的消息中间件,可以通过消息中间件进行数据抽取和加载,例如MQ
SERIES,JMS等92
6.3是否支持WEBSERVICES接口92
6.4在调度时除了执行ETL规则是否可以执行其它任务如系统的可执行程序、数据库的存储过程、动
态链接库中的程序、FTP命令、EMAIL任务93
6.5是否调用各种外部应用,包括存储过程、各种流行语言开发的应用程序等93
6.6是否支持客户化定制的转换过程,支持的编程语言种类例如C、C++、VC++、JAVA、PERL等……94
6.7与OLAP数据库,如HYPERIONESSBASE、ORACLEEXPRESSOLAP等的集成、与前端工具集如
COGNOS、BUSINESSOBJECT、BRIO的集成99
6.8是否有开放的API可将产品集成到统一界面99
6.9是否支持与统计分析工具如BUSINESSOBJECTS,SAS的集成等99
6.10原厂商专用接口对不同数据源的支持100
7项目重点问答101
7.1工具是否满足无编码开发101
7.2安装调试时,对系统环境是否有额外安装要求102
7.3在不改变系统内核参数据前提下,能否顺利完成产品的安装及调试?如需改变系统内核参数,请
说明。102
7.4REPOSITORY的移植性:在不改变原设计和应用的前提下,能否顺利完成跨平台、跨异构数据库和
跨产品版本的移植。如需更改设计等工作,请加以说明。102
7.5REPOSITORY的开放性?是否可建立在主流RDBMS基础上,例如:ORACLE、DB2等?如果不支
持,请加以说明。103
7.6详细论述性能调优及步骤104
7.7ETL部分产品,厂家的发展策略和趋势,产品延续性如何?113
8元数据管理分析114
8.1元数据管理工具的架构及工作原理114
8.2元数据管理工具的功能模块描述及工作流程118
8.3元数据管理工具界面友好性如何122
8.4元数据管理工具的平台性124
8.5元数据管理工具采集接口124
8.6是否具有元数据脱机分析功能126
8.7是否具有表级和字段级的血缘分析功能126
8.8是否可在一个分析视图上,表现出跨不同工具的元数据血缘分析功能128
8.9是否有影响分析功能129
8.10是否具有WEB展现功能129
8.11元数据管理工具的REPOSITORY的开放性?是否支持主流的RDBMS?如不支持,请加以说明。
131
8.12元数据分析报表,可导出为哪些种类的文件类型?131
8.13元数据检索功能132
8.14元数据同步及调度功能132
8.15能否方便看到计算字段的元数据及计算公式134
8.16是否支持自定义元模型?是否支持CWM元数据标准?135
9产品供应商资质138
9.1财务状况和公司规模138
9.2业界影响138
9.3成功案例140
10产品供应商市场情况146
10.1国内客户数量及全球客户数量146
10.2市场准入147
10.3市场份额148
11实施供应商资质和实施供应商市场情况150
12可实施能力151
12.1软件安装、配置的简单性和灵活性151
12.2ETL性能监控与调优的能力151
12.3如何从开发环境迁移到生产环境160
12.4是否支持网格计算和负载均衡161
12.5是否支持ETL过程中的冲突分析163
12.6是否支持流程分析164
12.7是否有简体中文版本的软件164
12.8开放文档的自动生成165
13实施方法论论及咨询团队167
13.1实施方法论167
13.2咨询团队174
14售后维护175
14.1是否有本地支持,支持工程师是否充足175
14.2本地支持方式如是分公司还是代理(总代理或是什么级别的代理)175
14.3产品升级176
15运营维护177
15.1资料库的备份、恢复177
15.2是否支持SNMP管理,可与网管软件集成179
15.3是否支持基于WEB的运行管理和监控,以及元数据报告180
15.4方便的系统部署功能和良好的系统监控功能,是否支持未完成任务的监控、报告和恢复功能
183
15.5是否提供版本控制和管理的功能191
15.6是否支持统一以及自定义的管理平台191
15.7在调度时是否支持时间触发方式,在调度时是否支持事件触发方式196
15.8是否支持命令行执行方式197
附件、INFORMATICA公司售后服务内容介绍201
序言
1.1Informatica公司介绍
InformaticaCo.Ltd1993年创立于美国并于1999年登陆纳斯达
克。Informatica一直致力于为客户提供具有强大的元数据管
理、数据集成和个性化分析递送功能的世界通行标准的统一数
据服务平台。Informatica的基础设施产品以可伸缩的、可扩展
的企业级数据集成平台为特点,并广泛支持来自Informatica和
其他的领先商务智能提供商的数据仓库基础设施和分析型应
用软件的开发和管理,提供元数据管理解决方案,帮助企业集
成、优化、审核信息资产以提高运营效率,增加客户收益,取
得竞争优势。
作为数据整合软件产业的领导者,Informatica拥有遍布全球的
客户,客户范围涵盖金融、电信、制造、政府、能源、保险、
公众服务等多种行业。Informatica的客户:
>超过82%的Fortune100客户
>80%的道・琼斯工业指数客户
>全球500强企业中
令5个最大的的娱乐和媒体机构
令15个最大的电信公司中的13个
令31个最大的金融服务/银行机构中的24个
令13个最大的制药公司中的12个
令18个最大的能源公司中的12个
令20个最大的制造企业中的16个
令20个最大的保险公司中的15个
A所有四兵种的美国军队(陆军、海军、海军陆战队和空军)
全球众多行业客户的选择
DeutscheBankIZ1'GR0UPMerrillLynch蠡UBS
FinancialSCHWAB园
ServicesMorganStanleyAllianz®
andInsuranceMetLifePrudentialAIG
言AhJBT1^义CingularSprint匕短
Telecommunications
HighTechand
Manufacturing
号
Pharmaceutical4Aventis©MERCKW^eth
Transportation,E^onMobi!efcY®W/M即会魏初,
Services,
andRetail
PublicSector
andFederal
Government
INFORMATICA
作为数据整合方面的专家,更先进的技术和更完善的服务一直
是我们追究的目标。为了给客户提供系统是全方位服务,我们
拥有大量专业级的资源,来满足客户各个方面的需求。从自身
来说,我们有高品质专家提供丰富的资源为客户服务;从合作
伙伴来说,我们有最好的战略合作伙伴,企业的硬件提供商,
第三方发展公司以及全球150多家系统整合商来帮助解决客户
复杂的数据整合难题。通过这些系统服务,我们确保将客户IT
投资回报率最大化,为协助客户成功做出不懈的努力。
正是在这种精益求精的企业精神之下,Infbrmatica公司作为世
界一级的专业生产商在数据集成领域中做出了突出的贡献,并
且为此获得业界和客户等多方面的肯定和嘉奖。
A2005年5月11日,Gartner,"MagicQuadrantforETL,1H05",
Informatica公司是ETL领域的技术领导者。
>2005年,Informatica的主打产品之一PowerExchange521
获得《每周电脑报》的最佳选手奖。
>20()4年12月,在Forrester资讯公司的关于“如何评估企业
ETL”的调查中,名列整合解决方案提供商的前列。
>2004年,《设计手册回顾》(DMReview)根据其读者的
调查反馈,将Informatica列为数据整合方面的最好供应商。
同时,Informatica作为商业智能和数据整合的解决方案提
供商名列前12名。
>2004年,《聪明企业》的读者评选中,获得最好数据整合
供应商的称号,同时公司的PowerCenter数据整合平台在杂
志的80,()()()个读者的评选中成为最好的ETL工具。
>2004年,《计算机商业评论》杂志将Informatica公司评为
在数据整合及数据应用软件领域的最有影响力的10家厂
家之一,名列第五。
>2004年,加拿大核协会和英国的普天寿公司由于使用了
Informatica公司的PowerCenter和PowerExchange产品,夺
得《设计手册回顾》评选的一世界级解决方案奖。
>2004年,DeutscheBbrseGroup由于使用了Informatica公司
的PowerCenter数据集成平台而获得了由TDMI颁发的最佳
实时数据仓库应用奖。
>2004年,Informatica公司被CMP传媒评为最有影响力仃解
决方案提供商之一。
1.2Informatica公司针对行业的解决方案及特点
在20世纪90年代,随着企业对业务过程处理的卓越追求和对市
场需要的及时响应,出现了一系列的以“产品”为中心的业务
系统。这些业务系统在一定程度上满足了当时企业发展的需
要,但同时也对企业未来的发展埋下了一定的隐患。这些以“产
品”为中心的业务系统,由于其业务特点的各异性,往往采用
了不同的技术实现、系统和数据规范,这不仅增加了企业信息
化环境的复杂性、业务信息的不对称和不一致性、业务信息的
分散性和无全局性,还增加了运行和维护部门的负担,最终还
分散了企业关注支持新业务需求的精力。尤其是当企业面临从
“以产品为中心"到''以客户为中心”的经营模式转变时,这
些隐患变更发的显现出来。
无论是政府还是各个行业的企业,都已经深深的意识到了以上
隐患,从全局规划角度出发的各种类型的标准化和流程化工作
应运而生,并且被提到了企业发展的战略高度。在具体实现方
式上,“一个平台,多个子系统”的概念逐渐深入政府、电信、
金融服务和制造等各个行业,统一数据服务平台和与之相关联
的资源和服务目录便是其中之一。
UDS(UniversalDataServices)架构是Informatica在新的形势
下提出的统一数据服务平台。它支持企业各种类型的业务系统
数据的整合、交换和共享,从而形成一套准确、干净、完整的
数据集合,增强对企业决策者对商业活动的敏感度,从而提升
自身的竞争力。
在UDS服务体系中,提供了访问、整合、质量控制、审核和监
控等数据服务,具体架构如下:
SHAREDSERVICES
PowerExchange:按照需求,可以很容易地访问分离、复杂的
系统,并从中得到数据
PowerCenter:目前业界最佳的集成元数据管理的数据整合、
交换和共享平台InformaticaPowerCenter,可以从任何数据源
获取数据,包括各种关系数据库,ERP应用、以及各种文件
系统;同时,利用它的图形界面控制台可以容易定义任何数据
的抽取、汇总和计算,整个数据集成的过程不需要进行脚本
的编写;利用它的计划执行能力,可以在正确的时间调度正
确的作业,来完成数据的转换;利用数据库的触发机制,可
以完成实时的数据复制和增量备份等工作;实现加载流程合理
化(Workflow);高性能的加载(LoadPartition);极大的减轻了日
后系统的维护量。
SuperGlue:审核数据血统、文档过程、冲突分析,管理数据
0变化
PowerAnalyzer:监控:验证数据、过程报告、积极的传递洞
察力
借助Informatica公司产品和解决方案,通过建立统一数据交换
和共享平台,行业可以获得以下收益:
令实现对以业务系统为数据采集点的数据整合、交换和共
享;
令提供对历史系统数据、私有系统数据的访问,充分利用企
业信息化进程积累的历史数据;
令降低数据冗余度、降低数据不一致性和提高数据准确性,
提高作为企业战略资源的各种信息和历史数据的使用率
和使用准确率;
令建立统一数据服务平台,支持现有和未来业务系统的数据
服务;
令助力企业数据标准化和企业统一客户视图的建设工作,为
建立以客户为中心,以服务为导向的新型服务企业提供底
层信息流动支撑;
令助力企业实现跨地域的、跨业务系统的客户一致化服务水
平,提高企业客户满意度和企业竞争能力;
令助力企业全局数据仓库和特定主题数据集市的建立;
令图形化的部署、控制和管理统一数据服务平台,简化系统
变化、升级和部署的复杂度,从而更加快速的应对整合和
市场变化;随着企业的发展,支持新业务系统的平滑、快
速接入。
1.2.1解决方案特点
灵活开发和部署
现今许多集成项目常常跨越时间和地理分区,为了有效管理本
地和全球开发队伍,企业需要集成支持协作开发和部署的软
件。
PowerCenter提供一整套高度复用性的产品工具,用于加速开
发、简化管理、降低当前的维护成本。使用PowerCenter,不
同区域的开发者能够基于小组开发和调试工具,迅速并容易地
响应集成需求。通过PowerCenter的Check-in和Check-out对象
管理和版本控制,开发者的小组们能够同时工作在相同的项目
上,提供与时间无关的部署。
安全可靠的企业数据
安全对于IT组织机构来说,已经成为一个最主要的关心点。通
过LADP和其他目录服务器验证支持,对于安全访问、加密数
据传输,详细的审计记录的角色的许可,PowerCenter提供一
个安全的环境贯穿集成的全过程。PowerCenter提供最大范围
的安全能力,为企业数据集成提供安全保障。
无可比拟的性能和可扩展性
提供无限制的可扩展性、可测量性和吞吐量,适应企业目前数
据交换和共享的需要,并支持未来业务系统的平滑接入和扩
展。PowerCenter提供无可比拟的性能,不管环境如何,都能
应对当前和未来数据主动集成。PowerCenter的性能引擎提供:
>管道,分区,数据灵活的并行,有效地打破分离的集成
A通过异种环境进行网格计算,最大化使用现存的基础架构
>批处理、变化、实时数据移动有最好的适应性
2设计理念
2.1设计理念的先进性
回答:满足。
2.1.1产品体系结构和工作原理
Server
SourcesTargets
TCP/IP
Repository
HeterogeneousServerHeterogeneous
SourcesTargets
.TCP/IPRepository
口的El卜曾回Agent
RepositoryDesignerWorkflowWorkflowRepServerReposi
ManagerManagerMonitorAdministrative
Console
2.1.2产品功能模块描述
令1个(或多个)Repository
PowerCenter数据整合引擎是基于元数据驱动的,提供了基于
元数据驱动的元数据知识库(Repository),该元数据知识库
可以在主流的关系型数据库中部署。该元数据库中存储所有的
ETL元数据,包括:源、目标表的物理和逻辑元数据,ETL
转换规则,知识库用户权限,ETL任务运行历史信息等元数据。
令2个Server
■InformaticaRepositoryServer:资料库Server,用来管
理所有对资料库中元数据的请求和操作。
■InformaticaServer:实际的ETL引擎
令5个Client:
■PowerCenterDesigner:设计开发环境,定义源及目标
数据结构;设计转换规则,生成ETL映射。
■WorkflowManager:对Workflow,Session等ETL任务
作设计,同时提供了对任务执行的调度和管理功能。
■WorkflowMonitor:监控Workflow和Session运行情况,
生成日志和报告。
■RepositoryManager:元数据维护和安全操作,如:元
数据查找,用户、组、权限管理等。下图是Repository
Manager的操作界面。
■RepositoryServerAdministratorConsole:对知识库的
操作,如:知识库的创建、备份、恢复等。
2.1.3PowerCenter基本工作原理
Informatica是基于元数据驱动的,所有的元数据都保存在Repository(知识库)
中,该知识库可以创建在所有主流数据库当中,充分体现了它元数据的开
放性。
RepositoryServer用来管理所有客户端以及InformaticaServer跟Repository的
交互,并且一个RepositoryServer可以管理多个Repository,而Repository
Server可为每个Repository分配一个RepositoryAgent来处理所对有元数据操
作的响应。
InformaticaServer是实际处理ETL任务的后台服务,它是基于内存运行、高
效的ETL服务,不需要产生任何的代码,每次执行任务之前都会从Repository
中读取最新的ETL规则。
Informatica的客户端提供了无编码、完全图形化的设计和管理调度界面,可
实现快速开发和部署。
一个基本的ETL任务设计和部署的大致步骤如下:
A)使用Designer客户端,获取源数据表的元数据。
B)使用Designer客户端,获取目标数据表的元数据。
C)使用Designer客户端,设■一个Mapping,其中就是源-〉
目标的ETL规则。
D)使用WorkflowManager客户端,针对上面实现的Mapping,
实例化为一个Session,为其指定实际的数据源、目标连接,
以及其他属性。
E)使用WorkflowManager客户端,创建一个Workflow,其中
包含上述的Session以及其他的Task,在Workflow中可实现
复杂的流程控制。
F)运行上述Workflow,使用WorkflowMonitor客户端,监测
最终的任务运行结果。
2.1.4InformaticaPowerCenter核心技术
Informatica是数据集成领域的领先者,无论在客户群及市场占
有率上,一直名列前茅。就其核心技术来说,可分为以下几点:
令可扩展和分布式的产品体系,以元数据为核心驱动
(MetadataDriven)o
令开放性,PowerCenter元数据可构建在DB2、Oracle>
Informix>Sybase>MSSQLSERVERxTeradata主流关系
型数据库上,并提供PowerCenter元数据描述,真正的作到
高开放性。
令国际化支持,可处理任何字符集
令遵守CWM的元数据标准,可完全真正开放的作到元数据
交换。
令合理的体系结构划分,可适应分步式的部署。
令高性能的管道技术,使数据在转换过程,达到完全内存操
作。
令并行作业控制,可最大化的利用系统资源,达到高并行性
的效果。
令服务器集群,真正的Server级并行、负载均衡。
令对实时数据源的支持,例如IBMMQ、Tibco、WebMethod、
JMS、WebService.SAPR/3(IDOC)o
令先进的会话管理,工作流机制。支持Workflow机制,通过
多种工作流调度方法,可以将ETLSession,外部命令,
Email,以及数据库脚本等任务有机的结合在一起,从而
定制复杂的工作流。
2.2设计理念的符合性
回答:满足。
令InformaticaPowerCenter分布式的体系结构,可适合企业
快速部署生产环境。
令作业设计分为逻辑设计、知识库管理、物理作业的执行。
从设计的角度,将开发分成三层结构,符合现代主流的技
术特性。
令开放的元数据知识库,存在主流的关系型数据库中,且元
数据遵守CWM元数据标准,可为企业元数据交换,提供
国际先进的标准。
令因元数据是单独由知识库进行管理,且作业可跨平台。在
作系统移植时,可不分存储的数据库,其科学的可移植性
极大方便了企业的部署要求。
令强大的工作流调度,可按时间、事件、参数、指示文件等
进行触发,从逻辑设计上,满足企业多任务流程设计。
令高性能的ETL服务引擎,完全的内存线程,并集成了数据
库的性能特点,是企业ETL高性能的保障
令图形化的开发,极大提高了开发效率,缩短项目周期。
令等等。OO
3基本功能
3.1字段级的操作,主要包括:字段映射,映射的自动匹配,字段
的拆分,多字段的混合运算,自动完成时间类型的转换
回答:满足。
InfoirnaticaPowerCenter是完全图形化的开发,可通过简单的
操作,完成此需求:
1)通过简单的拖拽操作实现
2)映射的自动匹配:在Designer的设计中,有“AutoTink”
的自动匹配功能,具有高级匹配功能,可进行前缀、后缀
和位置的自动匹配。
3)字段的拆分,内置众多的字符串函数,例如SUBSTR,Instr
等,可完成字段的拆分、合并等操作。
4)多字段的混合运算,内部具有Expression组件,可增加复
杂的多字段混合计算,同时可嵌入100多种函数和参数,
极大的提高了计算表达式的灵活性。
5)自动完成时间类型的转换,如在记录中,符合时间格式,
可自动进行字符型和时间类型的转换,并且提供
to_char,to_date等强制转换函数。
3.2记录级的操作,主要包括:去重复记录,记录间合并或计算,
记录拆分等
回答:满足。
1)去重记录
A)组件内部设有变量,可模拟数据库游标操作,进行数
据记录的前后比对,即可识别重复记录。
B)动态Lookup组件,此组件可理解为子查询,针对目标
库或文件进行所需字段的查询,将查询结果放入内存
中。这样从数据源中读取的数据,在此内存中与历史
记录的主键进行比对,可发现此记录是否重复,并可
将重复数据单独输出到另外的文件或数据库表中。此
组件,还有一特点,就是将数据源流入的主键在读入
的过程中,将新主键,也保留在Lookup内存中,实现
所有数据记录主键的内存存储,方便数据的比对操作0
C)InformaticaPowerCenter内置缓慢变化维向导,在此将
详细描述其过程。
缓慢变化维原理论述
对于导入的数据源,针对主键和验证字段,同目标进行比对:
a)主键不存在,为新增数据;
b)主键存在,验证字段相同无变化,为重复数据;
c)主键存在,验证字段发生变化,为变化数据。
以上三类文件,可将数据情况划为三类,再分别作相应类SQL
操作:Insert,Update,reject,deleteo
2)记录合并和计算
A)InformaticaPowerCenter提供Joiner和Union等组件可实
现多个流入源的记录join和union的操作。实现记录的
合并
B)InformaticaPowerCenter提供Expression和汇总组件,
实现记录内的计算表达式和记录集的汇总计算等操
作。
3)记录拆分
A)InformaticaPowerCenter提供Filter和Router等组件可实
现流入源的记录过滤和分组等的操作。实现记录的拆
分和流向控制。
B)InformaticaPowerCenter内部设计,很容易进行数据的
分支设计,方便的实现记录按条件和需求的拆分。
3.3表级的操作,主要包括:代理键的生成,行列变换,排序,统计,
制造样品数据
回答:满足。
令代理键的生成:PowerCenter提供SequenceGenerator组件,
可生成唯一序列号,作为代理键。
令行列变换:PowerCenter提供Normalizer组件,专门用来作
行列转换这类操作。
令排序:PowerCenter提供Sorter组件,可图形化的选取字段,
进行升序或降序的操作。
令统计:PowerCenter提供统计学的Rank组件,可快速得到前
几名和后几名的统计操作。
令制造样品数据:PowerCenter提供存储过程和外部程序包组
件,可将一定规则的设计,生成程序包,在PowerCenter
设计中加以调用。
3.4数据库级的操作,主要包括:对各种码表的支持包括GBK(必
需)、Unicode(必需)、ASCII(必需)
回答:满足。
PowerCenter产品作为业界领先的提供商,支持国际化码制。
令支持简体中文MS936MSWindowsSimplifiedChinese,
supersetofGB2312-80,EUCencoding
令支持Unicode和ASCII模式的数据移动。
令以下是支持的码表:
CodePageDescriptions
NameDescriptionID
EuroShift-JISTestcodepage,Shift-JISwithEuropeancharacters9999
IBM037IBMEBCDICUSEnglish2028
IBM273IBMEBCDICGerman2030
IBM280IBMEBCDICItalian2035
IBM285IBMEBCDICUKEnglish2038
IBM297IBMEBCDICFrench2040
IBM500IBMEBCDICInternationalLatin-12044
IBM930IBMEBCDICJapanese930
IBM935IBMEBCDICSimplifiedChinese935
IBM937IBMEBCDICTraditionalChinese937
IBM939IBMEBCDICJapaneseCP939939
ISO-8859-1()ISO8859-10Latin6(Nordic)13
ISO-8859-15ISO8859-15Latin9(WesternEuropean)201
ISO-8859-2ISO8859-2EasternEuropean5
ISO-8859-3ISO8859-3SoutheastEuropean6
ISO-8859-4ISO8859-4Baltic7
ISO-8859-5ISO8859-5Cyrillic8
ISO-8859-6ISO8859-6Arabic9
ISO-8859-7ISO8859-7Greek10
ISO-8859-8ISO8859-8Hebrew11
ISO-8859-9ISO8859-9Latin5(Turkish)12
JapanEUC*JapaneseExtendedUNIXCode(includingJISX0212)18
JEFJapaneseEBCDICFujitsu9000
JEF-kanaJapaneseEBCDIC-KanaFujitsu9005
JIPSENECACOSJIPSEJapanese9002
JIPSE-kanaNECACOSJIPSE-KanaJapanese9007
KEISHITACHIKEISJapanese9001
KEIS-kanaHITACHIKEIS-KanaJapanese9006
Latin1*ISO8859-1WesternEuropean4
MELCOMMITSUBISHIMELCOMJapanese9004
MELCOM-kanaMITSUBISHIMELCOM-KanaJapanese9009
MS1250MSWindowsLatin2(CentralEurope)2250
MS1251MSWindowsCyrillic(Slavic)2251
MS1252*MSWindowsLatin1(ANSI),supersetofLatin12252
MS1253MSWindowsGreek2253
MSWindowsLatin5(Turkish),supersetofISO
MS12542254
8859-9
MS1255MSWindowsHebrew2255
MS1256MSWindowsArabic2256
MS1257MSWindowsBalticRim2257
MS1258MSWindowsVietnamese2258
MS1361MSWindowsKorean(Johab)1361
MS874MS-DOSThai,supersetofTIS620874
MS932*MSWindowsJapanese,Shift-JIS2024
MSWindowsSimplifiedChinese,supersetofGB
MS936936
2312-80,EUCencoding
MS949MSWindowsKorean,supersetofKSC5601-1992949
MS950MSWindowsTraditionalChinese,supersetofBig5950
UNISYSUNISYSJapanese9003
UNISYS-kanaUNISYS-KanaJapanese9008
US-ASCII*7-bitASCII1
UTF-8UTF-8encodingofUnicode106
*PowerCenterusesthesecodepages.
4技术特点
4.1跨异构数据库的关联、支持关联条件的复杂程度、自定义函数
的实现、过滤条件的复杂程度
回答:满足。
令跨异构数据库的关联:PowerCenter有joiner组件,可实现
异构数据源的关联操作。
令支持关联条件的复杂程度:可支持左关联、右关联、直等
关联、全关联。
令自定义函数的实现:PowerCener有StoredProcedure和
ExternalProcedure组件,可调用数据库存储过程和调用外
部程序包,例如VB、VC、C、C++、Perl等等
令过滤条件的复杂程度:在PowerCenter中有Filter组件,可
完成类SQL中的wh
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农家乐施工项目合同范本
- 矿泉水厂项目可行性研究报告
- 2025年梨脯行业深度研究分析报告
- 2025-2030年中国医用线针手术刀片项目投资可行性研究分析报告
- 道路竣工测量报告模板
- 2025年有色地砖项目可行性研究报告
- 报纸的区域旅游推广考核试卷
- 贵州重点项目-碧江年产10万吨牧草产品加工项目可行性研究报告
- 各类亚光清漆行业深度研究报告
- 2025年中国灌装机行业市场调查研究及投资战略研究报告
- 博鳌亚洲论坛:创新报告2024
- 2025年全国青少年禁毒知识竞赛题库及答案(401一516) - 副本
- 2025年高三历史高考第二轮复习知识梳理中国史部分复习提纲
- 2025年蒙盐集团招聘笔试参考题库含答案解析
- 精神科医疗质控课件
- 护理三基三严习题+参考答案
- 椎间孔镜的手术配合
- 员工互评表(含指标)
- 美国电话区号一览表
- 【MOOC】英语口语进阶-南京大学 中国大学慕课MOOC答案
- 2024-2030年中国干细胞美容产业竞争格局及投资战略研究报告
评论
0/150
提交评论