




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
''Kettle使用方法介绍1、Kettle概念Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。谢谢阅读Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出。精品文档放心下载Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。感谢阅读Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。谢谢阅读2、下载和部署下载kettle压缩包,因kettle为绿色软件,解压缩到任意本地路径即可感谢阅读3、Kettle环境配置1.安装JDK(略)2.测试JDK安装成功(略)3.运行KettleWindows下找到$KETTLE_HOME/spoon.dat,双击运行精品文档放心下载欢迎界面如下图所示:''4、KETTLE组件介绍与使用4.1Kettle使用Kettle提供了资源库的方式来整合所有的工作,;精品文档放心下载1)创建一个新的transformation,点击保存到本地路径,例如保存到D:/etltest下,保存文件名为Trans,kettle默认transformation文件保存后后缀名为ktr;感谢阅读2)创建一个新的job,点击保存到本地路径,例如保存到D:/etltest下,保存文件名为Job,kettle默认job文件保存后后缀名为kjb;精品文档放心下载4.2组件树介绍4.2.1Transformation的主对象树和核心对象分别如下图:谢谢阅读''Transformation中的节点介绍如下:MainTree:菜单列出的是一个transformation中基本的属性,可以通过各个节点来查看。DB连接:显示当前transformation中的数据库连接,每一个transformation的数据库连接都需要单独配置。精品文档放心下载Steps:一个transformation中应用到的环节列表精品文档放心下载Hops:一个transformation中应用到的节点连接列表感谢阅读核心对象菜单列出的是transformation中可以调用的环节列表,可以通过鼠标拖动的方式对环节进行添加:精品文档放心下载Input:输入环节Output:输出环节Lookup:查询环节Transform:转化环节Joins:连接环节Scripting:脚本环节4.2.2Job的主对象树和核心对象分别如下图:感谢阅读MainTree菜单列出的是一个Job中基本的属性,可以通过各个节点来查看。谢谢阅读DB连接:显示当前Job中的数据库连接,每一个Job的数据库连接都需要单独配置。谢谢阅读Jobentries/作业项目:一个Job中引用的环节列表感谢阅读核心对象菜单列出的是Job中可以调用的环节列表,可以通过鼠标拖动的方式对环节进行添加。感谢阅读每一个环节可以通过鼠标拖动来将环节添加到主窗口中。并可通过shift+鼠标拖动,实现环节之间的连接。谢谢阅读''4.3使用举例14.3.1建立转换选中列表中的的“表输入”、“表输出”、“插入/更新”,拖拽到右侧工作区。鼠标选中节点键盘按shift键,拖拽即可连线。下图是一个转换,有两个动作,一是直接从数据源表同步数据到目标表,一是检查源表的插入和更新,同步到目标表。精品文档放心下载黑色线为生效,灰色线为失效,节点和连接可双击进行编辑。感谢阅读可预览数据是否正确。''双击编辑表输出动作。''操作的数据库名要获取的字段设置如下所示:''点击“Enterfieldmapping/输入字段映射”进行字段选择。精品文档放心下载选择要用的字段后点确定,注意字段的约束条件。''编辑好后点击上面的执行即可。左侧参数暂不说明,执行完成后可以观看下方的日志。''双击编辑“插入/更新”动作。''然后点击运行。''执行前,在源库里加条新纪录。确定作业执行正常后可以保存作业,如保存路径到本地磁盘地址C:\etl2.ktr。感谢阅读4.3.2建立执行的JOB/作业建立JOB的前提是有可以完整执行的作业,上面步骤定制的作业进行保存。精品文档放心下载''从左侧列表拖拽“START”,“Success”,“转换”,“发送邮件”到工作区并连接,如下图。感谢阅读然后双击“START”动作进行编辑。''然后双击编辑“Transformation”活动。转换文件名选择上一步编辑好的.ktr文件''双击发送邮件,参数设置如下:''编辑完成后直接点击运行即可。''运行后查看日志。''当任务执行以后可以查看相对应的日志,也可自行配置日志。感谢阅读4.4使用举例2本例是完成读取目录下的.log文件,找出其中包含错误代码的行,并统计个数谢谢阅读4.4.1新建Transformation本例所用到的步骤和组件如下图所示:''连接图如下所示:''a)获取文件名设置如下:其中已选择的文件名称的变量都需要手写输入,可以点击显示文件名和预览记录检查是否配置正确。感谢阅读''b)文本文件输入设置如下:文本文件输入选项中选择从上一步骤获取文件名,其中在输入里的字段被当做文件名一栏输入uri,步骤读取的文件名来自填写获取文件名2谢谢阅读内容选项卡的设置如下:文件类型选择CSV,分隔符自己定义,格式为mixed,编码方式选择UTF-8精品文档放心下载''字段选项可设置如下:需要手写输入str名称,设置类型为String谢谢阅读c)获取字符串设置如下:d)测试脚本设置如下其中可以点击获取变量和测试脚本来测试脚本的正确性''点击测试脚本界面如下:脚本代码由JavaScript编写e)聚合记录聚合记录就是将上一步的结果进行聚合,这里的名称字段是点击获取字段获取的,而不是自己输入的,newname一列是制定新名字,可以自己输入填写,精品文档放心下载''f)文本文件输出文本文件的输出设置如下,其中字段属性的设置名称字段是点
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2019-2025年环境影响评价工程师之环评技术导则与标准能力提升试卷A卷附答案
- 2025国际设备租赁合同(4)
- 中消防设计合同标准文本
- 2025煤矿劳动合同
- 2025小麦采购合同范本
- 供暖公司供暖合同样本
- ktvv承包合同样本
- 冷库青椒采购合同样本
- 个人合伙工作合同标准文本
- 冷链配送合同样本
- 检验科2025年度临床指导计划
- 口腔科设备器具项目深度研究分析报告
- 2025四川泸天化弘旭工程建设有限公司社会招聘3人笔试参考题库附带答案详解
- 电网工程设备材料信息参考价(2024年第四季度)
- 走进创业学习通超星期末考试答案章节答案2024年
- 2023年(第九届)全国大学生统计建模大赛 论文模板及说明
- GB/T 37864-2019生物样本库质量和能力通用要求
- 2021北京四中新初一分班英语试题(1)
- 毕业论文板式输送机的设计
- 三相异步电动机软启动器的研究
- 代建管理月报
评论
0/150
提交评论