《ETL数据整合与处理(Kettle)》教学教案_第1页
《ETL数据整合与处理(Kettle)》教学教案_第2页
《ETL数据整合与处理(Kettle)》教学教案_第3页
《ETL数据整合与处理(Kettle)》教学教案_第4页
《ETL数据整合与处理(Kettle)》教学教案_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章开启ETL之旅

教案

课程名称:ETL数据整合和处理

课程类别:必修

适用专业:大数据技术类相关专业

总学时:64学时(其中理论30学时,实验34学时)

总学分:4.0学分

本章学时:6学时

一、材料清单

(1)《ETL数据整合和处理(Kettle)》教材。

(2)引导性提问。

(3)探究性问题。

(4)拓展性问题。

二、教学目标与基本要求

1.教学目标

讲授ETL的基本概念和相关技术,选择流行的Kettle软件为教学的ETL工具,讲授

Kettle及支撑其运行的JavaJDK工具包、MySQL数据库等软件的安装,以及Kettle运行环

境的配置,并详细讲授Kettle的界面、运行和结果查看等基础操作。让学生达到以下教学目

标:

(1)了解ETL的基本概念和典型的ETL工具。

(2)掌握Kettle运行环境的安装和配置。

(3)熟悉Kettle的界面。

(4)掌握Kettle的基础操作

(5)掌握创建第一个Kettle的转换工程及其组件,以及查看结果。

2.基本要求

(6)了解ETL的概念。

(7)了解ETL的技术。

(8)了解ETL的流程。

(9)了解Kettle的优点。

(10)了解Kettle的应用场景。

(11)掌握JDK、MySQL和Kettle的安装和配置。

(12)掌握Kettle常用菜单功能的使用。

(13)掌握创建转换工程及其组件,查看结果。

三、问题

1.引导性提问

引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导

学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。

(1)ETL是什么?

(2)生活中哪些数据需要进行清洗?

(3)数据抽取的方式有哪些?

(4)数据装载是指什么?

(5)Kettle工具需要花钱购买吗?

(6)Kettle有哪些优点?

(7)Kettle最基础的操作是什么?

2.探究性问题

探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚

未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。

(1)ETL的处理过程是怎么样的?

(2)ETL能够应用在那些场景?

(3)选择ETL工具,通常考虑哪些因素?

(4)使用Kettle为什么要安装数据库?

(5)Kettle的应用场景有哪些?

(6)Kettle需要建立什么,使用什么,才能对数据进行清洗、转换、集成等操作?

(7)Kettle需要查看什么,才能看到执行结果?

3.拓展性问题

拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,

而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研研究探讨,从而完

成拓展性的问题。

(1)Excel也能对数据进行处理,为什么还要使用ETL工具?

(2)Kettle采用图形化界面操作,有什么好处?

(3)哪些场景的数据迁移和装载,不需使用数据库?

四、主要知识点、重点与难点

1.主要知识点

(1)ETL的概念、流程与应用场景。

(2)ETL的处理流程。

(3)JDK、MySQL和Kettle的安装和配置。

(4)Kettle的常用功能。

2.重点

(1)ETL的概念、流程与应用场景。

(2)Kettle常用的应用场景和功能。

3.难点

ETL的流程。

五、教学过程设计

1.理论教学过程

(1)ETL的概念。

(2)ETL的技术。

(3)ETL的应用场景。

(4)ETL的常用工具和选择。

(5)Kettle软件的优点

(6)安装JDK

(7)安装MySQL数据库

(8)安装和配置Kettle运行环境

(9)Kettle软件常用菜单功能。

(10)创建Kettle的转换工程和组件,以及查看结果。

2.实验教学过程

(1)在Windows系统上安装JDK,MySQL和Kettle软件。

(2)Kettle软件菜单常用功能的使用。

(3)创建Kettle第一个转换工程和组件

六、教材与参考资料

1.教材

2.参考资料

第2章源数据获取

教案

课程名称:ETL数据整合和处理

课程类别:必修

适用专业:大数据技术类相关专业

总学时:64学时(其中理论30学时,实验34学时)

总学分:4.0学分

本章学时:8学时

七、材料清单

(5)《ETL数据整合和处理(Kettle)》教材。

(6)引导性提问。

(7)探究性问题。

(8)拓展性问题。

八、教学目标与基本要求

3.教学目标

在Kettle软件上,讲授Kettle与MySQL数据库之间的连接。讲授从数据库、Excel和

CSV文件等源数据中获取数据的方法和操作,以及通过生成记录、生成随机数和获取系统

信息等源数据生成的方法和操作。让学生达到以下教学目标:

(14)掌握数据库连接的创建方法和参数设置。

(15)熟悉抽取源数据和生成数据的常用方法。

(16)掌握常用抽取源数据和生成数据组件及其参数设置。

(17)熟悉组件处理后的结果数据解读。

4.基本要求

(1)掌握Kettle与MySQL数据库之间的连接。

(2)熟练建立转换工程和创建相关的转换组件。

(3)掌握获取源数据的常用组件和参数设置。

(4)掌握生成数据的常用组件和参数设置。

(5)熟练浏览组件执行结果和掌握出错处理方法。

九、问题

5.引导性提问

引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导

学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。

(8)Kettle通过什么方法与数据库建立连接?

(9)Kettle是怎样获取数据的?

(10)Kettle能够生成数据吗?

(11)Kettle可以获取哪些典型类型文件的数据?

(12)获取源数据需要编程吗?

6.探究性问题

探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚

未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。

(8)获取源数据的处理过程是怎么样的?

(9)组件是什么?

(10)组件参数有什么用?

(11)获取数据库数据与文件数据的方法是否一样?

(12)获取数据和生成数据的应用场景有何异同?

(13)通过什么方法可以浏览获取的源数据?

7.拓展性问题

拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,

而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研研究探讨,从而完

成拓展性的问题。

(4)组件的参数的作用是什么?

(5)CSV和Excel文件都能用Excel查看文件数据,为何需要使用CSV文件、Excel

输入两个不同的组件来获取其数据?

十、主要知识点、重点与难点

8.主要知识点

(5)数据库连接,以及共享/停止数据库连接。

(6)表输入、CSV文件、Excel输入等组件的参数设置和使用。

(7)生成记录、生成随机数、获取系统信息等组件的参数设置和使用。

9.重点

(3)数据库连接以及共享连接的应用场景。

(4)表输入、CSV文件、Excel输入等获取源数据组件的应用场景和操作。

(5)生成记录、生成随机数、获取系统信息等生成数据组件的应用场景和操作。

10.难点

表输入、CSV文件、Excel输入等组件的参数设置和不同之处。

生成记录、生成随机数、获取系统信息等组件的参数设置和不同之处。

教学过程设计

11.理论教学过程

(II)创建数据库连接。

(12)共享/停止共享数据库连接.

(13)表输入组件及其参数设置。

(14)CSV文件组件及其参数设置。

(15)Excel输入组件及其参数设置。

(16)生成记录组件及其参数设置。

(17)生成随机数组件及其参数设置。

(18)获取系统信息组件及其参数设置。

12.实验教学过程

(4)在Kettle软件上,与MySQL建立数据库连接。

(5)进行共享/停止共享数据库连接

(6)建立转换工程和CSV文件组件,设置组件参数,运行和预览数据。

(7)建立转换工程和CSV文件组件,设置组件参数,运行和预览数据。

(8)建立转换工程和Excel输入组件,设置组件参数,运行和预览数据。

(9)建立转换工程和生成记录组件,设置组件参数,运行和预览数据。

(10)建立转换工程生成随机数组件,设置组件参数,运行和预览数据。

(11)建立转换工程和获取系统信息组件,设置组件参数,运行和预览数据。

十二、教材与参考资料

13.教材

14.参考资料

第3章记录处理

教案

课程名称:ETL数据整合和处理

课程类别:必修

适用专业:大数据技术类相关专业

总学时:64学时(其中理论30学时,实验34学时)

总学分:4.0学分

本章学时:8学时

十三、材料清单

(9)《ETL数据整合和处理(Kettle)》教材。

(10)引导性提问。

(11)探究性问题。

(12)拓展性问题。

十四、教学目标与基本要求

15.教学目标

讲授使用基于记录处理的排序记录、去除重复记录、替换NULL值、过滤记录、值映

射、字符串替换和分组等组件,进行数据转换的方法和操作,让学生达到以下教学目标:

(18)熟悉基于记录处理进行数据转换的常用方法。

(19)掌握基于记录处理的常用组件及其参数设置。

(20)熟悉基于记录处理后的结果数据解读。

16.基本要求

(6)掌握基于记录处理的常用组件和参数设置。

(7)掌握浏览组件执行结果和出错处理的方法o

十五、问题

17.引导性提问

引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导

学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。

(13)记录处理是不是只针对数据库的数据?

(14)是否还能够用一个组件就可以进行记录处理?

(15)设置记录处理的组件参数和获取源数据组件的参数是否类似?

18.探究性问题

探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚

未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。

(14)去除重复记录为什么要先进行排序?

(15)数据记录中为什么要替换NULL值?

(16)值映射的主要作用是什么?

(17)值映射可以对所有的数据类型进行操作吗?

(18)字符串替换对那些数据类型进行操作?

(19)过滤记录需要排序吗?

19.拓展性问题

拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,

而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研研究探讨,从而完

成拓展性的问题。

(6)值映射、字符串替换有什么差异?

(7)字符串替换、字符串操作能够相互代替吗?

十六、主要知识点、重点与难点

20.主要知识点

排序记录、去除重复记录、替换NULL值、过滤记录、值映射、字符串替换、字符串

操作、分组等组件的参数设置和使用。

21.重点

排序记录、去除重复记录、替换NULL值、过滤记录、值映射、字符串替换、字符串

操作、分组等组件的应用场景和操作。

22.难点

(1)排序记录、去除重复记录、替换NULL值、过滤记录、值映射、字符串替换、

字符串操作、分组等组件的参数设置和不同之处。

(2)值映射、字符串替换等组件使用的差异。

(3)字符串替换、字符串操作等组件使用的区别。

十七、教学过程设计

23.理论教学过程

(19)排序记录组件及其参数设置.

(20)去除重复记录组件及其参数设置。

(21)替换NULL值组件及其参数设置。

(22)过滤记录组件及其参数设置。

(23)值映射组件及其参数设置。

(24)字符串替换组件及其参数设置。

(25)字符串操作组件及其参数设置。

(26)分组组件及其参数设置。

24.实验教学过程

(12)建立转换工程和排序记录等组件,设置组件参数,运行和预览数据。

(13)建立转换工程和去除重复记录等组件,设置组件参数,运行和预览数据。

(14)建立转换工程和替换NULL值等组件,设置组件参数,运行和预览数据。

(15)建立转换工程和过滤记录等组件,设置组件参数,运行和预览数据。

(16)建立转换工程和值映射等组件,设置组件参数,运行和预览数据。

(17)建立转换工程和字符串替换等组件,设置组件参数,运行和预览数据。

(18)建立转换工程和字符串操作等组件,设置组件参数,运行和预览数据。

(19)建立转换工程和分组等组件,设置组件参数,运行和预览数据。

十八、教材与参考资料

25.教材

26.参考资料

第4章字段处理

教案

课程名称:ETL数据整合和处理

课程类别:必修

适用专业:大数据技术类相关专业

总学时:64学时(其中理论30学时,实验34学时)

总学分:4.0学分

本章学时:8学时

十九、材料清单

(13)《ETL数据整合和处理(Kettle)》教材。

(14)引导性提问。

(15)探究性问题。

(16)拓展性问题。

二十、教学目标与基本要求

27.教学目标

讲授使用基于字段处理的字段选择、增加常量、将字段值设置为常量、剪切字符串、拆

分字段、数值范围、计算器和增加序列等组件,进行数据转换的方法和操作,让学生达到以

下教学目标:

(21)熟悉基于字段处理进行数据转换的常用方法。

(22)掌握基于字段处理的常用组件及其参数设置。

(23)熟悉基于字段处理后的结果数据解读。

28.基本要求

(8)掌握基于字段处理的常用组件和参数设置。

(9)掌握浏览组件执行结果和出错处理的方法。

二十一、问题

29.引导性提问

引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导

学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。

(16)字段处理和记录处理有什么不同?

(17)字段处理对于数据库和文件的数据处理是否一样?

(18)字段处理是否对所有的记录数据进行处理?

30.探究性问题

探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚

未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。

(20)字段选择中,【移除的字段】参数表中设置参数,填写的是需要保留的字段吗?

(21)计算器组件参数设置中是否一定产生新字段?

(22)计算器组件只能计算3个字段的数据吗?

(23)增加常量要不要增加字段?

(24)将字段值设置为常量需要改变数据吗?

(25)剪切字符串中,中文、英文字母、数字的字符数计算是否不同?如何计算?

(26)拆分字段能否对无规律的字符串进行拆分?

(27)数值范围设置有什么用途?

(28)增加序列的作用是什么?

31.拓展性问题

拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,

而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研研究探讨,从而完

成拓展性的问题。

(8)剪切字符串、拆分字段有什么差异?

(9)字段选择组件参数设置中能够产生新字段吗?

(10)计算器组件计算3个以上字段的数据该如何处理?

二十二、主要知识点、重点与难点

32.主要知识点

字段选择、增加常量、将字段值设置为常量、剪切字符串、拆分字段、数值范围、计

算器、增加序列等组件的参数设置和使用。

33.重点

字段选择、增加常量、将字段值设置为常量、剪切字符串、拆分字段、数值范围、计

算器、增加序列等组件的应用场景和操作。

34.难点

(4)字段选择、增加常量、将字段值设置为常量、剪切字符串、拆分字段、数值范围、

计算器、增加序列等组件的参数设置和不同之处。

(5)字段选择组件参数设置

二十三、教学过程设计

35.理论教学过程

(27)字段选择组件及其参数设置。

(28)增加常量组件及其参数设置。

(29)将字段值设置为常量组件及其参数设置。

(30)剪切字符串组件及其参数设置。

(31)拆分字段组件及其参数设置。

(32)数值范围组件及其参数设置。

(33)计算器组件及其参数设置。

(34)增加序列组件及其参数设置.

36.实验教学过程

(20)建立转换工程和字段选择等组件,设置组件参数,运行和预览数据。

(21)建立转换工程和增加常量等组件,设置组件参数,运行和预览数据。

(22)建立转换工程和将字段值设置为常量等组件,设置组件参数,运行和预览数据。

(23)建立转换工程和剪切字符串等组件,设置组件参数,运行和预览数据。

(24)建立转换工程和拆分字段等组件,设置组件参数,运行和预览数据。

(25)建立转换工程和数值范围等组件,设置组件参数,运行和预览数据。

(26)建立转换工程和计算器等组件,设置组件参数,运行和预览数据。

(27)建立转换工程和增加序列等组件,设置组件参数,运行和预览数据。

二十四、教材与参考资料

37.教材

38.参考资料

第5章高级转换

教案

课程名称:ETL数据整合和处理

课程类别:必修

适用专业:大数据技术类相关专业

总学时:64学时(其中理论30学时,实验34学时)

总学分:4.0学分

本章学时:10学时

二十五、材料清单

(17)《ETL数据整合和处理(Kettle)》教材。

(18)引导性提问。

(19)探究性问题。

(20)拓展性问题。

二十六、教学目标与基本要求

39.教学目标

讲授记录集连接、多路数据合并连接、单变量统计、公式、利用Janino计算Java表达

式、JavaScript代码、设置变量和获取变量等高级转换组件,进行复杂的数据转换处理的方

法和操作,让学生达到以下教学目标:

(24)了解高级转换常用组件的作用。

(25)掌握高级转换常用组件的参数及参数的设置方法。

(26)熟悉使用高级转换常用组件后的结果数据解读。

40.基本要求

(10)掌握进行复杂数据处理的高级转换组件和参数设置。

(11)掌握浏览高级转换组件执行结果和出错处理的方法。

二十七、问题

41.引导性提问

引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导

学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。

(19)高级转换与字段处理、记录处理有什么不同?

(20)高级转换的参数设置是否十分复杂?

(21)高级转换组件是否可以代替常用的字段处理、记录处理中的组件?

(22)多路数据合并为什么比记录集连接改为高效、快速?

(23)单变量统计能否对多个字段进行计算?

42.探究性问题

探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚

未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。

(29)记录集连接要根据什么来进行数据连接?

(30)多路数据合并连接在什么场景下使用?

(31)利用janineo计算Java表达式、JavaScript代码组件中,哪一个需要编写脚本?

(32)单变量统计会产生新字段吗?

(33)单变量统计与公式的计算有什么不同?

(34)公式和利用janineo计算Java表达式的计算有什么相同和不同点?

(35)为什么要设置变量?

(36)获取变量前需要设置什么?

43.拓展性问题

拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,

而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研研究探讨,从而完

成拓展性的问题。

(11)记录集连接为什么要进行记录排序?

(12)公式和利用janineo计算Java表达式两种计算方法,它们是否可以互为代替进

行计算?

(13)计算器组件计算3个以上字段的数据该如何处理?

(14)设置变量、获取变量在什么场景下使用?

二十八、主要知识点、重点与难点

44.主要知识点

记录集连接、多路数据合并连接、单变量统计、公式、利用janine。计算Java表达式、

JavaScript代码、设置变量、获取变量等组件的参数设置和使用。

45.重点

记录集连接、多路数据合并连接、单变量统计、公式、利用janine。计算Java表达式、

JavaScript代码、设置变量、获取变量等组件的应用场景和操作。

46.难点

(6)记录集连接、多路数据合并连接、单变量统计、公式、利用janine。计算Java表

达式、JavaScript代码、设置变量、获取变量等组件的参数设置和不同之处。

(7)JavaScript代码组件的参数设置

(8)设置变量、获取变量的场景应用

二十九、教学过程设计

47.理论教学过程

(35)记录集连接组件及其参数设置。

(36)多路数据合并连接组件及其参数设置。

(37)单变量统计组件及其参数设置。

(38)公式组件及其参数设置。

(39)利用janineo计算Java表达式组件及其参数设置。

(40)JavaScript代码组件及其参数设置。

(41)设置变量组件及其参数设置。

(42)获取变量组件及其参数设置。

48.实验教学过程

(28)建立转换工程和记录集连接等组件,设置组件参数,运行和预览数据。

(29)建立转换工程和多路数据合并连接等组件,设置组件参数,运行和预览数据。

(30)建立转换工程和单变量统计等组件,设置组件参数,运行和预览数据。

(31)建立转换工程和公式等组件,设置组件参数,运行和预览数据。

(32)建立转换工程和利用janineo计算Java表达式等组件,设置组件参数,运行和

预览数据。

(33)建立转换工程和JavaScript代码等组件,设置组件参数,运行和预览数据。

(34)建立转换工程和设置变量等组件,设置组件参数,运行和预览数据。

(35)建立转换工程和获取变量等组件,设置组件参数,运行和预览数据。

三十、教材与参考资料

49.教材

50.参考资料

第6章迁移和装载

教案

课程名称:ETL数据整合和处理

课程类别:必修

适用专业:大数据技术类相关专业

总学时:64学时(其中理论30学时,实验34学时)

总学分:4.0学分

本章学时:6学时

三十一、材料清单

(21)《ETL数据整合和处理(Kettle)》教材。

(22)引导性提问。

(23)探究性问题。

(24)拓展性问题。

三十二、教学目标与基本要求

51.教学目标

讲授表输出、插入/更新两种将数据迁移和装载至数据库中的方法和操作,以及Excel

输出、文本文件输出和SQL文件输出这3种将数据迁移和装载至文件中的方法和操作,让

学生达到以下教学目标:

(27)了解数据迁移和装载常用组件的作用。

(28)掌握数据迁移和装载常用组件的参数和参数的设置方法。

(29)熟悉使用数据迁移和装载常用组件后的结果解读。

52.基本要求

(12)掌握数据迁移和装载常用组件和参数设置。

(13)掌握浏览数据迁移和装载后结果和出错处理的方法。

三十三、问题

53.引导性提问

引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导

学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。

(24)数据迁移和装载与数据转换有什么不同?

(25)数据迁移只能把数据装载到数据库吗?

(26)数据迁移和装载的作用是什么?

(27)“像搬家一样,数据迁移和装载就是把数据从一端搬到另一端”这句话是否正

确?

54.探究性问题

探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚

未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。

(37)表输入和插入/更新有什么异同?

(38)只有数据库的数据才能作为SQL文件输出吗?

(39)数据迁移和装载只是把源端数据移动到目标端吗?

(40)表输入和插入/更新组件的参数设置,那个组件需要设置比较符参数?

(41)“迁移和装载不改变源数据的大小和类型”的说法正确吗?为什么?

(42)SQL文件输出需要设置SQL语句吗?

(43)Excel输出能够指定工作表吗?

55.拓展性问题

拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,

而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研研究探讨,从而完

成拓展性的问题。

(15)Excel输入、CSV输入的文件,能够作为SQL文件输出吗?

(16)在什么场景下使用插入/更新?

(17)插入/更新也能够插入/更新到Excel或文本文件中吗?

(18)"字段是数据库的概念,Excel,文本文件输出没有字段的参数设置”这句话是

否正确?为什么?

(19)Excel和文本文件输出都是文本文件,Excel输出和文本文件输出的参数除了后

缀名不同外,其他的是否都一样?

三十四、主要知识点、重点与难点

56.主要知识点

表输出、插入/更新、Excel输出、文本文件输出、SQL文件输出等组件的参数设置和

使用。

57.重点

表输出、插入/更新、Excel输出、文本文件输出、SQL文件输出等组件的应用场景和

操作。

58.难点

(9)表输出、插入/更新、Excel输出、文本文件输出、SQL文件输出等组件的参数设

置和不同之处。

(10)插入/更新组件的参数设置和场景应用

三十五、教学过程设计

59.理论教学过程

(43)表输出组件及其参数设置。

(44)插入/更新组件及其参数设置。

(45)Excel输出组件及其参数设置。

(46)文本文件输出组件及其参数设置。

(47)SQL文件输出组件及其参数设置。

60.实验教学过程

(36)建立转换工程和表输出等组件,设置组件参数,运行和预览数据。

(37)建立转换工程和插入/更新等组件,设置组件参数,运行和预览数据。

(38)建立转换工程和Excel输出等组件,设置组件参数,运行和预览数据。

(39)建立转换工程和文本文件输出等组件,设置组件参数,运行和预览数据。

(40)建立转换工程和SQL文件输出等组件,设置组件参数,运行和预览数据。

三十六、教材与参考资料

61.教材

62.参考资料

第7章任务

教案

课程名称:ETL数据整合和处理

课程类别:必修

适用专业:大数据技术类相关专业

总学时:64学时(其中理论30学时,实验34学时)

总学分:4.0学分

本章学时:8学时

三十七、材料清单

(25)《ETL数据整合和处理(Kettle)》教材。

(26)引导性提问。

(27)探究性问题。

(28)拓展性问题。

三十八、教学目标与基本要求

63.教学目标

任务是比转换更高一级的任务处理。讲授开始、转换、添加文件到结果文件中、发送邮

件、成功、检查表是否存在、SQL、检查列是否存在、检查一个文件是否存在、检查多个文

件是否存在等10种常用任务组件的方法和操作,让学生达到以下教学目标:

(30)掌握建立任务与任务定时调度的方法。

(31)掌握在任务中调用转换的方法。

(32)掌握任务中常用组件的作用和使用方法。

(33)掌握任务中常用组件的参数和参数的设置方法。

64.基本要求

(14)掌握任务启动的参数设置。

(15)常用在任务中调用转换工程和参数设置。

(16)常用在常用任务组件和参数设置。

(17)掌握浏览执行任务后结果和排错处理的方法。

三十九、问题

65.引导性提问

引导性提问,是教师根据教材内容和学生实际水平,有针对性地提出问题,去启发引导

学生去思考和解决问题,从而达到理解、掌握课程知识点和技术点。

(28)任务和转换有什么不同?

(29)任务的起点是什么吗?

(30)为什么需要使用任务?

(31)任务可以定时执行吗?

(32)任务是否能够监控执行?

66.探究性问题

探究性问题,是教师在深入钻研教材、引导性提问的基础上,或者是在引导式提问中尚

未涉及,又是课程中的重要内容,从重点、难点中切入,而精心设计的插入式提问。

(44)在一个完整的可执行的任务工程中,必不可少的组件是什么?

(45)任务可以调用转换工程,是否也可以调用任务工程?

(46)什么组件可以产生日志文件?

(47)一般通过什么查看任务的执行?

(48)发送邮件为什么可以监控到任务的执行?

(49)为什么要使用成功组件?有什么作用?

(50)查看任务执行结果与查看转换执行结果是否相同?

(51)为什么要检查数据库表和字段、文件是否存在?

(52)SQL组件有什么用?

(53)什么场景下需要检查列是否存在?

67.拓展性问题

拓展性问题,是教师在深刻理解教材的意义、学生的学习动态后,根据学生学习层次,

而提出的切实可行的实际操作问题。教师亦可以提供拓展资料,给学生研研究探讨,从而完

成拓展性的问题。

(20)什么场景下,需要检查文件是否存在?

(21)邮件发送中,能否发送非固定文件名称的文件?

四十、主要知识点、重点与难点

68.主要知识点

开始、转换、添加文件到结果文件中、发送邮件、成功、检查表是否存在、SQL、检

查列是否存在、检查一个文件是否存在、检查多个文件是否存在等组件的参数设置和使用。

69.重点

开始、转换、添加文件到结果文件中、发送邮件、成功、检查表是否存在、SQL、检

查列是否存在、检查一个文件是否存在、检查多个文件是否存在等组件的应用场景和操作。

70.难点

(11)开始、转换、添加文件到结果文件中、发送邮件、成功、检查表是否存在、SQL、

检查列是否存在、检查一个文件是否存在、检查多个文件是否存在等组件的参数设置和不同

之处。

(12)发送邮件组件中,附件文件的发送

(13)查看任务执行的结果,并排错

四十一、教学过程设计

71.理论教学过程

(48)开始组件及其参数设置。

(49)转换组件及其参数设置。

(50)添加文件到结果文件中组件及其参数设置。

(51)发送邮件组件及其参数设置。

(52)成功组件及其参数设置。

(53)检查表是否存在组件及其参数设置。

(54)SQL组件及其参数设置。

(55)检查列是否存在组件及其参数设置。

(56)检查一个文件是否存在组件及其参数设置。

(57)检查多个文件是否存在组件及其参数设置。

72.实验教学过程

(41)建立任务工程和开始组件,设置组件参数,运行.

(42)建立任务工程和转换等组件,设置组件参数,运行和预览结果。

(43)建立任务工程和添加文件到结果文件中等组件,设置组件参数,运行和预览结

果。

(44)建立任务工程和发送邮件等组件,设置组件参数,运行和预览结果。

(45)建立任务工程和成功等组件,设置组件参数,运行和预览结果。

(46)建立任务工程和检查表是否存在等组件,设置组件参数,运行和预览结果。

(47)建立任务工程和SQL等组件,设置组件参数,运行和预览结果。

(48)建立任务工程和检查列是否存在等组件,设置组件参数,运行和预览结果。

(49)建立任务工程和检查一个文件是否存在等组件,设置组件参数,运行和预览结

果。

(50)建立任务工程和检查多个文件是否存在等组件,设置组件参数,运行和预览结

果。

四十二、教材与参考资料

73.教材

74.参考资料

第8章无人售货机项目实战

教案

课程名称:ETL数据整合和处理

课程类别:必修

适用专业:大数据技术类相关专业

总学时:64学时(其中理论30学时,实验34学时)

总学分:4.0学分

本章学时:10学时

四十三、材料清单

(29)《ETL数据整合和处理(Kettle)》教材。

(30)引导性提问。

(31)探究性问题。

(32)拓展性问题。

四十四、教学目标与基本要求

75.教学目标

无人售货机每天为客户提供便利的商品零售服务,同时也产生了大量的商品零售数据。

讲授通过采用Kettle的组件,进行组件参数设置和使用,实现无人售货机项目有关任务,让

学生达到以下教学目标:

(34)熟悉并理解无人售货机的数据。

(35)熟悉无人售货机项目的整体目标。

(36)掌握项目各任务的流程和步骤。

(37)掌握多组件组合处理任务的方法。

76.基本要求

(18)了解项目的背景和业务数据。

(19)了解项目的各任务的目标。

(20)掌握任务的流程和步骤。

(21)掌握项目使用的组件和参数设置。

(22)掌握浏览项目执行后结果和排错处理的方法。

四十五、问题

77.引导性提

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论