




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
自定义表生成函数表生成函数概述自定义表生成函数使用自定义表生成函数01
表生成函数概述表生成函数概述UDTF,是UserDefinedTable-GeneratingFunctions,一眼看上去,貌似是用户自定义生成表函数,这个生成表不应该理解为生成了一个HQLTable,貌似更应该理解为生成了类似关系表的二维行数据集。
什么是UDTF表生成函数概述继承org.apache.hadoop.hive.ql.udf.generic.GenericUDTF。实现initialize,process,close三个方法如何实现UDTFUDTF首先会调用initialize方法,此方法返回UDTF的返回行的信息(返回个数,类型)。初始化完成后,会调用process方法,对传入的参数进行处理,可以通过forword()方法把结果返回。最后close()方法调用,对需要清理的方法进行清理。02
自定义表生成函数自定义表生成函数实现代码:public
class
ExplodeMap
extends
GenericUDTF
{//进行清理
@Override
public
void
close()
throws
HiveException
{
//
TODO
Auto-generated
method
stub
}
//initialize,process方法}
自定义表生成函数
@Override
public
StructObjectInspector
initialize(ObjectInspector[]
args)
throws
UDFArgumentException
{
if
(args.length
!=
1)
{
throw
new
UDFArgumentLengthException("ExplodeMap
takes
only
one
argument");
}
if
(args[0].getCategory()
!=
ObjectInspector.Category.PRIMITIVE)
{
throw
new
UDFArgumentException("ExplodeMap
takes
string
as
a
parameter");
}
自定义表生成函数
ArrayList<String>
fieldNames
=
new
ArrayList<String>();
ArrayList<ObjectInspector>
fieldOIs
=
new
ArrayList<ObjectInspector>();
fieldNames.add("col1");
fieldOIs.add(PrimitiveObjectInspectorFactory.javaStringObjectInspector);
fieldNames.add("col2");
fieldOIs.add(PrimitiveObjectInspectorFactory.javaStringObjectInspector);
return
ObjectInspectorFactory.getStandardStructObjectInspector(fieldNames,
fieldOIs);
}
自定义表生成函数
public
void
process(Object[]
args)
throws
HiveException
{
String
input
=
args[0].toString();
String[]
test
=
input.split(";");
for
(int
i
=
0;
i
<
test.length;
i++)
{
try
{
String[]
result
=
test[i].split(":");
forward(result);
}
catch
(Exception
e)
{
continue;
}
}
}
03
使用自定义表生成函数使用UDTF函数1、在select中使用UDTF:select
explode_map(properties)
as
(col1,col2)
from
my_table
不可以添加其他字段使用:selecta,explode_map(properties)as(col1,col2)frommy_table不可以嵌套调用:selectexplode_map(explode_map(properties))frommy_table不可以和groupby/clusterby/distributeby/sortby一起使用:selectexplode_map(properties)as(col1,col2)fromsrcgroupbycol1,col2使用UDTF函数2、结合lateralview使用select
src.id,
mytable.col1,
mytable.col2
from
src
lateral
view
e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国欧型把手行业市场发展前景及发展趋势与投资战略研究报告
- 【可行性报告】2025年汽车后视镜相关项目可行性研究报告
- 2021-2026年中国荔枝干行业发展监测及投资战略规划研究报告
- 2025年光学级PMMA市场分析报告
- 2025年中国热敏纸标签行业市场发展前景及发展趋势与投资战略研究报告
- 2022-2027年中国龙脑香木(克隆木)原木市场规模现状及投资规划建议报告
- 余热发电改造项目节能评估报告(节能专用)
- 以邮启智:高中数学文化选修课中邮票与数学融合的创新实践
- 以趣启笔:初中快乐作文教学的探索与实践
- 以课程目标达成为导向的史料教学策略探究
- 2025年吉林省中考语文试卷真题(含答案)
- 20250628红餐产业研究院粥品品类发展报告2025284mb
- 2025年陕西省中考数学真题试卷及答案解析
- 2025年全国新高考I卷高考全国一卷真题英语试卷(真题+答案)
- 仙家送钱表文-文字打印版
- 铁板神数计算取数方法
- 10、连乘、连除和乘除混合运算
- 《平行四边形》PPT课件共(25张PPT)
- 法国公鸡乐卡克
- 煤炭供应链金融平台方案课件
- 脚手架验收记录表
评论
0/150
提交评论