版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
自定义表生成函数表生成函数概述自定义表生成函数使用自定义表生成函数01
表生成函数概述表生成函数概述UDTF,是UserDefinedTable-GeneratingFunctions,一眼看上去,貌似是用户自定义生成表函数,这个生成表不应该理解为生成了一个HQLTable,貌似更应该理解为生成了类似关系表的二维行数据集。
什么是UDTF表生成函数概述继承org.apache.hadoop.hive.ql.udf.generic.GenericUDTF。实现initialize,process,close三个方法如何实现UDTFUDTF首先会调用initialize方法,此方法返回UDTF的返回行的信息(返回个数,类型)。初始化完成后,会调用process方法,对传入的参数进行处理,可以通过forword()方法把结果返回。最后close()方法调用,对需要清理的方法进行清理。02
自定义表生成函数自定义表生成函数实现代码:public
class
ExplodeMap
extends
GenericUDTF
{//进行清理
@Override
public
void
close()
throws
HiveException
{
//
TODO
Auto-generated
method
stub
}
//initialize,process方法}
自定义表生成函数
@Override
public
StructObjectInspector
initialize(ObjectInspector[]
args)
throws
UDFArgumentException
{
if
(args.length
!=
1)
{
throw
new
UDFArgumentLengthException("ExplodeMap
takes
only
one
argument");
}
if
(args[0].getCategory()
!=
ObjectInspector.Category.PRIMITIVE)
{
throw
new
UDFArgumentException("ExplodeMap
takes
string
as
a
parameter");
}
自定义表生成函数
ArrayList<String>
fieldNames
=
new
ArrayList<String>();
ArrayList<ObjectInspector>
fieldOIs
=
new
ArrayList<ObjectInspector>();
fieldNames.add("col1");
fieldOIs.add(PrimitiveObjectInspectorFactory.javaStringObjectInspector);
fieldNames.add("col2");
fieldOIs.add(PrimitiveObjectInspectorFactory.javaStringObjectInspector);
return
ObjectInspectorFactory.getStandardStructObjectInspector(fieldNames,
fieldOIs);
}
自定义表生成函数
public
void
process(Object[]
args)
throws
HiveException
{
String
input
=
args[0].toString();
String[]
test
=
input.split(";");
for
(int
i
=
0;
i
<
test.length;
i++)
{
try
{
String[]
result
=
test[i].split(":");
forward(result);
}
catch
(Exception
e)
{
continue;
}
}
}
03
使用自定义表生成函数使用UDTF函数1、在select中使用UDTF:select
explode_map(properties)
as
(col1,col2)
from
my_table
不可以添加其他字段使用:selecta,explode_map(properties)as(col1,col2)frommy_table不可以嵌套调用:selectexplode_map(explode_map(properties))frommy_table不可以和groupby/clusterby/distributeby/sortby一起使用:selectexplode_map(properties)as(col1,col2)fromsrcgroupbycol1,col2使用UDTF函数2、结合lateralview使用select
src.id,
mytable.col1,
mytable.col2
from
src
lateral
view
e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中学语文教研组工作计划
- 关于合同签订的审批通知函7篇范本
- 预防传染病培养阳光心态,小学六年级主题班会课件
- (2026年)药品不良反应报告和监测管理制度
- 催办部门文件审批的函6篇范本
- 2026年山西省运城市中考生物试卷附答案
- 安全伴我行:预防交通事故记心间小学主题班会课件
- 质量管理体系与改进指南
- 小学主题班会课件:感恩父母尊重老师
- 合作伙伴培训计划的邀请函(3篇范文)
- 2025年工业废水处理系统智能加药算法实践案例研究
- 2024嘉兴辅警考试真题及答案
- 2025年车间级安全教育培训考试题及答案
- 126kV气体绝缘金属封闭开关设备GIS
- 《人工智能导论》课件-第六章 利用生成式人工智能策划大学生创新创业活动方案
- 要素式申请执行文书-强制执行申请书模版
- 台球厅员工手册
- 2025-2030中国重症监护医院资源配置与运营优化报告
- 《煤矿安全规程》2025版
- 风电场安全知识培训
- 供应商安全培训记录课件
评论
0/150
提交评论