版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
自定义表生成函数表生成函数概述自定义表生成函数使用自定义表生成函数01
表生成函数概述表生成函数概述UDTF,是UserDefinedTable-GeneratingFunctions,一眼看上去,貌似是用户自定义生成表函数,这个生成表不应该理解为生成了一个HQLTable,貌似更应该理解为生成了类似关系表的二维行数据集。
什么是UDTF表生成函数概述继承org.apache.hadoop.hive.ql.udf.generic.GenericUDTF。实现initialize,process,close三个方法如何实现UDTFUDTF首先会调用initialize方法,此方法返回UDTF的返回行的信息(返回个数,类型)。初始化完成后,会调用process方法,对传入的参数进行处理,可以通过forword()方法把结果返回。最后close()方法调用,对需要清理的方法进行清理。02
自定义表生成函数自定义表生成函数实现代码:public
class
ExplodeMap
extends
GenericUDTF
{//进行清理
@Override
public
void
close()
throws
HiveException
{
//
TODO
Auto-generated
method
stub
}
//initialize,process方法}
自定义表生成函数
@Override
public
StructObjectInspector
initialize(ObjectInspector[]
args)
throws
UDFArgumentException
{
if
(args.length
!=
1)
{
throw
new
UDFArgumentLengthException("ExplodeMap
takes
only
one
argument");
}
if
(args[0].getCategory()
!=
ObjectInspector.Category.PRIMITIVE)
{
throw
new
UDFArgumentException("ExplodeMap
takes
string
as
a
parameter");
}
自定义表生成函数
ArrayList<String>
fieldNames
=
new
ArrayList<String>();
ArrayList<ObjectInspector>
fieldOIs
=
new
ArrayList<ObjectInspector>();
fieldNames.add("col1");
fieldOIs.add(PrimitiveObjectInspectorFactory.javaStringObjectInspector);
fieldNames.add("col2");
fieldOIs.add(PrimitiveObjectInspectorFactory.javaStringObjectInspector);
return
ObjectInspectorFactory.getStandardStructObjectInspector(fieldNames,
fieldOIs);
}
自定义表生成函数
public
void
process(Object[]
args)
throws
HiveException
{
String
input
=
args[0].toString();
String[]
test
=
input.split(";");
for
(int
i
=
0;
i
<
test.length;
i++)
{
try
{
String[]
result
=
test[i].split(":");
forward(result);
}
catch
(Exception
e)
{
continue;
}
}
}
03
使用自定义表生成函数使用UDTF函数1、在select中使用UDTF:select
explode_map(properties)
as
(col1,col2)
from
my_table
不可以添加其他字段使用:selecta,explode_map(properties)as(col1,col2)frommy_table不可以嵌套调用:selectexplode_map(explode_map(properties))frommy_table不可以和groupby/clusterby/distributeby/sortby一起使用:selectexplode_map(properties)as(col1,col2)fromsrcgroupbycol1,col2使用UDTF函数2、结合lateralview使用select
src.id,
mytable.col1,
mytable.col2
from
src
lateral
view
e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度不锈钢生产线扩建与升级承包合同3篇
- 二零二五年工程车辆租赁合同(含车辆安全及环保标准)3篇
- 员工年终奖发放标准方案范文
- 关于春游方案3篇
- 2025年度杭州智能家居产品销售合同18篇
- 二零二五年度二手房交易合同:延期交房补偿及责任承担协议3篇
- 2025年度物业服务企业职业健康与环保服务协议2篇
- 洗洁精项目可行性报告
- 二零二五年度云计算服务与解决方案合同6篇
- 2025版酒店会议场地预订及旅游度假套餐服务合同3篇
- 水利水电工程安全管理制度例文(三篇)
- 2025四川宜宾市南溪区属国企业招聘融资人员6人管理单位笔试遴选500模拟题附带答案详解
- DB45T 2048-2019 微型消防站建设管理规范
- 2025年超星尔雅学习通《劳动通论》章节测试题库及参考答案(培优)
- SCTP大云云计算PT2题库【深信服】认证考试题库及答案
- 外研版(2024新版)七年级上册英语期末质量监测试卷 3套(含答案)
- 《测土配方施肥》课件
- 人教版2024-2025学年第一学期八年级物理期末综合复习练习卷(含答案)
- 《上帝掷骰子吗:量子物理史话》导读学习通超星期末考试答案章节答案2024年
- 病例报告表(CRF)模板
- 建设工程项目施工安全管理流程图3页
评论
0/150
提交评论