自定义表生成函数 精品获奖_第1页
自定义表生成函数 精品获奖_第2页
自定义表生成函数 精品获奖_第3页
自定义表生成函数 精品获奖_第4页
自定义表生成函数 精品获奖_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自定义表生成函数表生成函数概述自定义表生成函数使用自定义表生成函数01

表生成函数概述表生成函数概述UDTF,是UserDefinedTable-GeneratingFunctions,一眼看上去,貌似是用户自定义生成表函数,这个生成表不应该理解为生成了一个HQLTable,貌似更应该理解为生成了类似关系表的二维行数据集。

什么是UDTF表生成函数概述继承org.apache.hadoop.hive.ql.udf.generic.GenericUDTF。实现initialize,process,close三个方法如何实现UDTFUDTF首先会调用initialize方法,此方法返回UDTF的返回行的信息(返回个数,类型)。初始化完成后,会调用process方法,对传入的参数进行处理,可以通过forword()方法把结果返回。最后close()方法调用,对需要清理的方法进行清理。02

自定义表生成函数自定义表生成函数实现代码:public

class

ExplodeMap

extends

GenericUDTF

{//进行清理

@Override

public

void

close()

throws

HiveException

{

//

TODO

Auto-generated

method

stub

}

//initialize,process方法}

自定义表生成函数

@Override

public

StructObjectInspector

initialize(ObjectInspector[]

args)

throws

UDFArgumentException

{

if

(args.length

!=

1)

{

throw

new

UDFArgumentLengthException("ExplodeMap

takes

only

one

argument");

}

if

(args[0].getCategory()

!=

ObjectInspector.Category.PRIMITIVE)

{

throw

new

UDFArgumentException("ExplodeMap

takes

string

as

a

parameter");

}

自定义表生成函数

ArrayList<String>

fieldNames

=

new

ArrayList<String>();

ArrayList<ObjectInspector>

fieldOIs

=

new

ArrayList<ObjectInspector>();

fieldNames.add("col1");

fieldOIs.add(PrimitiveObjectInspectorFactory.javaStringObjectInspector);

fieldNames.add("col2");

fieldOIs.add(PrimitiveObjectInspectorFactory.javaStringObjectInspector);

return

ObjectInspectorFactory.getStandardStructObjectInspector(fieldNames,

fieldOIs);

}

自定义表生成函数

public

void

process(Object[]

args)

throws

HiveException

{

String

input

=

args[0].toString();

String[]

test

=

input.split(";");

for

(int

i

=

0;

i

<

test.length;

i++)

{

try

{

String[]

result

=

test[i].split(":");

forward(result);

}

catch

(Exception

e)

{

continue;

}

}

}

03

使用自定义表生成函数使用UDTF函数1、在select中使用UDTF:select

explode_map(properties)

as

(col1,col2)

from

my_table

不可以添加其他字段使用:selecta,explode_map(properties)as(col1,col2)frommy_table不可以嵌套调用:selectexplode_map(explode_map(properties))frommy_table不可以和groupby/clusterby/distributeby/sortby一起使用:selectexplode_map(properties)as(col1,col2)fromsrcgroupbycol1,col2使用UDTF函数2、结合lateralview使用select

src.id,

mytable.col1,

mytable.col2

from

src

lateral

view

e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论