版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据实时计算FlinkSQL架构介绍技术创新
变革未来大数据实时计算FlinkSQL架构介绍技术创新1目
录1Background2Flink
SQL
基本概念3Flink
SQL
核心功能4Flink
SQL
优化5阿里云流计算产品目录1Background2FlinkSQL基本概念32BackgroundBackground3Alibaba
Blink阿里巴巴Blink团队有
20+flinkcontributor,6名
committer,向社区贡献了数百个Commit+=Apache
FlinkAlibaba’s
ImprovementsBlinkAlibaba
BlinkBlink
Runtime+Flink
SQL=AlibabaBlink阿里巴巴Blink团队有20+4团队工作主导制定
Flink
SQL
语义DynamicTable
2016-2017Retraction
2016-2017完善
Flink
SQL功能Agg,Join,Window
2017跑通全部
TPCHQuery
2018性能提升大量的查询优化
2017-2018资源配置自动化
2018贡献社区贡献社区部分贡献社区团队工作主导制定FlinkSQL语义完善Flink5FlinkSQLFlinkSQL6Why
SQL?DeclarativeOneQuery,One
ResultOptimized Understandable StableUnifyWhySQL?DeclarativeOneQuery,7SQL
不是为流设计的没有Retraction批计算查询返回一个结果并结束数据是有限的批处理流数据是无穷的流上的查询不断产生结果且不会结束有对历史数据的修改(Retraction)流处理SQL不是为流设计的没有Retraction批计算查询返回8动态表(Dynamic
Table)动态表(Dynamic
Table): 数据会随着时间变化的表动态表(DynamicTable)动态表(Dynamic9动态表
+
连续查询连续查询(Continuous
Query):持续运行的查询StreamStream连续查询StreamStream连续查询连续查询Stream动态表+连续查询连续查询(ContinuousQuer10流计算
Retraction流计算Retraction11流计算
Retraction流计算Retraction12世界上不需要所谓的
Stream
SQL标准的
ANSI
SQL
就可以用来定义流计算世界上不需要所谓的StreamSQL13Flink
SQL
核心功能DDL&
DMLUDF/UDTF/UDAFWindow
AggJoinGroup
AggOver
AggFlinkSQL核心功能DDL&DMLUDF/UDT14LoadingData--
定义数据源表CREATETABLEclicks
(VARCHAR,TIMESTAMP,VARCHARusercTimeurl)WITH
(type=
'kafka',topic=
'click_topic',…);SELECT*FROM
clicksusercTimeurlMary12:00:00./homeBob12:00:00./cartMary12:00:05./prod?id=1LoadingData--定义数据源表VARCHAR,15SavingData--
定义数据结果表CREATETABLElast_clicks
(usercTimeurlVARCHAR,TIMESTAMP,VARCHAR,PRIMARYKEY
(user))WITH
(type=
'mysql',…);INSERTINTOlast_clicksSELECT*FROMclicksSavingData--定义数据结果表usercT16MultiOutputCREATEVIEWtaobao_clicks
ASSELECT*FROMclicksWHEREurlLIKE
'%’INSERTINTOmysql_resultSELECT*FROM
taobao_clicksINSERTINTO
hbase_resultSELECT*FROM
taobao_clicksCREATETABLEmysql_clicks
(usercTimeurlVARCHAR,TIMESTAMP,VARCHAR,PRIMARYKEY
(user))WITH
(type=
'mysql',…);CREATETABLEhbase_clicks
(usercTimeurlVARCHAR,TIMESTAMP,VARCHAR,PRIMARYKEY
(user))WITH
(type=
'hbase',…);MultiOutputCREATEVIEWtaoba17Group
AggregateMary1Mary2resultusercntMary3Bob1SELECTuser,COUNT(url)ascntFROM
clicksGROUPBY
userclicksusercTimeurlMary12:00:00./homeBob12:00:00./cartMary12:00:05./prod?id=1Mary12:01:45./prod?id=7从历史到现在每个用户点击的次数GroupAggregateMary1Mary2resul18Window
Aggregate每小时每个用户点击的次数resultuserendTcntMary13:00:003Bob13:00:001Bob14:00:001Liz14:00:002Bob13:01:00./prod?id=4Liz13:30:00./cartLiz13:59:00./homeSELECTuser,TUMBLE_END(cTime,INTERVAL'1'
HOURS)ASendT,COUNT(url)AS
cntFROM
clicksGROUP
BYuser,TUMBLE(cTime,INTERVAL'1'
HOURS)clicksusercTimeurlMary12:00:00./homeBob12:00:00./cartMary12:02:00./prod?id=2Mary12:55:00./homeWindowAggregate每小时每个用户点击的次数re19双流
JOIN:支持
INNER,
LEFT,
RIGHT,
FULL,
SEMI,
ANTISELECTo.orderId,ductId,o.orderTime,s.shipTimFROMOrderJOIN
ShipmON
o.orderOrdersorderIdproductIdorderTime53010:17:0061010:17:0591011:02:00121011:24:11ShipmentsorderIdshipTime510:55:00610:20:00911:58:001211:44:00esAS
oentsAS
sId=
s.orderIdresultorderIdproductIdorderTimeshipTime53010:17:0010:55:0061010:17:0510:20:0091011:02:0011:58:00121011:24:1111:44:00双流JOIN:支持INNER,LEFT,RIGHT,20维表
JOIN:支持
INNER,
LEFTCREATETABLEProducts
(productIdVARCHAR,productNameVARCHAR,price
DECIMAL,PRIMARYKEY(productId),PERIODFOR
SYSTEM_TIME)WITH(type=
'hbase'…);SELECTo.*,p.*FROMOrdersAS
oJOINProductsFORSYSTEM_TIMEASOFPROCTIME()ASpONductId=
ductId维表JOIN:支持INNER,LEFTCREATET21聊几个优化聊几个优化22awabwbDataBaseReduced
ThroughputWaitfor
ResponseadDataBaseabcbcdSend
RequestReceive
RequestWaitConcurrent
ProcessingIncreased
ThroughputSync.
IOAsync.
IO异步维表
JOINawabwbDataBaseReducedThroughp23异步维表
JOINCREATETABLEProducts(productIdVARCHAR,productNameVARCHAR,price
DECIMAL,PRIMARYKEY(productId),PERIODFOR
SYSTEM_TIME)WITH
(type=
'hbase',async=
'true'…);SELECTo.*,p.*FROMOrdersAS
oJOINProductsFORSYSTEM_TIMEASOF
PROCTIME()AS
pONductId=
ductId一行配置的改动异步维表JOINCREATETABLEProducts24AggAggMapMapMap如何处理数据倾斜Data-SkewAggAggMapMapMap如何处理数据倾斜Data-Sk25如何处理数据倾斜Data-SkewAggAggMapMapMapHot!!反压反压反压如何处理数据倾斜Data-SkewAggAggMapMapM26如何处理数据倾斜Data-SkewLocal-Global
Aggregation
优化如何处理数据倾斜Data-SkewLocal-Global27如何处理数据倾斜Data-SkewLocalAggLocalAggLocalAggGlobalAggGlo
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026四川宜宾市第五人民医院医共体总院招聘1人笔试备考试题及答案解析
- 2026年泉州工程职业技术学院单招综合素质笔试参考题库含详细答案解析
- 2026江西赣江新区中医药科创城幼儿园招聘教职员工4人笔试备考试题及答案解析
- 2026年辽宁地质工程职业学院单招综合素质考试备考试题含详细答案解析
- 2026甘肃中医药大学附属医院招聘护理人员12人笔试备考题库及答案解析
- 2026广东广州花都区花东镇莘田小学临聘教师招聘笔试备考试题及答案解析
- 2026南昌市劳动保障事务代理中心派遣制技术运维人员招聘14人笔试备考试题及答案解析
- 2026广东茂名市茂南区农村公路建设项目管理处就业见习人员招聘3人笔试备考试题及答案解析
- 2026年广西科技职业学院单招职业技能考试备考题库含详细答案解析
- 2026安徽黄山徽投集团面向全国部分重点高校引进人才2人笔试备考题库及答案解析
- 2026湖南衡阳日报社招聘事业单位人员16人备考题库附答案详解
- 《中国的地理区域划分》教案-2025-2026学年商务星球版(新教材)初中地理八年级下册
- 炎德·英才大联考长郡中学2026届高三月考(五)语文试卷(含答案解析)
- 2025玉石加工行业创新设计市场竞争与市场发展前景规划
- 2025年天津市检察官、法官入员额考试真题(附答案)
- 建筑施工企业诚信承诺书范本
- 消防改造免责协议书
- GB 3608-2025高处作业分级
- 医疗器械进销存管理台账模板
- 2025年安徽省普通高中学业水平选择性考试地理含答案详解及试卷分析
- DB15∕T 3413-2024 住宅小区和商业用房供配电设施规范
评论
0/150
提交评论