具有机器学习功能的MySQL HeatWave2023年_第1页
具有机器学习功能的MySQL HeatWave2023年_第2页
具有机器学习功能的MySQL HeatWave2023年_第3页
具有机器学习功能的MySQL HeatWave2023年_第4页
具有机器学习功能的MySQL HeatWave2023年_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

具有机器学习功能的MySQLHeatwave

徐轶韬

1

②膘嘿膘会重天轮

徐轶韬!MySQL

甲骨文公司MySQL解决方案首席工程师\高可用解决方案

从主从复制至『IrmoDBCluster架构

公众号"MySQL解决方案工程师”的内容

卡理学

作者和运营者。Q1|«EVUKHCM

《MySQL高可用解决方案——从主从复制到InnoDBCluster架构》作者

为何在云中使用MySQL?

保持数据库的安全性变得更为困难

快速部署与自动化

有助于改善系统管理与合规性

基础康务外包

有助于减少运营开销

节省成本

节省硬件成本和软件许可证成本

3

为何选择MySQLDatabaseService(MDS)

使用MySQL企业版

・减少数据泄露风险

,满足合规要求

■获取最新的安全更新

■与本地部署的MySQLlOO%兼容

・来自MySQL专家的技术支持

更能节省成本

4

MDS使用MySQL企业版提供云服务

Oracle负责

•备份与恢复

•具有自动故障转移功能的

高可用性

・水平与垂直扩展

•数据库和操作系统补丁

•监视和日志处理

•MySQL企业版中的高级功能

。呼W@经天髭

5

70%与AmazonRDS相比节省成本

MySQLDatabaseService:1YearTCO

100OCPUs,1TBStorage

$212,974

£

MySQLDatabaseService:StandardE3AMD16GB/Core,allregionshavethesameprice.5

AmazonRDS:IntelR516GB/Core,AWSUSEast.$170,244

Azure:MemoryOptimizedIntel20GB/Core,MSAzureUS-East.sN

Google:HighMemoryN1StandardIntel13GB/Core,GCPNorthernVirginia.aJ

<o

Configuration:100OCPUs,1TBStorage.t

s

C

Op

Nn

ro

a_

Eu

<Q

M

O$65,833

O

±30%CostO(/>

@凄天轮

一代云:二代云:

普遍的做法OracleCloudInfrastructure-Wide

架构设计为对租户多

最大程度的隔离和痴

ServerVirtualization

......Hypervisor..........

NetworkVirtualization

HostOS/Kernel

租户之间

7。呼M**&经天髭

MySQLDatabaseService:高可用性

具有自动故障转移和零数据丢失的容错系统

。呼W@经天髭

8

挑战#1:事务处理与分析处理的系统需要分开

MySQL用户需要分别使用OLTP和OLAP系统

传统的行格式没有针对OLAP工作负载进行优化

。呼W@经天髭

10

Oracle云中提供的MySQLHeatwave数据库服务

无需重写查询和ETL、加速OLTP和OLAP工作

1.fMySQL数据库,用于OLTP和

OLAP应用程序

MySQL

Database2.数据分区存储在内存

Service

InnoDBHeatVave

MySQL3.已有的应用程序无需任何更改

My盛

。呼W@经天髭

11

MySQLHeatwave数据库服务架构

。呼W@经天髭

12

HeatWave:实时分析

插入MySQL的数据可以在一秒内进行分析查询

Insert/AnalyticQuery

UpdateQueryResults

It

MySQLDatabaseServiceHeatWaveCluster

MySQLCompiler&Optimizer

Query

OLTPQueryAnalyticQueryPushdown

OptimizationOptimization---->

MySQLExecutionInnoDBA

RealTime

Update

Results

。呼w@经天髭

13

挑战#2:用于机器学习的工具和服务需要分开

需要使用ETL分离数据进行训练与预测

•复杂,耗时

・增加成本和风险当使用其他数据库时,情况会更・

•需要学习新的工具/语言

。呼W@经天髭

15

使用MySQLHeatWave的机器学习

加速ML计划,增加安全性,降低成本

166)呼W会经天髭

HeatwaveML与其他的ML使用方法对比

WithoutMLinMySQL

SensitiveModel/DataBoundary

17

OracleAutoML自动生成一个准确和快速的模型

Cleanse,impute&IdentifytopkFilterrelevantSelectsuitableIdentifyoptimalGenerateModelTrainPredictionTuned

Model

normalizefeaturesalgorithmscolumnssamplehyperparametersexplanationsExplainer

AutoML有多个自动化处理步骤,用于精确预测

•非迭代管道设计

•利用算法和数据集的元数据学习

•智能选择,减少每个阶段的尝试

•根据输入数据集特征选择算法/参数,准确率更高,运行时间更短

・通过使用元数据学习实现

•可扩展设计

•所有阶段都利用了节点间和节点内的并行性,减少了运行时长

。呼W@经天髭

18

HeatWaveMLvsRedshiftML:基准测试

/产生更准确的结果

,训练模型平均速度快25倍

/1%的成本

/添加更多模型时可以扩展

基准测试详细内容:https:〃www.oracle,com/myscil/hcatwave/performance/

。呼W@经天髭

19

零宕机时间OLTP、OLAP,及ML

通过增加或减少任意数量的节点、调整HeatWave集群的大小

REAL-TIMEELASTICRESIZING

AWSRedshift

Snowflake

Onlyscaleto10-15minutequery

theirsizesblackoutandmanual

balancingrequired

。呼W@经天髭

20

挑战#3:人工管理工作耗时严重

人工管理任务消耗资源

•本地部署*

-数据库管理:配置、备份、HA、补丁、安全等

-操作系统管理:安装、打补丁、升级……

-基础设施管理:服务器的购买和维护,存储

-数据中心管理:空间、电源、冷却、灾难恢复等

•云1R务,

-配置:调整数据库的大小

-数据加载:优化加载时间,内存使用,编码,数据放置

-查询执行:性能调优,查询的优先级排序

-失败处理:处理错误恢复的操作

。呼叫’・0经天髭

基于OCI的MySQLDatabaseService

开发、管理、支持,100%由Oracle提供

AutomationMySQLOn-PremisesMySQLDatabaseService

的o

Scaling

的o

Backup

Database。o

SecurityPatch&Upgrade

的o

Provision&Configure

。o

OSSecurityPatch&Upgrade

OS。o

OSInstallation

。e

ServerHardwarePurchase&Maintenance

。o

StorageStoragePurchase&Maintenance

的e

Rack&Space

DataCenter的o

Power,HVAC,Networking

。呼W@经天髭

23

MySQLHeatWave的基于机器学习的安全自动化

ADVISOR

AutoParallelLoading

AutoProvisioningAutoDataPlacement

AutoEncoding

MySQL

Autopilc

Data-driven

Query-driven

MLautomation

AutoScheduling

AutoChangePropagation

AutoErrorRecoveryAutoQueryTimeEstimation

AutoQueryPlanImprovement

AUTOMATED

24

自动部署

机器学习预测内存使用以估计集群大小

HeatWave

nodes

。呼W@经天髭

25

自动部署结果

精度高、效率高,全自动

Adaptivesampling

%

s

£

<0.1%ofdatascannedforprediction

DatasetsTPCH1024GTPCDS1024GCustACustB

Accuracy

inmemory98.4%96.9%98.3%96.9%

prediction

。呼M**&经天髭

26

自动数据放置

系统根据查询预测并显示内存中分区数据的最佳列

运行时预测改进o

)Nodata

movement

Workload-aware

placementkeyso

Nodata

oJmovement

Nodata

Jmovement

。呼w@经天髭

自动数据放置结果

随着模型不断学习,性能提高

Timewith

primarykeyPredictedActual

Datasetimprovementimprovement

placement

TPCH1024332sec26%37%

TPCH4096373sec20%25%

。呼W@经天髭

28

自动改进查询计划

优化器根据前面执行的查询,学习和改进查询计划

Query#1Query#2

AXBXCAXBUD

NodeStatistics

A70

B150

AXB1000

C

AXBXC

Runtimestats

MySQLAutopilotimprovesTPCH,TPCDS24TBperformanceby40%

29

自动调度

预测执行时间并对较短的查询进行优先级排序,以减少总体

等待时间

SCHEDULING

Session1

Session2

Session3

减少混合工作的等待时间

(CLIP+OLAP)

。呼W@经天髭

30

MySQLHeatWave扩展数据管理

重新加载任意数量的数据的时间固定©

Error

x

recoveryd

o

M

Oo

s

p

Restart」

P

P

Oo

I

UpgradeXCD

p

4->o

p

(

Reload

HeatWave

31。呼M**&经天髭

MySQLHeatWave的安全强化

数据处于加密状态

e

8

a

l

o

-sp

o

A

B

m

H

-

32。呼M**&经天髭

高级别的安全性

用于实现额外安全措施的内置服务器功能

•使用密钥生成和数字签名的非对称加密:使用公钥和私钥增加对机密数据的

保护,并实现数字签名来确认签署文档的人的身份。

•数据屏蔽和脱敏:帮助保护私人数据免受外部攻击和恶意员工的攻击。

•数据库防火墙:防止特定于数据库的攻击,如SQL注入。

。呼W@经天髭

33

公有云

MySQL

HeatWave

OPACLGCLOUD

Infrastructureaws/

对每个云进行优化,以提供最佳的性价比

。呼w@经天髭

35

MySQLHeatWaveonAWS

•MySQLHeatWave运行在AWS上,针对AWS基础设施进行了优化

•数据不会离开AWS——节省流量成本,并避免合规性审批

•访问MySQLHeatWave最低的延迟

•与AWS生态系统紧密集成-S3、CloudWatch,PrivateLink

。呼W@经天髭

36

MySQLHeatWave为OLTP提供了比Aurora高10倍的吞吐量

自动化线程池

TPC-C_100W(10G,DatafitsinBufferPool)

7000

(

s

/

SMySQLHeatwave

U5o

O

W00

B

S

U

e4o

-00

l

)

l

n38o

d

-n&2o

o00

q」

l

1

00

AmazonAurora

102420484096

Concurrency

*BenchmarkqueriesarederivedfromtheTPC-Cbenchmarks,butresultsarenotcomparabletopublishedTPC-CbenchmarkresultssincethesedonotcomplywiththeTPC-Cspecifications.

37

性价比对比

比Redshift好7倍、比Snowflake好10倍、比BigQuery好12倍、比Synapse好4倍

4TBTPC-H*

(■Heatwave

M10rodn

E

)■Red5hiH

E2*f«34■

dSnowFlakoe

■GoogleBQ

4003、

■AZUW

OWtjOOl

Onlycomputecostsareconsideredhere

PricingforRedshiftisbasedon1-yearreservedinstance,paidupfront.SnovJIakepriceisbasedonstandardedition

PriceforGoogleBigQueryisbasedonmonthlyflatratecommitment.AzureSynapseisbasedon1-yearreservedpricing

“BenchmarkqueriesarederivedfromtheTPC-Hbenchmarks,butresultsarenotcomparabletopublishedTPC-HbenchmarkresultssincethesedonotcomplywiththeTPC-Hspecifications.

。呼M**&经天髭

38

MySQLHeatWave控制台

MySQLHeatwave

CRACl,eInteractiveUIftData

WorkspdOi

85fmm

-MySQLHot

27%□NwntU

OwnptoOBD«Cc4i_1<»4XML.<MNTEJtMM

□M<r«MCe2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论