版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
具有机器学习功能的MySQLHeatwave
徐轶韬
1
②膘嘿膘会重天轮
同
徐轶韬!MySQL
甲骨文公司MySQL解决方案首席工程师\高可用解决方案
从主从复制至『IrmoDBCluster架构
公众号"MySQL解决方案工程师”的内容
卡理学
作者和运营者。Q1|«EVUKHCM
《MySQL高可用解决方案——从主从复制到InnoDBCluster架构》作者
为何在云中使用MySQL?
保持数据库的安全性变得更为困难
快速部署与自动化
有助于改善系统管理与合规性
基础康务外包
有助于减少运营开销
节省成本
节省硬件成本和软件许可证成本
3
为何选择MySQLDatabaseService(MDS)
使用MySQL企业版
・减少数据泄露风险
,满足合规要求
■获取最新的安全更新
■与本地部署的MySQLlOO%兼容
・来自MySQL专家的技术支持
更能节省成本
4
MDS使用MySQL企业版提供云服务
Oracle负责
•备份与恢复
•具有自动故障转移功能的
高可用性
・水平与垂直扩展
•数据库和操作系统补丁
•监视和日志处理
•MySQL企业版中的高级功能
。呼W@经天髭
5
70%与AmazonRDS相比节省成本
MySQLDatabaseService:1YearTCO
100OCPUs,1TBStorage
$212,974
£
MySQLDatabaseService:StandardE3AMD16GB/Core,allregionshavethesameprice.5
AmazonRDS:IntelR516GB/Core,AWSUSEast.$170,244
Azure:MemoryOptimizedIntel20GB/Core,MSAzureUS-East.sN
Google:HighMemoryN1StandardIntel13GB/Core,GCPNorthernVirginia.aJ
<o
Configuration:100OCPUs,1TBStorage.t
s
C
Op
Nn
ro
a_
Eu
<Q
M
O$65,833
O
±30%CostO(/>
@凄天轮
一代云:二代云:
普遍的做法OracleCloudInfrastructure-Wide
架构设计为对租户多
最大程度的隔离和痴
ServerVirtualization
......Hypervisor..........
NetworkVirtualization
HostOS/Kernel
租户之间
7。呼M**&经天髭
MySQLDatabaseService:高可用性
具有自动故障转移和零数据丢失的容错系统
。呼W@经天髭
8
挑战#1:事务处理与分析处理的系统需要分开
MySQL用户需要分别使用OLTP和OLAP系统
传统的行格式没有针对OLAP工作负载进行优化
。呼W@经天髭
10
Oracle云中提供的MySQLHeatwave数据库服务
无需重写查询和ETL、加速OLTP和OLAP工作
1.fMySQL数据库,用于OLTP和
OLAP应用程序
MySQL
Database2.数据分区存储在内存
Service
InnoDBHeatVave
MySQL3.已有的应用程序无需任何更改
My盛
。呼W@经天髭
11
MySQLHeatwave数据库服务架构
。呼W@经天髭
12
HeatWave:实时分析
插入MySQL的数据可以在一秒内进行分析查询
Insert/AnalyticQuery
UpdateQueryResults
It
MySQLDatabaseServiceHeatWaveCluster
MySQLCompiler&Optimizer
Query
OLTPQueryAnalyticQueryPushdown
OptimizationOptimization---->
MySQLExecutionInnoDBA
RealTime
Update
Results
。呼w@经天髭
13
挑战#2:用于机器学习的工具和服务需要分开
需要使用ETL分离数据进行训练与预测
•复杂,耗时
・增加成本和风险当使用其他数据库时,情况会更・
•需要学习新的工具/语言
。呼W@经天髭
15
使用MySQLHeatWave的机器学习
加速ML计划,增加安全性,降低成本
166)呼W会经天髭
HeatwaveML与其他的ML使用方法对比
WithoutMLinMySQL
SensitiveModel/DataBoundary
17
OracleAutoML自动生成一个准确和快速的模型
Cleanse,impute&IdentifytopkFilterrelevantSelectsuitableIdentifyoptimalGenerateModelTrainPredictionTuned
Model
normalizefeaturesalgorithmscolumnssamplehyperparametersexplanationsExplainer
AutoML有多个自动化处理步骤,用于精确预测
•非迭代管道设计
•利用算法和数据集的元数据学习
•智能选择,减少每个阶段的尝试
•根据输入数据集特征选择算法/参数,准确率更高,运行时间更短
・通过使用元数据学习实现
•可扩展设计
•所有阶段都利用了节点间和节点内的并行性,减少了运行时长
。呼W@经天髭
18
HeatWaveMLvsRedshiftML:基准测试
/产生更准确的结果
,训练模型平均速度快25倍
/1%的成本
/添加更多模型时可以扩展
基准测试详细内容:https:〃www.oracle,com/myscil/hcatwave/performance/
。呼W@经天髭
19
零宕机时间OLTP、OLAP,及ML
通过增加或减少任意数量的节点、调整HeatWave集群的大小
REAL-TIMEELASTICRESIZING
AWSRedshift
Snowflake
Onlyscaleto10-15minutequery
theirsizesblackoutandmanual
balancingrequired
。呼W@经天髭
20
挑战#3:人工管理工作耗时严重
人工管理任务消耗资源
•本地部署*
-数据库管理:配置、备份、HA、补丁、安全等
-操作系统管理:安装、打补丁、升级……
-基础设施管理:服务器的购买和维护,存储
-数据中心管理:空间、电源、冷却、灾难恢复等
•云1R务,
-配置:调整数据库的大小
-数据加载:优化加载时间,内存使用,编码,数据放置
-查询执行:性能调优,查询的优先级排序
-失败处理:处理错误恢复的操作
。呼叫’・0经天髭
基于OCI的MySQLDatabaseService
开发、管理、支持,100%由Oracle提供
AutomationMySQLOn-PremisesMySQLDatabaseService
的o
Scaling
的o
Backup
Database。o
SecurityPatch&Upgrade
的o
Provision&Configure
。o
OSSecurityPatch&Upgrade
OS。o
OSInstallation
。e
ServerHardwarePurchase&Maintenance
。o
StorageStoragePurchase&Maintenance
的e
Rack&Space
DataCenter的o
Power,HVAC,Networking
。呼W@经天髭
23
MySQLHeatWave的基于机器学习的安全自动化
ADVISOR
AutoParallelLoading
AutoProvisioningAutoDataPlacement
AutoEncoding
MySQL
Autopilc
Data-driven
Query-driven
MLautomation
AutoScheduling
AutoChangePropagation
AutoErrorRecoveryAutoQueryTimeEstimation
AutoQueryPlanImprovement
AUTOMATED
24
自动部署
机器学习预测内存使用以估计集群大小
HeatWave
nodes
。呼W@经天髭
25
自动部署结果
精度高、效率高,全自动
Adaptivesampling
%
s
£
<0.1%ofdatascannedforprediction
DatasetsTPCH1024GTPCDS1024GCustACustB
Accuracy
inmemory98.4%96.9%98.3%96.9%
prediction
。呼M**&经天髭
26
自动数据放置
系统根据查询预测并显示内存中分区数据的最佳列
运行时预测改进o
)Nodata
movement
Workload-aware
placementkeyso
Nodata
oJmovement
Nodata
Jmovement
。呼w@经天髭
自动数据放置结果
随着模型不断学习,性能提高
Timewith
primarykeyPredictedActual
Datasetimprovementimprovement
placement
TPCH1024332sec26%37%
TPCH4096373sec20%25%
。呼W@经天髭
28
自动改进查询计划
优化器根据前面执行的查询,学习和改进查询计划
Query#1Query#2
AXBXCAXBUD
NodeStatistics
A70
B150
AXB1000
C
AXBXC
Runtimestats
MySQLAutopilotimprovesTPCH,TPCDS24TBperformanceby40%
29
自动调度
预测执行时间并对较短的查询进行优先级排序,以减少总体
等待时间
SCHEDULING
Session1
Session2
Session3
减少混合工作的等待时间
(CLIP+OLAP)
。呼W@经天髭
30
MySQLHeatWave扩展数据管理
重新加载任意数量的数据的时间固定©
Error
x
recoveryd
o
M
Oo
s
p
Restart」
工
P
P
Oo
I
UpgradeXCD
p
4->o
p
(
一
Reload
HeatWave
31。呼M**&经天髭
MySQLHeatWave的安全强化
数据处于加密状态
e
8
a
l
o
-sp
o
A
B
m
H
-
32。呼M**&经天髭
高级别的安全性
用于实现额外安全措施的内置服务器功能
•使用密钥生成和数字签名的非对称加密:使用公钥和私钥增加对机密数据的
保护,并实现数字签名来确认签署文档的人的身份。
•数据屏蔽和脱敏:帮助保护私人数据免受外部攻击和恶意员工的攻击。
•数据库防火墙:防止特定于数据库的攻击,如SQL注入。
蕾
。呼W@经天髭
33
公有云
MySQL
HeatWave
OPACLGCLOUD
Infrastructureaws/
对每个云进行优化,以提供最佳的性价比
。呼w@经天髭
35
MySQLHeatWaveonAWS
•MySQLHeatWave运行在AWS上,针对AWS基础设施进行了优化
•数据不会离开AWS——节省流量成本,并避免合规性审批
•访问MySQLHeatWave最低的延迟
•与AWS生态系统紧密集成-S3、CloudWatch,PrivateLink
。呼W@经天髭
36
MySQLHeatWave为OLTP提供了比Aurora高10倍的吞吐量
自动化线程池
TPC-C_100W(10G,DatafitsinBufferPool)
7000
(
s
/
SMySQLHeatwave
U5o
O
W00
B
S
U
e4o
-00
l
)
l
n38o
d
-n&2o
o00
q」
l
1
00
AmazonAurora
102420484096
Concurrency
*BenchmarkqueriesarederivedfromtheTPC-Cbenchmarks,butresultsarenotcomparabletopublishedTPC-CbenchmarkresultssincethesedonotcomplywiththeTPC-Cspecifications.
37
性价比对比
比Redshift好7倍、比Snowflake好10倍、比BigQuery好12倍、比Synapse好4倍
4TBTPC-H*
(■Heatwave
M10rodn
E
)■Red5hiH
E2*f«34■
dSnowFlakoe
■GoogleBQ
4003、
■AZUW
OWtjOOl
Onlycomputecostsareconsideredhere
PricingforRedshiftisbasedon1-yearreservedinstance,paidupfront.SnovJIakepriceisbasedonstandardedition
PriceforGoogleBigQueryisbasedonmonthlyflatratecommitment.AzureSynapseisbasedon1-yearreservedpricing
“BenchmarkqueriesarederivedfromtheTPC-Hbenchmarks,butresultsarenotcomparabletopublishedTPC-HbenchmarkresultssincethesedonotcomplywiththeTPC-Hspecifications.
。呼M**&经天髭
38
MySQLHeatWave控制台
MySQLHeatwave
CRACl,eInteractiveUIftData
WorkspdOi
85fmm
-MySQLHot
27%□NwntU
OwnptoOBD«Cc4i_1<»4XML.<MNTEJtMM
□M<r«MCe2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 统编版五年级语文上册第三次月考综合测试卷(含答案)
- 2024至2030年中国带水放管排污孔行业投资前景及策略咨询研究报告
- 2024至2030年中国蚬子肉数据监测研究报告
- 2024至2030年中国自动杀菌机行业投资前景及策略咨询研究报告
- 2024至2030年中国空气分配箱数据监测研究报告
- 2024至2030年中国水处理材料行业投资前景及策略咨询研究报告
- 2024至2030年中国新一代料斗式塑料干燥机数据监测研究报告
- 03岁婴儿生活护理
- 国家科研经费使用培训
- 会计职业生涯规划
- 铁道运输职业生涯规划书
- 天津美术馆分析报告
- 《PLC技术基础、PLC技术及应用》期末考试B卷
- 大肠杆菌耐药机制探究
- 跨境电商方案的可行性报告
- 职业生涯规划大赛公务员
- 【企业应收账款管理探究文献综述2600字】
- 生产工艺中的工艺参数优化与调整
- 《人文地理学》课件
- 2023银行业经营战略报告-存量时代的用户洞察与增长机会-2023.11
- 隧道劈裂施工方案
评论
0/150
提交评论