大数据在医疗行业的应用2_第1页
大数据在医疗行业的应用2_第2页
大数据在医疗行业的应用2_第3页
大数据在医疗行业的应用2_第4页
大数据在医疗行业的应用2_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据

医疗&工程建设

演讲人:徐启雄周聪资料收集:宋佳琪马宇寰邢洪达ppt制作:向琪工程管理1101班2014年6月6日PART1大数据在医疗领域的应用outline一、

医疗与大数据的趋势二

、什么是医疗大数据三

、大数据面临的挑战四、

如何管理和利用大数据五、

案例分析六、

总结与展望一、

医疗与大数据的趋势二

、什么是医疗大数据三

、大数据面临的挑战四、

如何管理和利用大数据五、

案例分析六、

总结与展望医疗费用在不断上升

GDP的占比非常高10-19%0-9%趋势分析:

我们正处在医疗行业的一个重要转折点

%

of

population

over

age

60

30+

%

25-29%

20-24%

2050

WW

Average

Age

60+:

21%Source:

United

Nations

“Population

Aging

2002”

全球老龄化

平均年龄60

+:

目前的10%,

2050年将达到20%Source:

McKinsey

Global

Institute

AnalysisESG

Research

Report

2011

North

American

Health

Care

Provider

Market

Size

and

Forecast

以美国为例:

医疗大数据的价值3千亿美元/年,

相当于每年生成总

值增长0.7%01500010000

50002010

2011

2012

2013

2014

2015趋势分析:我们正处在医疗行业的一个重要转折点

存储的增长

医疗服务产生的数据总量(PB)AdminImagingEMREmailFileNon

Clin

ImgResearch

医疗影像归档一个医疗系统案例的数据

到2020年,

医疗数据将急剧增长到35

Zetabytes,

相当于2009年数据量的44倍

增长Source:

McKinsey

Global

Institute

AnalysisESG

Research

Report

2011

North

American

Health

Care

Provider

Market

Size

and

Forecast一、

医疗与大数据的趋势二

、什么是医疗大数据三

、大数据面临的挑战四、

如何管理和利用大数据五、

案例分析六、

总结与展望大数据对于“大数据”(Bigdata)研究机构Gartner给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。4V:Volume(大量)Velocity(高速)Variety(多样)veracity(真实性)/Value(价值性)

1.

制药企业/生命科学3.

费用报销,

利用率

欺诈监管2.

临床决策支持

&

其他临床应用

(包括诊

断相关的影像信息)

4.

患者行为/社交网络

医疗大数据简介数据来源包括哪些?我们如何利用大数据创造价值?

(示例)

2.

临床决策支持4.

由生活方式和行为引发的疾病分析

1.

个体化医疗

3.

欺诈监测得以加强McKinsey

Global

Institute

Analysis医疗大数据相关解决方案健康信息服务

新兴的医疗服务

应用数据分析及视觉化处理数据处理/管理分布式平台

老龄社会

肿瘤基因组学

医疗影像分析

医疗影像影像数据处理加速基础医疗服务临床决策支持

类SQL的检索

医疗记录

存储优化个人健康管理

个体化医疗

机器学习

基因数据

安全和隐私一、医疗与大数据据的趋势二、什么是医疗大数据据三、大数据面临的挑挑战四、如何管理和利用大大数据五、案例分析六、总结与展望大数据的挑战战不仅来自于于数据量的增增长...需要新技术的的支持检验结果,费用数据,影像,设备产生的感感应数据,基因数据等数据量••结构化数据,遵循标准的数数据标准(如如,HL7)非结构化数据据,如口述、手写写、照片、影影像等类型实时有效的商商业价值基于现有数据据库中的数据据进行分析,,来支持不同同种类的业务务:如费用及报销、、患者病史、、归档影像分分析、实时临临床决策支持持(数据分析)•实时数据分析析,而非传统统的批量处理理分析•数据以流的方方式进入系统统,进行抽取取和分析•对于实时运行行中的每个时时间节点产生生影响,而不不是事后处理理在传统的解决决方案之上,,引入新的数数据及分析模模型和技术,,价值速度一、医疗与大数据据的趋势二、什么是医疗大数据据三、大数据面临的挑挑战四、如何管理和利用大大数据五、案例分析六、总结与展望传统解决方案案环境ERP,CRM,Batch,OLTP-DBDataCenterProvisioningDiscreteVirtualCloud–AsAServiceHPC关注数据的价价值大数据存储的的考虑传统存储方式式大规模分析–Hadoop*海量数据库–Hive*大规模备份–Lustre*数据源文本-语音-视频-传感感器RequestingOrM2M通讯批量–商业应用丰富的视觉化化效果–安全的数据分分析和缓存边缘服务器((Edge))分析同步端到端Machine-to-MachineSource-to-Source可行的解决方方案体系(示示例)Applications&ServicesVisualization–FileStructure&AnalyticalToolsDataDelivery,Operational&GraphicalAnalyticsDataManagement&ComputationalAnalyticsCompute–Storage&InfrastructurePlatforms高效的大数据据访问途径(客户端)“KnowMe”“FreeMe”“ExpressMe”智能手机移动医疗助理平板电脑笔记本,Ultrabook™其他设备台式机数字标牌自助终端MobilityVitalsign,I&OentryMedicationadministrationTemplatedataentryFree-formattextdataentryLargediagnosticimagesDatainquiryManageability“LinkMe””大数数据据在在中中国国医医疗疗行行业业中中的的应应用用模模式式1.制制药药企企业业/生生命命科科学3.费费用用报报销销,利用用率和欺诈诈监监管管2.临临床床决决策策支支持持&其他他临临床床应应用用(包包括诊诊断断相相关关的的影影像像信息息)4.患患者者行行为为/社社交交网络络•药药品品研研发发对药药品品实实际际作用用进进行行分分析析;;实实施药药品品市市场场预预测测•基基因因测测序序•分布布式式计计算算加加快快基基因因测测序序计计算算效率率•公公共共卫卫生生实实时时统统计计分分析析发现现公公共共卫卫生生疫疫情情及及公公民民健健康康状况况•新新农农合合基基金金数数据据分分析析及时时了了解解基基金金状状况况,,预预测测风风险险辅助助制制定定农农合合基基金金的的起起付付线线,,赔付付病病种种等等•基基本本药药物物临临床床应应用用分分析析分析析基基本本药药物物在在处处方方中中的的比比例例•临临床床数数据据比比对对匹配配同同类类型型的的病病人人,,用用药药•临临床床决决策策支支持持利用用规规则则和和数数据据实实时时分分析析给给出智智能能提提示示•远远程程监监控控采集集并并分分析析病病人人随随身身携携带带仪仪器数数据据,,给给出出智智能能建建议议•人人口口统统计计学学分分析析对不不同同群群体体人人群群的的就就医医,,健健康数数据据实实施施人人口口统统计计分分析析•了了解解病病人人就就诊诊行行为为发现现病病人人的的特特定定就就诊诊行行为为,,分配配医医疗疗资资源源一、医疗疗与与大大数数据据的的趋趋势势二、什什么么是医医疗疗大大数数据据三、大大数据据面面临临的的挑挑战战四、、如何何管理理和和利利用用大大数数据据五、、案例例分析析六、、总结结与展展望望案例例分分享享:RegionalHealthInfoNetwork–ChinaReal-timeClinicalDecisionSupport•实时时的的医医疗疗数数据据处处理理((电电子子健健康康档档案案,,医医疗影影像像数数据据)),,支支持持医医疗疗协协同同、、临临床床决决策策支持持和和公公共共卫卫生生管管理理•采用用Hadoop*(HBase*/Hive*)来来实实现现医医疗数数据据分分析析和和处处理理•未来来将将扩扩展展到到不不同同领领域域、、不不同同区区域域/地地区区(包包括括数数据据交交换换、、处处理理和和分分析析))•与本本地地的的软软件件厂厂商商及及OEM厂厂商商进进行行了了广广泛泛合作作•技术术挑挑战战–Hadoop(HBase/Hive)与与传传统统关关系系型型数数据据库如如何何有有效效结结合合–大数数据据在在区区域域卫卫生生信信息息平平台台中中的的切切实实可可行行应用用场场景景PublicHealthHospitalPrimarycare(Grassroots)HealthInformationDWEHRData&ServicesRegistriesData&ServicesLongitudinalRecordServicesHealthInformationAccessLayerCareCoordinationClinicaldecisionsupport…DataAnalyticR&D…RHINAncillaryData&Services分布式数据据服务系统统展现层(报告,视图)区域医疗及及基层医疗疗信息系统统大数据解解决方案(Hadoop*)集成的用户户应用界面面(居民、、医生、卫卫生行政管管理人员))数据挖掘(Mahout)分布式批量量处理框架架(Map/Reduce)区域卫生信信息访问层层(HIAL)医院信息系系统医院信息系系统语言和编译译(Hive)实时数据库库(Hbase)基层医疗信信息系统医疗服务药品管理新农合医疗疗保险服务器虚拟拟化基础设施虚虚拟化网络虚拟化化存储虚拟化化基于云的区区域基层医医疗服务系系统多租户应用用分布式文件件系统协作服务(HDFS)(Zookeeper)结构化数据据采集器日志数据采采集器(Sqoop)(Flume)健康档案数数据存储公共卫生运营管理Sequencing3BillionBasePairsDataProcessingCloudStorageVisualizationMillionsofVariantsInterpretation&AnalyticsMillionsofVariantsMillionsofPatientsCommercializingTargetedTherapeuticsCompanionDiagnosticsActionableBiomarkers案例分享:NEXTBIO基因数据分分析••••Costtosequenceagenomehasfallenby800xinthelast4yearsEachgenomehas~4millionvariantsGrowthinthegenomicsdatainthepublicandprivatedomainDataavailableinvarietyofsources–Structured,semi-structured,unstructured•Newaggregateddatagrowingexponentially案例分享:NEXTBIO病人相关性性数据NovelDiscoveriesBiomarkersDiseaseMechanismDrugIndicationsClinicalTrialParametersPatientCareOptionsLargecontentrepositoryofpublicandprivategenomicdatacombinedwithproprietaryandpatentedcorrelationengine案例例分分享享:NEXTBIONextbio&Intel合作作方方向向技术术挑挑战战:••••ImmutableData–writeonce,neverchange,readmanytimesTraditionalBloomFiltersworksHadoop*&HBase*wellsuited1genome10millionrows100genomes1billionrows1Mgenomes10trillionrows100Mgenomes1quadrillion1,000,000,000,000,000rowsAppcandynamicallypartitionsHBaseasdatasizegrows英特特尔尔对对于于Hadoop提供的优化:••••OptimizedHadoopstackinopensourceStabilizeHBasetoprovidereliablescalabledeploymentOptimizeandsupportscale-outasdatasizedramaticallygrowsExploringclusterautotuning,Security&Compliance,etc.案例分享:KaiserPermanente大数据应用数据的发展趋趋势结构化数据80%非结构化数据据•••全世界80%的数据是非结结构化的(大量的移动动终端设备,机器产生的数数据)在未来十年,,数据将迎来来44倍的增长(35zettabytesby2020)主要的数据增长来自于非结构化数据据(在线的归档数据,医疗影像,在线视频和存存储,照片等)••全球数据的构构成•••Kaiser的数据中,,90%是非结构化的的(80%的EHR和影影像数据)在未来十年,,数据将会有有25倍的增长(Oneexabyteby2020)主要的的数据据增长来自于于非结构构化数数据(医疗影像像,视频,文本,音频等等)•信息给实时个个性化化医疗疗服务务带来了了可能能性•(RequiresContextual–device,environment,spatial,Demographics,SocialandBehavioralprofilesinadditiontomedicalinformation)Kaiser正在评评估大大数据据相关关技术术…Kaiser的的数据据构成成结构化化数据据90%UNSTRUCTURED构化数数据DATA非结信息给各行行业发发展带带来了了新一一轮的的机遇遇(零售售,金融,保险,制造,医疗,…)各行业业已经经开始始采用用大数据据技术术用于信信息提提取Source:KaiserMaster•••••Integratebuilt/boughtReal-timePredictiveAnalyticalSolutionsorProcessinglogicDiscontinuousChangeSAN/NASSMP(5$)SAN/NASIn-Memory(50$)Share-NothingDistributedStorageandCompute($)Fault-tolerantMasterSlaveArchitecturecapableofwithstandingpartialsystemfailuresDataisdistributedacrossprocessingslavenodesResourcescontainingdataarenotsharedMastermanagesthedatadistribution,jobschedulingacrossslavenodesandaggregatingresultsetsSlave(s)DASSAN/NASMPP(10$)SAN/NASSMP(DiskCaching,HighSpeedNetwork)(10$)数据平平台计计算的的趋势势–分布式式计算算Kaiserislookingtoexploitthiscapability……•Structured,RelationalTabularData•InteractiveQuerySupport•Real-timeAnalytics•SQLTransactionData•Unstructured,Non-tabularData•RichAdHocIntegration•Real-timeAnalytics•UQLALLData大数据据平台台–需需求分分析处理的的特性性Intuition(Simulation,Optimization,StochasticOptimization)Information(Standard&AdHocreporting,Query,Alerts,Forecasting,Access)Interrogation(Clustering,Statistical,Quality,Semantics)Integration(Alignment,Semantics,Completeness,Quality)Ingestion(DataModel,MetadataReferenceData,Store)Informationdrivesprocessoptimizationswithstrategicimpact.Modelingbusinessintuitionfromdatadeluge.Abilitytomodelinformationandtransitionfrommultipleaccessmethodstogenerating,sharing,collaboratingandactingoninsightsanytime,anywhereonanydevice.SupportcurrentBItoolsfocusedonstructuredinformation.Build/buypackagedunstructureddataprocessingandanalyticstools.Aportfoliooftoolstomanage(profile,cleanse,classify,synchronize,aggregate,integrate,share)ALLtypesofdata.AunifiedinformationstoragemethodologyenablinguserstomanagedatafromALLsources.数据的特特性数据量(Sensors,EMR,Claims,Pharmacy,Images)速度(SLAs,Real-timeDecisionSupport&ContextualIntelligence)类型(Structured,Text,Unstructured,Documents,Images)大数据–界定的标标准DATASIZEDATATYPEDATACLASSDATACATALOGDATAVELOCITYDATAACCESSDATABASETYPEGigabytes,Terabytes,PetabytesStructured,Semi-Structured,UnstructuredHumanGenerated,MachineGeneratedText,Image,Audio,VideoBatch,StreamingAnalytics,Search,Transaction(ACID,BASE)Relational,FileBased,Columnar,NoSQL,Document,Graph,RDFFRAMEWORKSANALYTICSFinancial,ComputerVisionEngine,Geospatial,MachineLearning,Mathematical,NaturalLanguageProcessing,NeuralNetworks,StatisticalModeling,Time-SeriesAnalysis,VoiceEngineStandardReporting,AdhocReporting,Query/Drilldowns,AlertsForecasting,Simulations,Optimization,StochasticOptimizationsSERVERARCHITECTUREDISTRIBUTEDPROCESSINGSTORAGEARCHITECTURESMP,MMP,Appliance,NAS,SAN,DistributedProcessingCommodityCluster(CC)<1Knodes,CC>1KnodesDirectAccessStorage,SpinningDisks,Flash,SSD一、医疗与与大数数据的的趋

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论