版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据
医疗&工程建设
演讲人:徐启雄周聪资料收集:宋佳琪马宇寰邢洪达ppt制作:向琪工程管理1101班2014年6月6日PART1大数据在医疗领域的应用outline一、
医疗与大数据的趋势二
、什么是医疗大数据三
、大数据面临的挑战四、
如何管理和利用大数据五、
案例分析六、
总结与展望一、
医疗与大数据的趋势二
、什么是医疗大数据三
、大数据面临的挑战四、
如何管理和利用大数据五、
案例分析六、
总结与展望医疗费用在不断上升
GDP的占比非常高10-19%0-9%趋势分析:
我们正处在医疗行业的一个重要转折点
%
of
population
over
age
60
30+
%
25-29%
20-24%
2050
WW
Average
Age
60+:
21%Source:
United
Nations
“Population
Aging
2002”
全球老龄化
平均年龄60
+:
目前的10%,
到
2050年将达到20%Source:
McKinsey
Global
Institute
AnalysisESG
Research
Report
2011
–
North
American
Health
Care
Provider
Market
Size
and
Forecast
以美国为例:
医疗大数据的价值3千亿美元/年,
相当于每年生成总
值增长0.7%01500010000
50002010
2011
2012
2013
2014
2015趋势分析:我们正处在医疗行业的一个重要转折点
存储的增长
医疗服务产生的数据总量(PB)AdminImagingEMREmailFileNon
Clin
ImgResearch
医疗影像归档一个医疗系统案例的数据
到2020年,
医疗数据将急剧增长到35
Zetabytes,
相当于2009年数据量的44倍
增长Source:
McKinsey
Global
Institute
AnalysisESG
Research
Report
2011
–
North
American
Health
Care
Provider
Market
Size
and
Forecast一、
医疗与大数据的趋势二
、什么是医疗大数据三
、大数据面临的挑战四、
如何管理和利用大数据五、
案例分析六、
总结与展望大数据对于“大数据”(Bigdata)研究机构Gartner给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。4V:Volume(大量)Velocity(高速)Variety(多样)veracity(真实性)/Value(价值性)
1.
制药企业/生命科学3.
费用报销,
利用率
和
欺诈监管2.
临床决策支持
&
其他临床应用
(包括诊
断相关的影像信息)
4.
患者行为/社交网络
医疗大数据简介数据来源包括哪些?我们如何利用大数据创造价值?
(示例)
2.
临床决策支持4.
由生活方式和行为引发的疾病分析
1.
个体化医疗
3.
欺诈监测得以加强McKinsey
Global
Institute
Analysis医疗大数据相关解决方案健康信息服务
新兴的医疗服务
应用数据分析及视觉化处理数据处理/管理分布式平台
老龄社会
肿瘤基因组学
医疗影像分析
医疗影像影像数据处理加速基础医疗服务临床决策支持
类SQL的检索
医疗记录
存储优化个人健康管理
个体化医疗
机器学习
基因数据
安全和隐私一、
医疗与大数据的趋势二
、什么是医疗大数据三
、大数据面临的挑战四、
如何管理和利用大数据五、
案例分析六、
总结与展望大数据的挑战不仅来自于数据量的增长...需要新技术的支持检验结果,
费用数据,
影像,
设备产生的感应数据,
基因数据等数据量••结构化数据,
遵循标准的数据标准(如,HL7)非结构化数据,
如口述、手写、照片、影像等类型实时有效的商业价值基于现有数据库中的数据进行分析,来支持不同种类的业务:如费用及报销、患者病史、归档影像分析、实时临床决策支持(数据分析)•
实时数据分析,而非传统的批量处理分析•
数据以流的方式进入系统,进行抽取和分析
•
对于实时运行中的每个时间节点产生影响,而不是事后处理在传统的解决方案之上,引入新的数据及分析模型和技术,价值速度一、
医疗与大数据的趋势二
、什么是医疗大数据三
、大数据面临的挑战四、
如何管理和利用大数据五、
案例分析六、
总结与展望
传统解决方案
环境ERP,
CRM,
Batch,
OLTP-DBData
Center
Provisioning
Discrete
Virtual
Cloud
–
As
A
Service
HPC关注数据的价值
大数据存储的考虑
传统存储方式
大规模分析
–
Hadoop*
海量数据库
–
Hive*
大规模备份
–
Lustre*
数据源
文本-语音-视频-传感器
Requesting
Or
M2M
通讯
批量
–
商业应用丰富的视觉化效果–
安全的数据分析和缓存边缘服务器(Edge)
分析
同步
端到端
Machine-to-Machine
Source-to-Source
可行的解决方案体系(示例)
Applications
&
ServicesVisualization
–
File
Structure
&
Analytical
Tools
Data
Delivery,
Operational
&
Graphical
Analytics
Data
Management
&
Computational
Analytics
Compute
–
Storage
&
Infrastructure
Platforms高效的大数据访问途径
(客户端)“Know
Me”“Free
Me”“Express
Me”智能手机移动医疗助理平板电脑笔记本,Ultrabook™其他设备台式机数字标牌自助终端
Mobility
Vital
sign,
I
&
O
entry
Medication
administration
Template
data
entry
Free-format
text
data
entry
Large
diagnostic
images
Data
inquiry
Manageability“Link
Me”大数据在中国医疗行业中的应用模式1.制药企业/生命科
学
3.费用报销,
利用
率
和
欺诈监管2.临床决策支持
&其他临床应用
(包括诊断相关的影像
信息)
4.患者行为/社交
网络•药品研发对药品实际
作用进行分析;实施药品市场预测•基因测序•分布式计算加快基因测序计算效率
•公共卫生实时统计分析
发现公共卫生疫情及公民健康
状况
•新农合基金数据分析
及时了解基金状况,预测风险
辅助制定农合基金的起付线,
赔付病种等
•基本药物临床应用分析
分析基本药物在处方中的比例•临床数据比对匹配同类型的病人,用药•临床决策支持利用规则和数据实时分析给出智能提示•远程监控采集并分析病人随身携带仪器数据,给出智能建议•人口统计学分析对不同群体人群的就医,健康数据实施人口统计分析•了解病人就诊行为发现病人的特定就诊行为,分配医疗资源一、
医疗与大数据的趋势二
、什么是医疗大数据三
、大数据面临的挑战四、
如何管理和利用大数据五、
案例分析六、
总结与展望案例分享:
Regional
Health
Info
Network
–
ChinaReal-time
Clinical
Decision
Support•
实时的医疗数据处理(电子健康档案,医
疗影像数据),支持医疗协同、临床决策
支持和公共卫生管理•
采用
Hadoop*
(HBase*/Hive*)来实现医
疗数据分析和处理•
未来将扩展到不同领域、不同区域/地区
(包括数据交换、处理和分析)•
与本地的软件厂商及OEM厂商进行了广泛
合作•
技术挑战
–
Hadoop
(HBase/Hive)与传统关系型数据库如何有效结合–大数据在区域卫生信息平台中的切实可行
应用场景PublicHealthHospitalPrimary
care(Grassroots)
HealthInformation
DW
EHR
Data
&ServicesRegistries
Data
&
ServicesLongitudinal
Record
Services
Health
Information
Access
LayerCare
CoordinationClinical
decision
support…Data
AnalyticR&D…RHIN
Ancillary
Data
&
Services分布式数据服务系统
展现层
(报告,
视图)区域医疗及基层医疗信息系统大数据解决方案(Hadoop*)
集成的用户应用界面(居民、医生、卫生行政管理人员)
数据挖掘(Mahout)分布式批量处理框架
(Map/Reduce)区域卫生信息访问层(HIAL)医院信息系统医院信息系统语言和编译
(Hive)
实时数据库
(Hbase)基层医疗信息系
统医疗服务药品管理新农合医疗保
险服务器虚拟
化
基础设施虚拟化网络虚拟化
存储虚拟化基于云的区域基层医疗服务系统
多租户应用
分布式文件系统
协作
服务
(HDFS)
(Zookeeper)结构化数据采集器
日志数据采集器
(Sqoop)
(Flume)
健康档案数据存储公共卫生运营管理Sequencing
3
Billion
Base
Pairs
Data
ProcessingCloud
Storage
Visualization
Millions
of
VariantsInterpretation
&
Analytics
Millions
of
Variants
Millions
of
Patients
Commercializing
Targeted
Therapeutics
Companion
DiagnosticsActionable
Biomarkers案例分享:
NEXTBIO基因数据分析••••Cost
to
sequence
a
genome
has
fallen
by800x
in
the
last
4
yearsEach
genome
has
~4
million
variantsGrowth
in
the
genomics
data
in
the
publicand
private
domainData
available
in
variety
of
sources–Structured,
semi-structured,
unstructured•New
aggregated
data
growingexponentially案例分享:NEX帅TBI庭O病人相关恐性数据Nove调lDis渐cov园eri径esBiom氏arke奥rsDise今aseMec搜han抵ismDru湖gIndi林cati冲onsCli伍nic棋alTri侨alPar罗ame肾ter柄sPati熄entCar微eOpt狗ion僚sLarg构econt题entrepo州sito校ryofpub秤licandpriv桶ategen而omi成cdatacom置bin奏edwithpro亩pri吸eta翻ryandpat赵ent艰edcorr推elat垒ionengi乎ne案例分享:NEXT党BIONext惯bio&Int粮el合作方吗向技术挑战:••••Immu睡tabl稍eDat厉a–wri免teonc窝e,neve贸rchan悬ge,rea乓dmanytim伴esTrad弦itio善nalBloo恐mFil段ter隙swork蛙sHado预op*&HBas假e*wel禾lsuit好ed1geno明me10mil奋lio糊nrow决s100gen腥ome笋s1bil鸣lionrows1Mgen果ome武s10tril轨lionrow券s100Mgen缓ome坏s1qua姑dri嘴lli镜on1,0峰00,已000掩,00规0,0窄00,郑000rowsAppcandyn市ami玻cal帆lypart街itio份nsHBas曲easdat卵asizegro界ws英特尔兽对于Hado岭op提供的颗优化:••••Opti君mize毒dHado患opsta敌ckinopensou越rceSta随bil织izeHBas妄etoprov蜡idereli钱ablescal爹abledep镰loy妇men意tOpti职mizeandsupp慢ortscal暗e-ou悼tasdat衫asiz护edram勾atic瓶allygrow浇sExp敬lor料ingclu庙ste溜raut诵otuni松ng,Secu秤rity&Comp坛lian脱ce,etc.案例分蚕享:Kais凯erPerm息anen辨te大数据应遗用数据的发加展趋势结构化数呼据80%非结构化虚数据•••全世界80%的数据驱是非结如构化的(大量的伟移动终端设紫备,机器产生窗的数据)在未来挤十年,偿数据将呜迎来44倍的增覆长(35zet削tab肝yte笼sby202惠0)主要的数驻据增长来自于非结构泉化数据(在线的归档数圆据,医疗影像矛,在线视频扇和存储,照片等)••全球数据勉的构成•••Kai坦ser到的数据兄中,90%是非结互构化的(80%的EH妙R和影巡寿像数据庸)在未来十药年,数据舞将会有25倍的增长(On拳eexab灿yteby202乌0)主要的数雀据增长来自于非结构坟化数据(医疗影像,视频,文本,音频等)•信息给实时个性赛化医疗服量务带来了可吩能性•(Re芝qui抢resCon川tex坊tua择l–devi元ce,env柏iro纷nme卷nt,spa河tia赶l,Dem乏ogr奋aph活ics绩,Soci秩alandBeha移vior亩alpro粱fil贡esinaddi难tiontomedi镜calinf寄orm仅ati快on)Kai且ser正在评维估大数殿据相关放技术…Kais框er的数猜据构成结构化经数据90%UNST挤RUC歇TUR言ED构化数据DATA非结信息给各行业岭发展带来逃了新一轮挑的机遇(零售,金融,保险,制造,医疗,爱…)各行业个已经开面始采用大数据技粥术用于信息肾提取Sou还rce毒:Kai御serMas好ter•••••Int晒egr缘瑞atebui兄lt/介bou伏ghtRea宽l-t料imePre像dic躁tiv销eAnal论ytic威alSolu伟tion价sorPro恋ces漂sin粘glogi凯cDis絮con圾tin功uou扛sCha虏ngeSAN艇/NA胖SSMP(5$)SAN/胳NASIn-M窜emor疲y(50$)Sha字re-悲Not违hin刘gDis石tri连but敢edStor剩ageandComp亚ute($)Faul读t-to进lera容ntMast价erSl如aveArch辉itec遭turecapa辣bleofwith添stan肉dingpart广ialsyst题emfai土lur所esDataisdist应ribu鼻tedacro葱sspro粉ces玩sin喝gsla礼venod忧esReso犹urce犁scon执tai兆nin趋gdat烂aarenotshar停edMas狂termana狠gesthedatadis刮tri托but敬ion卧,jobsche希duli归ngacro萝sssla杰venod括esandagg出reg氏ati黄ngresu雕ltsetsSla晓ve(榜s)DASSAN弓/NA路SMPP(10$)SAN疾/NA脚SSMP(Dis蛙kCach淋ing,HighSpe茫edNet测wor宇k)(10$)数据平技台计算拦的趋势源–分布式计课算Kai尖serisloo浅kin匙gtoexpl描oitthiscapa棚bili加ty…•Stru拉ctur课ed,Rel返ati扑ona莫lTabu糕larData•Int穷era槽cti缘瑞veQuer左ySup哲por梢t•Real赶-tim亏eAnal茂ytic柔s•SQLTran否sact景ionData•Unst批ruct瓜ured隆,Non-且tabu降larData•Ric掏hAdHocInt仇egr睬ati窃on•Real细-tim乔eAna尘lyt姓ics•UQLALLDat避a大数据平惕台–需求易分析处理的补特性Int言uit安ion(Sim仍ulat要ion,Opti矩miza良tion摆,Stoc把hast小icOpti损miza懒tion杯)Info通rmat娱ion(Sta采ndar弦d&AdHocrep景ort妹ing捏,Que坑ry,Ale册rts恨,Fore肆cast咬ing,Acce狱ss)Int誉err赴oga轧tio颈n(Clu道ster杜ing,Stat拳isti均cal,Qual爽ity,Sema音ntic层s)Int皂egr午ati嫂on(Al畅ign蛛men抢t,Sema禽ntic折s,Com风ple询ten疑ess毙,Qual身ity)Ing利est践ion(Dat驶aMode何l,Meta株dataRef溉ere协nceDat落a,Sto嘉re)Info轰rmat近iondri规vesproc傍essopti逮miza放tion恢swithstr立ate童gicimp僻act逗.Mod狐eli悼ngbusi率nessintu子itio掘nfromdat郑adel停uge论.Abil抹itytomod滥elinf第orm躁ati柜onandtran征siti听onfrommul尚tip盘leacc奇essmet堤hod锋stogen胞era礼tin纠g,sha孔rin斜g,coll最abor杜atin同gandact胜ingonins表igh廉tsany溜tim译e,any接whe此reonanydev杀ice队.Sup律por堂tcur森ren臭tBItoo鸣lsfocu闪sedonstru软ctur饺edinfo带rmat残ion.Buil充d/bu蔽ypac争kag柔eduns撒tru疏ctu烟reddatapro喷ces递sin讨gandana玻lyt贯icstool仁s.Apor刻tfo庙liooftool便stomana柿ge(pro帮file悲,clea功nse,cla菜ssi夏fy,sync捏hron比ize,aggr领egat堵e,inte椅grat趟e,shar五e)ALLtype窄sofdat担a.Aunif肝iedinf否orm躲ati适onsto呆rag脱emet王hod细olo尖gyenab夜linguser烫stoman工agedat电afro窗mALLsou岸rce绢s.数据的里特性数据量(Sen霸sors昨,EMR夜,Clai姜ms,Phar单macy塘,Imag洋es)速度(SLA绵s,Rea彻l-t誉imeDec猫isi夏onSup添por跪t&Cont国extu专alInte赤llig要ence批)类型(St暑ruc颈tur竹ed,Tex欺t,Uns淡tru忧ctu居red检,Doc于ume愧nts如,Ima盟ges能)大数据–界定的标目准DATASIZEDATATYPEDATACLAS回SDATACATA墨LOGDATAVELO糟CIT仓YDATAACCES宪SDATAB雷ASETYPEGiga耐byte很s,Ter崇aby虎tes,Peta壳byte兆sStr修uct巩ure怒d,Sem辟i-S财tru民ctu估red,Unst诵ruct凯uredHum迟anGen难era奴ted葛,Mac沸hin纸eGene载rate冠dTex左t,Imag询e,Aud幻玉io,Vid恒eoBat岩ch,Stre包amin艺gAnal愿ytic脚s,Sea扒rch,Tran防sact磨ion(ACID,BAS贯E)Rela傅tion妖al,Fil称eBas唐ed,Colu策mnar,NoS碗QL,Docu屈ment绢,Gra牵ph,RDFFRAM缎EWO痰RKSANALY汤TICSFin行anc击ial,Com累put轻erVisi果onEngi析ne,Geo举spa恭tia拿l,Mach爹ineLear授ning,Mat恩hem遍ati欠cal,Nat零ura绣lLan法gua迎gePro踩ces苦sin炊g,Neur狗alNetw算orks,Sta牧tis招tic君alMode菌ling,Tim舞e-S革eri则esAna厦lys惯is,Voic子eEngi冷neStan蒙dardRep编ort活ing,AdhocRep落ort堪ing,Quer悦y/Dr懒illdow嗓ns,Ale港rtsFor雀eca俯sti表ng,Sim臣ula虹tio墓ns,Opti春miza门tion,Sto跪cha蛮sti办cOpti垦miza竿tion贤sSERV晨ERARCH威ITE悟CTU叠REDIST历RIB动UTE携DPROC史ESS乒INGSTOR反AGEARCHI剃TECT惑
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度文化遗址场地保护与利用合同协议书3篇
- 专业拓展训练合作合同书2024版版B版
- 2024离婚双方房产分割及过户操作补充合同版B版
- 2024综合授信额度合同及分期贷款细则版B版
- 2025年度厂房租赁及品牌授权合作协议3篇
- 2025年度工业厂房拆除及重建合同范本4篇
- 2025年度商业地产项目场地借用合同样本3篇
- 2025年度数字化工厂搬迁工程合同范本4篇
- 油品基础知识培训课件
- 2024版室内粉刷工作班组劳动协议样本版B版
- GB/T 20840.8-2007互感器第8部分:电子式电流互感器
- GB/T 14864-2013实心聚乙烯绝缘柔软射频电缆
- 品牌策划与推广-项目5-品牌推广课件
- 信息学奥赛-计算机基础知识(完整版)资料
- 发烟硫酸(CAS:8014-95-7)理化性质及危险特性表
- 数字信号处理(课件)
- 公路自然灾害防治对策课件
- 火灾报警应急处置程序流程图
- 耳鸣中医临床路径
- 安徽身份证号码前6位
- 分子生物学在动物遗传育种方面的应用
评论
0/150
提交评论