医疗大数据解决方案_第1页
医疗大数据解决方案_第2页
医疗大数据解决方案_第3页
医疗大数据解决方案_第4页
医疗大数据解决方案_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-医疗大数据解决方案1第1章概要21.1名词定义3第2章医疗大数据面临的挑战52.1医疗大数据与医院信息系统之间的具有本质的差异52.1.1小问题放大万倍就会大的吓人72.2医疗大数据面临八大难题82.3国家大数据标准工程堪比“两弹一2.4医疗行业的信息系统顶层设计为何难产132.5大数据挖掘中的问题:大数据的关键不在于大而在于如何挖掘132.5.1我国医疗行业每年产生多少数据142.5.2挖掘关系数据库系统所产生的医疗数据非常困难142.5.3仅患者与数据的对应关系就是一个大问题152.6关系数据库理论的致命伤162.6.1关系数据库中的数据在大数据环境中为何变成无意义的数据162.6.2关系数据库系统是一种完全封闭的系统:外来数据无法入住182.6.3关系数据库中的数据与数据系统密不可分192.6.4关系数据库中的数据与数据构造密不可分192.6.5关系数据库中的数据与应用程序密不可分192.6.6关系数据库中的数据一旦脱离相应的系统就成了无意义的数据202.6.7关系数据库无法实现病历信息的构造化存贮202.6.8关系数据库中的数据都是“方言〞,大数据需要的是“普通话〞错误!未定义书签。2.7关系数据库如何处理国家医疗大数据中数万个数据库、数千万*表212.8大数据之梦十年后成真222.8.1信息化社会由概念到比拟成熟用了30多年时间222.8.2千年虫问题的启示232.8.3大数据工程远比千年虫问题复杂232.8.4五年之内〔2021年前〕医疗大数据只是纸上谈兵242.9必须开发新型的软件工具才能对医疗大数据进展高效挖掘24第3章创造专利:医学信息的构造化存贮方法243.1在了解医学信息的构造化存贮方法时的考前须知263.2医学信息的构造化存贮方法273.3数据的完整性是大数据的根本323.3.1大数据的策略:以适当的数据冗余而使数据易识别32-3.3.2一个事物的数据343.3.3事物分类343.3.4关系数据库的缺陷:关系363.3.5数据的可识别性393.3.6数据的多样性413.3.7元数据及国际元数据标准非常重要413.3.8大数据的关键:让数据自己说话423.3.9大数据的策略:用数据代替程序443.4与信息系统的耦合度为零的数据才是合格的大数据453.5医学信息的构造化存贮方法与关系数据库的比照473.6应用医学信息的构造化存贮方法的考前须知483.7超大表化问题:分为多*表483.8关系数据库中的二维表是数据不具独立性的一个根本原因483.9“万能数据构造表〞存放病历信息的例子493.10医学信息的构造化存贮方法实现互联互通非常简单503.11构造化录入病历信息的例子:病症的构造化50第4章独立数据库在医疗大数据方面的优势524.1大数据中最重要的就是查询534.2超大表问题534.2.1自动调整表的长度534.2.2自动查询多*表544.3用独立数据库实现国家医疗大数据的存贮处理554.3.1独立数据库如何处理国家医疗大数据中数十万个数据库、数千万*表554.3.2疾病、病症的相关数据56计出的信息系统所产生的数据都是“同构〞个医疗信息系统所产生的数据,这些数据存贮在数千万*表中,这些系统由不同-据的实际需求,需要对现有的信息系统进展彻-仿大脑记忆、联想的根底上而所提出的一种新型数据构造,可以在同一造、不依靠注释、不依靠应用程序而独立地表达出*种含义。关系数据造、不依靠注释、不依靠应用程序而完整地表达出*种含义。关系数据每一个人,然而在全国范围内,由于人数太多,很多**都有重名现象,因此仅靠**就不能准确无误地识别出每一个人。大数据时代以前的关系--个医院信息系统,这些信息系统所产生的数据存贮医生要想获得患者以往的病史数据,就必须从数据千万*表中查询患者的病件工具,则,从数千万*表中查询数据,即使最优秀的程序员,在目前的技术条-能够数百之百准确地数清楚全球在*段时间内的人数。大家都认为当今的计算机-全国各行各业拥有数千万个信息系统,其中的数千万*表中拥有人的性别这种字部转换为统一的、标准的数据,例如统一为“男〞、“女〞。要把全国数千万**个部门内部分析,涉及到数百万、数千万个信息系统、数-厂家的数据、标准、采集、存储都不一样。因此很多孤岛,更别说整个医疗行业了。各家医院信-准,因此,各医疗机构所产生的数据也各不一样-有一定的作用,然而城中村与**这样的国际化大都市非常不协调。改造**城中村的最正确方案就是推倒重建,局部的修补是没用的。然而要全2.3国家大数据标准工程堪比“两弹一星〞-程量及代价也是非常高昂的。目前的信息系统题,而彻底砸烂小数据建立大数据新环境则-是真正合格的“国家医疗大数据〞,因为,对这--等多个子系统中。各系统来源于不同的生产厂商对数据流向及关联关系的分析不够准确,且很要查询*个患者的医疗数据,最理想的查询方式就是以患者的**号作为查询“患者与数据的对应关系〞这样的问题其实是大数据中的一个非常突出的-NLTZ*YFNLTZ*YFZYFQTFYZYFQTFY2146*三男ID**性别中药费西药费其它费用IDID事物代号事物特征100280事物分类101280事物分类102280事物分类事物特征值体育管理系统教练信息教练根本情况***********三男2021.3.22021.3.22021.3.22021.3.22021.3.22021.3.22021.3.22021.3.22021.3.2超长特征值单位KG-事物分类病历2021.5.3事物分类住院病历2021.5.3事物分类医疗费用2021.5.3**号**********2021.5.3住院号**********2021.5.3*三2021.5.3性别男2021.5.3元2021.5.3西药费元2021.5.3其它费用元2021.5.3所面对的用户只是熟悉关系数据库理论的设计数据库的最终用户所看到的数据是设计人员利据进展解读之后的数据,最终用户并不是直接-在互联网时代、大数据时代,人们逐步发现-万*表。而现有的信息系统都只是小数据信息系统,只能认识自己的系统中的数据、不确定的数据构造,关系数据库无能为力。是无穷的数据、无穷的数据构造,这是关系数据-据库理论中没有“普通话〞的概念,每设计一种-在小数据时代,数据只是在一个单位内部使用,甚至只是在一个单位的*个2.7关系数据库如何处理国家医疗大数据中数万个数据库、数千万*表的数据库,这些数据库中共含有数千万*表,该如何编写一个通用的查询患者病数据库中含有哪些表,这些表〔数千万*表〕的数据构造是什么、这些表之间的其次是数据抽取〔ETL〕,然而要对数十万个数据库中的数千万*表中的数如果*些医疗信息系统中未能使用患者的**号,则,在大数据环境中,患者-2、从数万个HIS系统中的数十万个表中查询是否3、再以**号从数万个HIS系统中查询-年危机〞。缩写为“Y2K〞。是指在*些使用了计算机程序的智能系统〔包括计新年伊始,联合国“国际2000年问题协调中心〞、美国的“国际‘千年虫’-格的国家医疗大数据。真正的合格的国家医-对于同一感觉器官所接收的信号而言,它们的-现互联互通,而关系数据库则无法使病历信他“次序颠倒,大难已在旦夕之间〞。说道-存慈悲之念,戾气所钟,奇祸难测。这般修炼在上面画什么都可以。成年人则因为在长期的以对新的理论、观念就会产生抗拒之心,成年至完全不能承受。例如年轻人容易受西方的那念,但上年纪的人却无论如何也承受不了超前数据构造与*ML中的数据有点相似。医学信息的构造化存贮方法中所用的表简ID**性别年龄职业“医学信息的构造化存贮方法〞以“纵向〞的N〔或N+*〕“医学信息的构造化存贮方法〞以“纵向〞的N〔或N+*〕条记录存贮一个事物的信息:ID事物代号事物特征事物特征值超长特征值单位附件时间人事管理系统员工信息性别年龄职业事物分类事物分类*三男列名列名数据类型Idbigint-事物代号事物特征事物特征值超长特征值单位bigintnvarcharnvarcharnte*tnvarchardatatime“万能数据构造表〞存贮数据的例子:事物代号事物特征事物分类事物分类病案号**号工作单位职务地址年龄入院日期婚否病史采取日期籍贯病史记录日期病情陈述者事物分类事物分类事物分类病案号**号病症病症诱因病症开场时间病案号**号事物分类事物分类事物分类病症开场时间粪便情况病案号**号事物分类事物特征值住院病历患者根本情况19910819-2-215****************石化总厂机械工**市**路1991-8-191991-8-19**省**市1991-8-19汉患者本人住院病历现病历病症19910819-2-215*************寒战腹泻洗澡时着凉1991-8-1619910819-2-215*************住院病历现病历病症详情腹泻1991-8-16晚间3水样便19910626-2-218************住院病历超长特征值单位次-病症详情乳房肿块左乳5*4*4质硬不光滑界限不清活动欠佳无触痛与皮肤粘连外表皮肤呈轻度“桔皮样〞改变事物分类事物分类病症肿块部位肿块大小肿块硬度肿块特点肿块特点肿块特点肿块特点肿块特点肿块特点可以存贮各种各样的数据,对“事物代号、事索引以便查询;当关系数据库中的数据转换到信息的构造化存贮方法把关系数据库表中的一物分配一个唯一的事物代号,关系数据库表的存贮方法所用的表中的“事物特征〞,相应字-“附件〞字段:用来存放图象、附件等信息量比拟大的、不适合转换为个记录存贮一个事物的信息,医学信息的构造化存贮方法只要一*“万能数据构造是统一的、标准的、通用的、万能的,可以存数据,由于*ML是以文本的形式存贮数据,当对数百万个、数据千万个*ML文-度都远远高于用关系数据库或用*ML所建立的电子病历系统和医学知识库。一*“万能数据构造表〞就可以存放各种关系数据库中的任意数据,为了提高系统性能等原因,可用多*“万能数据构造表〞来存贮数据,但这些表的构造假设把N个事物存贮到“万能数据构造表〞中,这N息,同一个记录中的信息就是*个事物的信息,而医学信息的构造化存贮方法则-中,同一类事物的信息存贮到一*表中,这些事物拥有一样的字段。医学信息的不存在异构数据源问题,可用医学信息的构造接口就可以接收各种各样的数据,只要把所接译、加工处理而独立地、准确地、完整地表达出*种完整的含义。-体重身高年龄上面的数据去掉构造后就会失真:上面的数据去掉构造后就会失真:西药费其它费用西药费其它费用2146*三2146*三男事物特征值事物特征值病历住院病历患者根本情况*********************三男事物特征事物分类事物分类事物分类**号住院号性别年龄体重事物代号2021.3.22021.3.22021.3.22021.3.22021.3.22021.3.22021.3.22021.3.22021.3.22021.3.2超长特征值单位KG上表中的数据去掉构造后也不失真:上表中的数据去掉构造后也不失真:280事物分类病历2021.3.2280事物分类住院病历2021.3.2事物分类患者根本情况2021.3.2**号**********2021.3.2-*********************三男2021.3.22021.3.22021.3.22021.3.22021.3.22021.3.2住院号性别年龄体重KG下面的数据即使脱离表构造也能表达出原来的含义:下面的数据即使脱离表构造也能表达出原来的含义:事物代号事物分类事物分类事物分类**号住院号性别西药费其它费用病历住院病历医疗费用*********************三男2021.5.32021.5.32021.5.32021.5.32021.5.32021.5.32021.5.32021.5.32021.5.32021.5.3事物特征值超长特征值单位事物特征上表中的数据取掉构造后也不失真:事物分类病历2021.5.3事物分类住院病历2021.5.3事物分类医疗费用2021.5.3**号**********2021.5.3住院号**********2021.5.3*三2021.5.3性别男2021.5.3元2021.5.3西药费元2021.5.3其它费用元2021.5.3-在独立数据库中,为了使数据具有独立性、中都增加了“信息系统的名称、数据库的名称、据库的名称、表名〞实际上是事物的“分类〞,表名都是非常有用的数据,而在关系数据库中,在关系数据库中,同一类数据放在同一个数据库中、同一*表中。例如有关-父母m下面的表为“订单〞管理系统中的两*表,“订单表〞与“订单明细表〞通要处理数百万*以上构造各不一样的表,则由于表的数量太多,类似上述的“订要搞清楚各*表之间的关系所要花费的精力是非常巨大的。因为这需要由人工而-确定数百万*表的各表之间、各数据之间的关系,而不能让计算机自己发现这种元元0%9元吨0%元瓶-住院号而查,只能通过患者的**号才能查到。针对下表的这种情况,就需要先从HIS系统中的患者根本信息表中查出患者的**号,然后再根据**号而查出门诊或有患者的**号。程序,不依靠任何人为的关系。如果说数据之据构造有关系、与其它表有关系、与应用程序有建立起来的。在独立数据库中,任何两*表之间是没有“关系〞的,数据之间是否有“关系〞不是由表之间的关系来确定,-期女**市蒙古路20号汉-号通、信息共享,就是因为关系数据库系统中工作。小数据只是在*个特定的局部发挥作用,它可以通过隐含的含义而说明自前的医疗信息系统中未使用患者的**号而导致查询患者的影像数据变得非常困门诊号、住院号只是在*家医院内部可识别,在大数据环境中,门诊号、住含有患者**号。-在关系数据库中,是通过数据构造、表之间疗大数据中,但凡有关患者的数据,就必须用全在大数据环境中,数据的独立性、数据的完造,即“万能数据构造〞。因此,对构造化数据-“ETL〞。而独立数据库在设计之初就非常关注元数据的标准化、标准化、统一在的“信息孤岛问题、信息交换问题、数据接口-**市蒙古**橡胶厂B*RQ0HZ*M工人MZ汉ID已NL*B0期女**市蒙古路20号汉通过上述两*表的比照发现,用“万能数据构造表〞所表达的信息是一种完-在计算机中,有程序和数据之分。然而,对据就是程序〞,其含义是:大脑是一个通用的、不可分〞时,要存贮、读取、查询数据就必须编无关时〔或关系很少时〕〞,只要编写一个通用--方法要求各个事物的数据要独立地、准确地、完整地表达出*种含义。在“万能立地、准确地、完整地具有*种含义,这就可以确保一个事物的信息在任何信息“万能数据构造表〞中的数据与数据库系统及相应的应用程序是相互独立“万能数据构造表〞中的数据脱离相应的数据库系统及应用程序后还能保持原系〞,可以完全脱离数据库系统、表构造、-据的完整性、独立性,要尽量少用、甚至不用代理解,会使数据与应用程序的耦合度增高,使数对关系数据库而言,同一*表中的信息为同一类事物的信息,不同类的信息医学信息的构造化存贮方法与关系数据库的比照医学信息的构造化存贮方法与关系数据库的比照关系数据库医学信息的构造化存贮方法跨平台数据交换非常简单,因为“万能数据构造表〞是一*万能表,可以存放任意构造的数据。无论有多少*表,其构造都是一样的,所有的数据都可以放到一个统一的表中。正因如此,用“万能数据构造表〞而建立的数据库系统是一种根本上与数据构造无不存在异构数据问题,所有的数据都是同构的。“万能数据构造表〞可当作标准化的数据构造“万能数据构造表〞是一种万能的数据构造,可以存放所有关系数据库中的任何数据。正因如此跨平台数据交换非常困难,需要进展数据格式转换,具体表现是当数据交换的数量增大时,数据格式转换就成一件非常烦琐的工作。不同的表,其构造不一样。1000种表,就有1000种以上的构造。关系数据库是一种与数据构造密不可分的数据库,正因如此而导致了异构数据源、信息孤岛、信息交换问题。无法解决异构数据问题,甚至可以说关系数据库是异构数据的发源地。无法用关系数据库理论而设计出标准化的数据构造关系数据库中的任何数据都与其数据构造密切相关,关系数据库不能存放无构造的数据,其中的数据也不能脱异构数据数据构造的标准化与数据构造的关系跨平台数据交换数据构造-离相应的数据库而生存。正因如此,离相应的数据库而生存。正因如此,当关系数据库中的数据传送到其它地方时,就会因为没有对应的数据库和数据构造而无法生存。关系数据库中的数据不是独立数据,必须依赖其数据构造而存在,失去了数据构造,就会变成无意义的数据。关系数据中的数据不是完整数据,因为它必须加上其数据构造信息才能成为完整的数据。可以认为它是一种与构造无关的数据构造,虽说它也有构造。“万能数据构造表〞在任何数据库中的构造都一样。“万能数据构造表〞表中的数据具有独立性,即可以独立地表达数据的完整性数据的独立性从理论上而言,医学信息的构造化存贮方法只要用一*表就可以存放各种各对医学信息的构造化存贮方法而言,无论数据库中拥有多少*万能数据构造进展处理,而对于用户而言,就好象只有一*表。在用关系数据库设计信息系统时,不同的设计者在设计同一*表时,所设计-**胡凤工作单位职别**橡胶8厂工人性别女住址**市蒙古路20号事物代号事物特征事物属性事物属性事物属性患者编号安康卡号**号工作单位职别性别年龄入院日期病情陈述者事物属性事物属性事物特征值超长特征值事物特征值住院病历入院病历患者根本情况SH10-19910430Z21***************09*****************橡胶8厂工人女1991/4/30汉本人住院病历入院病历-SHSH10-19910430Z21****************************************主诉怕热5住院病历入院病历SH10-19910430Z21****************************************主诉5患者编号安康卡号**号事物属性病症持续时间事物属性事物属性患者编号安康卡号**号事物属性病症持续时间年年-属性属性病症名称部位病症开场时间持续时间性质程度病症诱因与活动的关系与体位的关系发作频度缓解方式放射部位伴随病症属性值事物特征值事物特征值住院病历入院病历现病史SH01-19950212Z231*三******************************腹痛3天前3阵发性加剧事物特征事物分类事物分类事物分类患者编号安康卡号**号病症开场时间持续时间特点事物代号超长特征值天-1009压痛位置右下腹IDID事物代号事物特征事物特征值1109事物分类住院病历1109事物分类入院病历1109事物分类现病史1109患者编号SH01-19950212Z2311109安康卡号***************1109**号***************1109病症名称胸痛1109病症开场

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论