数据仓库实例讲解(共40页).ppt_第1页
数据仓库实例讲解(共40页).ppt_第2页
数据仓库实例讲解(共40页).ppt_第3页
数据仓库实例讲解(共40页).ppt_第4页
数据仓库实例讲解(共40页).ppt_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、LOGO数据仓库实例讲解数据仓库实例讲解基于基于HIS的医院数据仓库的医院数据仓库乐嘉锦内容大纲内容大纲实例介绍实例介绍1体系结构体系结构2模型构建模型构建3 3数据仓库实现数据仓库实现4 4联机分析处理联机分析处理3 5医院数据仓库应用医院数据仓库应用4 6实例介绍实例介绍v医院信息系统医院信息系统( (Hospital Information System) HIS是迄今为止最为复杂的企业级信息系统之一 。 HIS将医院病人就诊的所有科室和医院的职能科室等各个环节有机的连为一个整体,处理医疗事务和管理业务,完成医疗、业务数据的整理和分析。 HIS用于医院各类资源信息的系统整合,以提高医院的

2、事务处理水平。实例介绍实例介绍潜在信息提取优化大量数据HIS在操作型数据库上积累了大量的业务数据,数据项繁杂。收集的海量数据往往被沉淀,变成了难以利用的数据档案。如何快速、准确地从这些数据中提取信息,以便降低成本、优化就诊流程和提高医院工作效率,已成为数字化医院建设的内在原动力。激增的数据资源背后隐藏着许多重要的、有价值的信息。实例介绍实例介绍解决HIS中存在的“数据丰富,但信息贫乏的实际情况。提高利用水平,满足医院管理需要。反映出大量数据之间的关系与差异。对HIS中产生的海量数据进行科学的分析处理。实例介绍实例介绍vHIS功能结构功能结构 按照HIS功能的特点,HIS可划为以财务为核心的医院

3、管理信 息系统和以病人为中心的临床信息系统。医院信息系统HIS门诊管理急诊管理住院管理药品管理病案管理门诊诊疗急诊诊疗住院诊疗财务管理医务管理行政管理查询统计远程医疗医学影像存档与通信系统(PACS)实验室信息系统(LIS)放射信息系统(RIS)HIS功能结构图功能结构图内容大纲内容大纲实例介绍实例介绍1体系结构体系结构2模型构建模型构建3 3数据仓库实现数据仓库实现4 4联机分析处理联机分析处理3 5医院数据仓库应用医院数据仓库应用4 6体系结构体系结构v基于基于HIS的医院数据仓库体系结构的医院数据仓库体系结构v医院数据仓库建设中存在一个关键的争论就是医院数据仓库建设中存在一个关键的争论就

4、是如何规划数据仓库的结构。如何规划数据仓库的结构。v一种观点认为应该采用一种观点认为应该采用“自顶向下自顶向下的整体方的整体方法,一次性地创立整个数据仓库。这种方法不法,一次性地创立整个数据仓库。这种方法不适应中国的医疗界现状。大多数医院并没有配适应中国的医疗界现状。大多数医院并没有配置完整的置完整的IT系统,无法一次性完成整体创立。系统,无法一次性完成整体创立。此外,这种方式也无法适应未来的业务调整。此外,这种方式也无法适应未来的业务调整。v另一种是另一种是“自底向上自底向上的观点,认为可将各种的观点,认为可将各种无关的、迥异的数据集市装配成企业级数据仓无关的、迥异的数据集市装配成企业级数据

5、仓库。这种方法比较适合医院目前的现状。库。这种方法比较适合医院目前的现状。体系结构体系结构v基于基于HIS的医院数据仓库体系结构的医院数据仓库体系结构 医院数据仓库涉及到HIS中业务数据的抽取、转换、装载、数据存取、元数据管理、查询、报表、分析工具和相应的开发方法。体系结构体系结构v基于基于HIS的医院数据仓库体系结构的医院数据仓库体系结构医院数据仓库体系结构医院数据仓库体系结构门诊管理系统药房管理系统住院管理系统数据抽取、净化、载入元数据客户端数据展现客户端分析报表和报告客户端信息发布ETL过程数据质量检查调度控制日志出错处理回溯数据文件交换PDM数据仓库监控运行管理备份与恢复元数据管理内容

6、大纲内容大纲实例介绍实例介绍1体系结构体系结构2模型构建模型构建3 3数据仓库实现数据仓库实现4 4联机分析处理联机分析处理3 5医院数据仓库应用医院数据仓库应用4 6模型构建模型构建v多维数据模型多维数据模型 多维数据模型(又称数据立方体)是数据的集合,并将这些数据组织、汇总到一个由一组维度和度量值所定义的多维结构中,使得用户可以从不同的角度(维度)、通过不同的度量值来观察分析所关心的事实数据,逐步摆脱了对固定报表的依赖。 例如,在分析医院门诊量情况时,决策者感兴趣的对象有时间、科室、职业和门诊量,可以把时间、科室和职业作为维,门诊量作为度量。这样,决策者可以了解某科室某时间段某职业病人的门

7、诊人次。模型构建模型构建v主题域分析主题域分析 医院数据仓库可面向多种主题,进行多方面开发。确定HIS中哪些数据对决策有帮助的关键是进行主题域分析。 根据主题域确定业务主题和维度。模型构建模型构建病人构成病人构成分布分布时间维时间维地区维地区维职业维职业维年龄维年龄维性别维性别维v主题域分析病人构成分布主题主题域分析病人构成分布主题疾病维疾病维模型构建模型构建v主题域分析主题域分析主题域主题域业务主题业务主题维度维度病人治疗方案时间、科室、医生、医嘱、处方、治疗效果等病人分布 时间、科室、地区、职业、年龄、性别等账单门诊账单时间、科室、病人身份、费用类别、病人来源等住院账单时间、科室、病人身份

8、、费用类别、病人来源等处方药品采购 时间、药房、药品、供应商、采购员等药品销售 时间、药房、药品、病人、处方、医生等医院数据仓库部门主题分析医院数据仓库部门主题分析模型构建模型构建v 维度建模技术维度建模技术v 维度建模是数据仓库建模的特殊标准,它是经常应用维度建模是数据仓库建模的特殊标准,它是经常应用于数据仓库的一种逻辑设计技术。与之对应的是数据于数据仓库的一种逻辑设计技术。与之对应的是数据库建模中的实体库建模中的实体-关系关系E-R模型。模型。v 该技术试图采用某种直观的标准框架结构来表现数据,该技术试图采用某种直观的标准框架结构来表现数据,并且允许进行高性能存取。并且允许进行高性能存取。

9、v 在医院进行多维数据分析发现,医院的各类人员正是在医院进行多维数据分析发现,医院的各类人员正是从医生、病人、药品维度等理解业务的,这种模型充从医生、病人、药品维度等理解业务的,这种模型充分反映了用户眼里所认可的业务。分反映了用户眼里所认可的业务。模型构建模型构建v设计事实表和维表设计事实表和维表 根据不同的分析主题,确定描述各个主题中可用于分析与决策支持的相应指标,即多维数据模型的事实表。 根据各个指标的约束因素,确定多维数据模型的各个维。 事实表是多维数据模型的核心,它存放决策者关心的实际业务数据以及多个维度表的键值,这些键的组合构成事实表的主键。 维度表存放了维的键值及描述键值的其它非健

10、属性。模型构建模型构建v 构造多维数据模型星型模式,病人分布主题为例构造多维数据模型星型模式,病人分布主题为例病人构成事实表病人构成事实表时间代码地区代码性别代码职业代码年龄代码疾病代码病人数量时间维时间维*时间代码时间(年、季度、月、周、日)性别维性别维*性别代码性别疾病维疾病维*疾病代码疾病名称疾病类别地区维地区维*地区代码地区名称职业维职业维*职业代码职业类别年龄维年龄维*年龄代码年龄年龄范围年龄描述模型构建模型构建v 构造多维数据模型雪花模式,医疗业务主题为例构造多维数据模型雪花模式,医疗业务主题为例医疗业务事实表医疗业务事实表病人代码医疗业务代码账单代码处方代码床位代码诊疗时间时间维

11、时间维当前日期日序号月序号年序号处方维处方维处方代码药品名称账单维账单维账单代码病人代码床位维床位维床位代码床位位置床位占用事实表床位占用事实表床位代码病人代码病人维病人维病人代码病人姓名医疗业务维医疗业务维医疗业务代码医疗业务名称资金流动事实表资金流动事实表账单代码病人代码病人流动事实表病人流动事实表病人代码挂号时间取药时间内容大纲内容大纲实例介绍实例介绍1体系结构体系结构2模型构建模型构建3 3数据仓库实现数据仓库实现4 4联机分析处理联机分析处理3 5医院数据仓库应用医院数据仓库应用4 6数据仓库实现数据仓库实现v技术方案技术方案数据透视表服务数据仓库数据仓库框架框架数据转换数据转换服务

12、服务DTSDTS在线分析服在线分析服务务(Analysis(Analysis Services ServicesSQL Server数据数据仓库组件仓库组件采用SQL Server 2000实现HIS数据仓库知识库知识库数据仓库实现数据仓库实现v开发数据仓库环境的四个相互别离的独特构件开发数据仓库环境的四个相互别离的独特构件v操作型源系统即操作型源系统即HIS、PACS等系统。等系统。v数据聚集环节主要是清理建立一致维度,如病数据聚集环节主要是清理建立一致维度,如病人维度、医生维度、时间维度等。人维度、医生维度、时间维度等。v数据展示环节主要是确定面向主题的数据集市,数据展示环节主要是确定面向

13、主题的数据集市,如挂号业务和处方业务等,通过一致的维度集如挂号业务和处方业务等,通过一致的维度集成各个数据集市。成各个数据集市。v数据存取工具主要是各种分析报表和数据挖掘,数据存取工具主要是各种分析报表和数据挖掘,如数据透视效劳、如数据透视效劳、Web查询等。查询等。数据仓库实现数据仓库实现1创建数据准备区。数据准备区的创建可以采用SQL Server2000中的数据库与表创建工具实现。3从业务系统提取数据。在SQL Server2000中可以使用Transact-SQL, DTS、分布式查询、命令行应用程序、BCP实用工具及BULK Insert语句和ActiveX脚本实现数据的提取。2创建

14、数据仓库。数据仓库的创建同样可以采用SQL Server2000中的数据库与表创建工具实现。4清理和转换数据,完成数据加载。在SQL Server2000中可以使用Transact-SQL,DTS、命令行应用程序及ActiveX脚本实现数据的清理和转换。可以使用Transact-SQL,DTS和BCP实现数据的加载。v数据仓库物理实现数据仓库物理实现数据仓库实现数据仓库实现应用实施应用实施ETL过程过程确定物理模型确定物理模型确定逻辑模型确定逻辑模型分析应用需求,提供数据服务分析应用需求,提供数据服务利用DTS工具,子系统数据通过抽取转换加载到仓库中 面向医院某个业务主题建立物理数据库业务主题

15、分析,构建事实表和维表。业务主题分析,构建事实表和维表。v数据仓库实现流程分析数据仓库实现流程分析内容大纲内容大纲实例介绍实例介绍1体系结构体系结构2模型构建模型构建3 3数据仓库实现数据仓库实现4 4联机分析处理联机分析处理3 5医院数据仓库应用医院数据仓库应用4 6联机分析处理联机分析处理v多维数据集的联机分析处理多维数据集的联机分析处理 基于多维数据集的OLAP是将数据想象成多维的立方体,通过对多维数据集进行切片、切块、聚合、钻取、旋转等一系列操作,进行数据剖析,使用户从多种维度、多个侧面或多种数据综合度查看数据,掌握数据背后蕴含的规律。联机分析处理联机分析处理v数据切片数据切片v在科室

16、维中选择在科室维中选择“消化内科消化内科,那么可形成在,那么可形成在科室维上的数据切片,显示消化内科各年的病科室维上的数据切片,显示消化内科各年的病人分布情况。如果科室维取值为人分布情况。如果科室维取值为“消化内科消化内科,时间维取值为时间维取值为2003年第二季年第二季(Q2),那么得到一,那么得到一个数据切块查询语句如下个数据切块查询语句如下:v SELECT measures.病人数量病人数量 on columns,职业类别职业类别.v members on rows FROM病人构成分布病人构成分布WHERE (时间时间.2003.v Q2,科室科室.消化内科消化内科)联机分析处理联机

17、分析处理v数据切块数据切块v查询结果显示查询结果显示2003年第二季度消化内科的各职年第二季度消化内科的各职业病人分布情况。假设对更多的维进行切块,业病人分布情况。假设对更多的维进行切块,那么在那么在WHERE后面的条件中增加维设置,从后面的条件中增加维设置,从而完成更复杂的查询需求。而完成更复杂的查询需求。联机分析处理联机分析处理v数据钻取和数据聚合数据钻取和数据聚合 维度是具有层次性的,如时间维度层次结构的顶层可以是年,下一层是季度,然后是月、周,最后位于层次结构底层的是日。 维度的层次实际上反映了数据的综合程度。数据钻取就是从较高的维度层次下降到较低的维度层次上来观察多维数据。联机分析处

18、理联机分析处理v数据钻取和数据聚合数据钻取和数据聚合科室科室第第1季度季度第第2季度季度第第3季度季度第第4季度季度消化内科1264138715121226呼吸内科105513269171265表1 2021年各季度各科室病人分布情况表2 2021年各季度各月各科室病人科室科室第第1季度季度第第2季度季度第第3季度季度第第4季度季度1月2月3月4月5月6月4月5月6月4月5月6月消化内科367403494517483387467530515462397367呼吸内科303415427465487375353286278390412473联机分析处理联机分析处理v数据钻取和数据聚合数据钻取和数据

19、聚合 表1显示了每年每季度各科室的病人分布情况,层次是季度,如果选择时间维向下钻取,得到表2,显示每年每季度每月各科室的病人数量。 数据聚合是数据钻取的逆操作,是对数据进行高层次综合的操作。如由表2选择时间维向上聚合,可得到表1。联机分析处理联机分析处理v数据旋转数据旋转 数据旋转。数据旋转改变维度的位置关系,使决策者可以从多角度来观察。如将横向的时间维和科室维进行交换,从而形成横向为科室、纵向为时间的报表。内容大纲内容大纲实例介绍实例介绍1体系结构体系结构2模型构建模型构建3 3数据仓库实现数据仓库实现4 4联机分析处理联机分析处理3 5医院数据仓库应用医院数据仓库应用4 6医院数据仓库应用

20、医院数据仓库应用v病人结构分析病人结构分析v可以按照性别、年龄、文化程度等对病人进行可以按照性别、年龄、文化程度等对病人进行分类,根据每项分类,系统将对病人的经济状分类,根据每项分类,系统将对病人的经济状况、需求特征和购置行为进行分析,从而得到况、需求特征和购置行为进行分析,从而得到不同性别、不同年龄、不同文化程度病人的经不同性别、不同年龄、不同文化程度病人的经济水平、需求状况及主要医疗效劳类型等信息。济水平、需求状况及主要医疗效劳类型等信息。v根据这些信息,医院管理者可以分析病人差异根据这些信息,医院管理者可以分析病人差异对医院收益的影响,帮助医院进行市场定位、对医院收益的影响,帮助医院进行

21、市场定位、确定营销策略,从而使医院的经营活动更具主确定营销策略,从而使医院的经营活动更具主动性和目的性。动性和目的性。医院数据仓库应用医院数据仓库应用v资金流动分析资金流动分析v针对医院的资金流动状况,按不同的时间维度针对医院的资金流动状况,按不同的时间维度(包括按年综合、按旬综合、按月综合、按日包括按年综合、按旬综合、按月综合、按日综合综合)对医院的各种资金流动情况进行分析,对医院的各种资金流动情况进行分析,进行资金的同期比照动态分析,门诊和住院收进行资金的同期比照动态分析,门诊和住院收入因素分析,并以各种专业报表、查询结果的入因素分析,并以各种专业报表、查询结果的形式反映给决策者。形式反映给决策者。医院数据仓库应用医院数据仓库应用v病人流动状况分析病人流动状况分析v根据门诊病人从挂号到取药在医院逗留的时间根据门诊病人从挂号到取药在医院逗留的时间进行时间数列动态分析,掌握影响病人诊疗效进行时间数列动态分析,掌握影响病人诊疗效率的因素,帮助医院管理者进行业务流程的更率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论