5.2被调查者基本信息实体-国家人口与健康科学数据共享平台_第1页
5.2被调查者基本信息实体-国家人口与健康科学数据共享平台_第2页
5.2被调查者基本信息实体-国家人口与健康科学数据共享平台_第3页
5.2被调查者基本信息实体-国家人口与健康科学数据共享平台_第4页
5.2被调查者基本信息实体-国家人口与健康科学数据共享平台_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE3医药卫生科学数据共享医药卫生科学数据共享<1992年全国肝炎流调数据集>数据模式数据模式描述标准文档文档文档版本:0.5文档编号:XXX医药卫生科学数据共享标准体系课题组2006年3月

修订版历史日期版本说明作者<日/月/年><x.x><详细信息><姓名>

目录[本小节完整列出中所有标题及对应页码。]1 范围 12 参考文档 13 术语与缩略语 13.1 术语 13.1.1 数据集(DataSet) 23.1.2 数据模式DataSchema 23.1.3 概念数据模式ConceptualDataSchema 23.1.4 逻辑数据模式LogicalDataSchema 23.1.5 物理数据模式PhysicalDataSchema 23.1.6 数据模式语言DataSchemaLanguage 23.1.7 实体(Entity) 23.1.8 属性(Attribute): 23.1.9 值域(Domain): 23.1.10 关系(Relation): 23.1.11 主键(PrimaryKey): 33.1.12 外键(ForeignKey) 33.1.13 包(Package): 33.1.14 类(Class): 33.1.15 注释(Comment): 33.1.16 数据元(DataElement): 33.1.17 国家科学数据中心(Scientificdatacenter): 33.1.18 国家科学数据网(Scientificdatanetwork): 33.1.19 主体数据库(Coredatabase): 33.1.20 数据模式字典(DataSchemaDictionary): 33.2 缩略语 44 概述 45 数据集数据模式 55.1 数据模式整体框架 55.2 被调查者基本信息实体 65.2.1 实体信息 65.2.2 实体构成说明 76 一致性测试 9数据模式标准的SQL实现示例(资料性附录) 11数据模式标准的XML实现示例(资料性附录) 12范围本小节说明文档的内容和适用范围。主要内容、作用和意义等等。适用范围(包括领域、部门单位、项目、阶段、人员等等)。[以肝炎流调数据资源实例说明]主要内容、作用和意义以1992年对全国31个省1-59岁病毒性肝炎血清流行病学调查为数据资料和研究对象,进行关于肝炎流调数据集概念数据模型的研究。意义在于通过一整套规范、统一的数据模式描述方法与原则建立肝炎流调数据集的数据模式,保证相关人员对数据集概念、组成、结构、相互关系具有准确的、无歧义的理解。适用范围(包括领域、部门单位、项目、阶段、人员等等)。本数据模式标准适用范围为准备针对该数据资源进行数据集生产和进行交流共享的数据生产部门、数据共享管理部门以及数据共享用户。参考文档本小节列出所有引用到的文档。列举所有参考文档的作者(发布单位)、标题、版本、日期等信息。示例:GB/T18793—2002信息技术可扩展置标语言(XML)1.0[以肝炎流调数据资源实例说明]参考文档的作者(发布单位)、标题、版本、日期等信息列举如下:国家科学数据共享工程标准规范课题组《数据模式描述规则和方法》1.9.7版国家科学数据共享工程标准规范课题组《数据模式标准需求收集文档_模板》1.9.7版国家科学数据共享工程标准规范课题组《数据模式标准文档_模板》1.9.7版1992年中国病毒性肝炎血清流行病学调查数据术语与缩略语本小节给出了相关术语定义和缩略语的含义。[以肝炎流调数据资源实例说明]本标准采用下列缩略语和术语。术语数据集(DataSet)数据集是可以标识的数据的集合,有一定的主题,并且是不能再分。数据集的名称应具备对主题的描述性(如:全国法定传染病月报数据集)。数据集的名称在医药卫生科学数据共享网范围内必须是唯一的。数据模式DataSchema数据的概念、组成、结构、相互关系的总称。从本质上,数据模式反映的是人类对客观世界的主观认知。在具体内容上,数据模式涉及到数据的描述范围、描述的方式和描述的结果。概念数据模式ConceptualDataSchema通过抽象、归纳、概括、分类等各种方法,对客观世界的现象进行概括性的描述,重点是定义客观世界的各种基本实体,并对它们的相互关系进行描述。逻辑数据模式LogicalDataSchema概念数据模式的细化,在逻辑数据模式中,考虑到信息技术实现的因素,需要对概念数据模式进行进一步的分析,并增加各种对象和事件,作为物理数据模式建立的基础,逻辑数据模式和具体实现无关。物理数据模式PhysicalDataSchema逻辑数据模式集合了具体的实现技术后形成的,它和具体的实现技术紧密相关。数据模式语言DataSchemaLanguage用于对数据模式进行分析、构造、表现和记录的语言。实体(Entity)任何可以明确的人、地方、事件、概念、事物。属性(Attribute):描述或标识实体的实体或值。值域(Domain):属性可以取值的范围。值域是单独定义的,用于重用,即多个属性可以使用同一个值域关系(Relation):实体间的关联。主键(PrimaryKey):对取值作出了唯一性限制的一种属性。所有实体实例的该属性取值不会出现重复。通过该键值可以唯一的确定一个实体。在UML中通过设定原型<<PK>>标识为“主键”。外键(ForeignKey)由相关实体的实例指定自身实例的一种属性,是实现一个关系的约束。在UML中通过设定原型<<FK>>标识为“外键”。包(Package):在UML中,用于表示实体的组织。类(Class):对拥有相同的属性、操作、方法、关系和语义的一组对象的描述。在UML中类的图形符号是一个矩形框。其中标注出该类的名称,即为对应实体的名称注释(Comment):附在实体、关系上的标注文字,在UML中注释不具有语义和限制功能。数据元(DataElement):通过定义、标识、表示和值域等一系列属性描述的一个数据单元国家科学数据中心(Scientificdatacenter):属于国家科学数据共享平台的组成部分。以国家部门、行业系统为基础,按不同科学技术领域建立的社会公益型的科学数据主中心以及根据需要设立的科学数据分中心,统称国家科学数据中心;主要负责国家长期布局的公益性、基础性科学数据的汇交、管理、交换与共享服务。国家科学数据网(Scientificdatanetwork):是国家科学数据共享平台的组成部分。面向国家重大科技计划、重点区域以及基础科学领域,基于因特网连接分布于各科研院所、高等院校和国际组织的相关专业数据库,开展数据组织、加工与服务,所构建的物理上分布、逻辑上统一的科学数据网。主体数据库(Coredatabase):依据国际标准、国家标准或行业标准分类体系构建的二级学科及其分支学科的科学数据集,并基于计算机系统运行的数据库。数据模式字典(DataSchemaDictionary):字典形式从名称、定义、英文名称、英文短名、版本标识、状态、来源、注释等多个方面来描述模型中的实体、属性,从而能够严格的对数据模型中的实体和属性作出描述。缩略语UML:统一建模语言,UnifiedModelingLanguage。XML:扩展标记语言,ExtensibleMarkupLanguage。SQL:结构化查询语言,StructuredQueryLanguage。概述本小节概述数据集的基本信息,同时说明了本文档的组织结构和各个章的主要内容。1)概述描述该数据集的基本信息,包括数据集内容、来源、数据量、数据更新方式等。[以肝炎流调数据资源实例说明]数据集信息列表序号字段名称定义填写信息1数据集标识符数据集的唯一标识符<未定>2数据集规模信息数据集的数据量规模3数据集维护信息提供有关数据集的更新数量、更新频率及更新范围的信息历史数据,不进行更新4数据集限制信息提供访问和使用数据集的安全、限制信息5数据集语种数据集使用的语言汉语6数据集联系方对数据集信息负责的单位或个人中国疾病预防与控制中心7数据集创建日期数据集创建的日期8数据集名称数据集名称1992年全国病毒性肝炎流调数据集9数据集版本数据集版本<1.0>10数据集标识信息数据集描述的资源的基本信息11数据集内容信息提供数据内容特征的描述信息12数据集分发信息提供获取资源所需的分发者和分发方式的信息13数据集数据质量信息提供资源质量的总体评价信息14数据集数据表现形式信息数据集信息的数据表示形式15数据集应用模式信息提供有关数据集概念模式的信息2)概述介绍第五章数据集数据模式的基本内容,并说明第五章的组织方式(以数据集为单位,描述其数据模式包含的实体、属性和相互关系)。[以肝炎流调数据资源实例说明]数据模式描述的基本内容包括对1992年全国病毒性肝炎流调数据集的整体数据模式描述。内容组织方式如下:首先介绍整体数据模式(包含UML图),然后分别介绍每一个实体。在介绍每一个实体时,详细介绍该实体的每一个属性;每个实体的介绍循环使用;属性的介绍再每个实体的章节内部循环使用;本文档只进行介绍示范,循环内容以“以此类推”字样表示用户对前面的介绍方式和介绍内容循环使用,进行每一个实体与每一个属性的依次说明。概述第六章一致性测试的基本内容数据集数据模式数据模式整体框架本小节描述数据模式构成,采用UML静态类图形式和文字结合的方式进行描述。1)绘制数据模式构成的整体框架图。[以肝炎流调数据资源实例说明]2)出数据模式的所有实体要求内容包括:序号:为唯一标识数据集而分配的序号。实体名称:简要描述该数据模式所含实体名称。定义:简要描述该实体的定义。[以肝炎流调数据资源实例说明]实体列表序号实体名称定义1被调查者基本信息被调查者个人基本信息以及与调查主题有关的信息2流行病学调查项目对被调查者进行的流行病学调查项目以及调查结果信息3免疫接种信息被调查者有关免疫接种的信息内容4实验室检验项目被调查者的实验室检验项目信息[然后按照实体列表的顺序进行实体说明]被调查者基本信息实体本小节描述XX实体的详细信息,本节内容可以根据需要而循环阐述。实体信息本小节依据该实体的定义和说明信息,填写对应的实体描述字典。规定内容包括:实体描述信息字段可选性描述填写信息实体名称必选实体的标识,一般使用名词表达,通常名称都能反映出实体的属性和特征。被调查者基本信息实体别名可选实体的别名,一般使用名词表达。被调查者基本信息实体英文名称必选实体的英文全称Investigated_Subject_Info短名必选实体的英文名称缩写Investigated_Subject_Info定义必选实体定义的详细描述被调查者个人基本信息以及与调查主题有关的属性信息备注可选和实体相关的其它信息包含调查时间空间信息版本标识必选用于实体的配置管理和控制。0.1状态必选0:讨论版本1:正式版本0实体来源可选说明实体定义的来源,来源包括已有的数据模式标准、已有的信息系统和其它来源。流行病学调查实体构成说明本小节描述该实体构成,采用UML静态类图形式和文字结合的方式进行描述。绘制该实体的UML静态类图[本实例描述如下]2)列出该实体的所有属性列出实体包含的所有属性,内容包括:序号:为唯一标识该属性而分配的序号。属性名称:简要描述该实体所含的属性名称。定义:简要描述该属性的定义。[本实例描述如下]序号名称定义1调查日期调查实施的具体日期2调查地调查实施的地点3检测点号检测点的编号4村号所调查村的编号5家庭号该家庭在该村中的序号6个人号被调查者在该家庭中的序号7血清号抽取血清时由检测点号+村号+家庭号+个人号组合成的编号8家庭应调查人口数被调查家庭成员数9家庭被调查人口数被调查家庭实际被调查的成员数10性别被调查者性别11出生年月被调查者出生年月12户主性质户主的户口性质(城乡)13与户主关系被调查者与户主之间的关系14职业被调查者的职业15民族被调查者的民族16文化程度被调查者的文化程度17即往病毒性肝炎病史患病年龄被调查者既往肝炎病史的发病年龄18现症病毒性肝炎病期长短被调查者现患病毒性肝炎的病期长短然后按照该实体所包含的属性顺序依次进行描述。属性信息本小节依据该属性的定义和说明信息,填写对应的属性描述字典,本节内容可以根据需要而循环阐述。[本实例描述如下]对调查日期、调查地两个属性进行描述如下:调查日期属性信息字段可选性描述填写信息数据元素名称必选属性标识,一般使用名词表达,属性名称能够反映属性的特征。调查日期别名比选属性的别名调查日期英文名称必选属性的英文全称Survey_Date短名必选属性的英文名称缩写Survey_Date定义必选实体定义的详细描述调查实施的具体日期备注可选和实体相关的其它信息版本标识必选用于实体的配置管理和控制。0.1状态必选0:讨论版本1:正式版本0属性来源可选说明属性定义的来源,来源包括已有的数据模式标准、已有的信息系统和其它来源。流行病学调查数据类型名称必选属性的数据类型,选择HL7RIM数据类型TSSQL数据类型可选该属性在关系型数据库中的数据类型,按照结构化查询语言的数据类型表达方式进行描述,例如varchar(100),代表可变长字符串,最大长度单位100个字符。DateTime值域必选属性的取值范围具体的日期安全说明必选说明该属性的安全限制信息,包括访问和使用限制等。专业内部使用调查地属性信息字段可选性描述填写信息数据元素名称必选属性标识,一般使用名词表达,属性名称能够反映属性的特征。调查地别名比选属性的别名调查地英文名称必选属性的英文全称Survey_Place短名必选属性的英文名称缩写Survey_Place定义必选实体定义的详细描述调查实施的具体地点备注可选和实体相关的其它信息版本标识必选用于实体的配置管理和控制。0.1状态必选0:讨论版本1:正式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论