第十四章人类复杂ub疾病与计算系统生物学演示文稿_第1页
第十四章人类复杂ub疾病与计算系统生物学演示文稿_第2页
第十四章人类复杂ub疾病与计算系统生物学演示文稿_第3页
第十四章人类复杂ub疾病与计算系统生物学演示文稿_第4页
第十四章人类复杂ub疾病与计算系统生物学演示文稿_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十四章人类复杂ub疾病与计算系统生物学演示文稿本文档共65页;当前第1页;编辑于星期三\14点29分第一节引言人类常见病,包括肿瘤、心脑血管病、代谢系统疾病、神经系统疾病、精神和行为异常等绝大多数都是复杂性疾病。复杂疾病与单基因缺陷性遗传病不同,不符合孟德尔定律,疾病的发生发展涉及复杂的生物学过程,是21世纪生物医学重大的挑战之一。Introduction本文档共65页;当前第2页;编辑于星期三\14点29分虽然我们积累了大量的资料和数据,亦取得众多研究成果,但对复杂疾;病本质的认识还相距甚远。但是生物科学、计算机技术的迅速发展为我们研究复杂疾病提供了崭新的契机。本文档共65页;当前第3页;编辑于星期三\14点29分组学和系统生物学的不断发展为我们从分子水平的多层面去研究复杂疾病提供了有力的条件,也使得医学进入了崭新的时代。本文档共65页;当前第4页;编辑于星期三\14点29分本章的主要内容复杂疾病相关的基本概念和知识几个常用的复杂疾病知识库复杂疾病研究的系统生物学方法本文档共65页;当前第5页;编辑于星期三\14点29分第二节复杂疾病概述疾病是机体在一定病因的损害作用下,因机体自稳调节(homeostasis)紊乱而发生的异常生命活动过程。多数疾病,机体对病因所引起的损害发生一系列抗损害反应;自稳调节的紊乱,损害和抗损害反应,表现为疾病过程中各种复杂的机能、代谢和形态结构的异常变化,而这些变化又可使机体各器官系统之间以及机体与外界环境之间的协调关系发生障碍,从而引起各种症状、体征和行为异常,特别是对环境适应能力和体力减弱甚至丧失。本文档共65页;当前第6页;编辑于星期三\14点29分疾病遗传物质的变异(内因)染色体异常基因突变单核苷酸多态和插入缺失多态拷贝数变异DNA修饰和核小体修饰等外界环境变化(外因)感染损伤环境情绪和情感教育和社会本文档共65页;当前第7页;编辑于星期三\14点29分一、孟德尔遗传疾病与复杂疾病由单一基因缺陷或由主基因缺陷而引起的遗传疾病,叫做孟德尔遗传疾病。孟德尔遗传疾病的遗传模式基本满足孟德尔遗传定律。?本文档共65页;当前第8页;编辑于星期三\14点29分二、复杂疾病涉及多基因和蛋白复杂疾病(complexdisease),又称多基因病(ploygenicdisorder),是指由多个基因位点共同参与,且和环境因素相互作用决定表型的遗传疾病。众所周知,像高血压,哮喘和某些癌症的发病通常不仅是由单个基因突变导致,而是众多基因通过蛋白质复合物,调控网络以及互作通路来控制的。本文档共65页;当前第9页;编辑于星期三\14点29分protein-geneinteractionsprotein-proteininteractionsPROTEOMEGENOMECitrateCycleMETABOLISMBio-chemicalreactions人民卫生出版社8年制及7年制临床医学等专业用《生物信息学》本文档共65页;当前第10页;编辑于星期三\14点29分Ding等人在2008年研究了和188中人类肺部癌变的623个已知或潜在相关的基因,并利用系统生物学的方式从中筛选出和肺癌显著高频的26个基因。其中,NF1、APC、RB1、ATM等基因的突变,LRP1B序列的缺失以及PTPRD序列的该表都是诱导肺癌发生的原因。同时,Ding等人也发现了和肺癌相关的一些重要的信号通路如MAPK、p53、WNT和mTOR。本文档共65页;当前第11页;编辑于星期三\14点29分三、复杂疾病受环境因素影响复杂疾病不仅与基因和蛋白有关,与周围环境同样有着非常密切的关系。同一个体在不同条件下对环境的响应不同。例如细胞受到紫外线照射或受到环境毒素的作用后的癌变现象。基因组的个体差异使不同人对环境的响应不同。每个人因为在基因型上并不完全相同,对于环境改变的敏感性也不同。本文档共65页;当前第12页;编辑于星期三\14点29分越来越多的实验证据证明基因与环境之间的相互作用在复杂疾病的发生发展过程中起着关键性作用,它们之间的相互作用是极其复杂和非线性的,一个相同的基因在不同的环境中会产生不同甚至是完全相反的表型,因此单纯从基因或蛋白等某一个角度去研究是不足以全面了解复杂性状疾病的发生、发展过程的。本文档共65页;当前第13页;编辑于星期三\14点29分四、疾病的分类VictorA.McKusick博士于1966年开始进行MIM(MendelianInheritanceinMan)的创作。世界卫生组织(WHO)于1948年开始负责ICD(InternationalStatisticalClassificationofDiseasesandRelatedHealthProblems)的编写任务。现有版本(ICD-10)包含15.5万种编码。中国根据ICD-10颁布了《第二次国家卫生服务调查疾病分类——编码表》对疾病进行了分类,共19类:⑴传染病;⑵寄生虫病;⑶恶性肿瘤;⑷良性肿瘤;⑸内分泌疾病(营养和代谢疾病及免疫疾病);⑹血液和造血器官疾病;⑺精神病;⑻神经系统疾病;⑼眼及附器疾病;⑽耳和乳突疾病;⑾循环系统疾病;⑿呼吸系统疾病;⒀消化系统疾病;⒁泌尿生殖系统疾病;⒂妊娠、⒃分娩病及产褥期并发症;⒄皮肤和皮下组织疾病;⒅肌肉、骨骼系统和结缔组织疾病;⒆损伤和中毒。本文档共65页;当前第14页;编辑于星期三\14点29分第三节

复杂疾病数据库本节将对OMIM、GAD、CGAP等复杂疾病数据库的内容及使用方法进行简要介绍这些数据库主要基于文献、关联分析及生物学实验的结果,记录了疾病表型、相关的染色体区域、候选基因等多方面的信息。本文档共65页;当前第15页;编辑于星期三\14点29分一、人类孟德尔遗传在线(OMIM)MIM(MendelianInheritanceinMan)与OMIMOMIM的发展史目前,OMIM的发布以及相关软件的开发由NationalCenterforBiotechnologyInformation

(NCBI)负责。OMIM数据库的访问本文档共65页;当前第16页;编辑于星期三\14点29分OMIM主页(/omim)本文档共65页;当前第17页;编辑于星期三\14点29分MIM编号范围遗传方式100000-199999常染色体显性遗传或表型(于1994年5月15号创建)200000-299999常染色体隐性遗传或表型(于1994年5月15号创建)300000-399999X连锁位点或表型400000-499999Y连锁位点或表型500000-599999线粒体位点或表型600000-染色体位点或表型(于1994年5月15号创建)OMIM编号代表的遗传方式本文档共65页;当前第18页;编辑于星期三\14点29分OMIM号前特殊符号代表的含义:

“*”号代表已知致病基因的序列信息,没有加“*”表示其遗传模式虽然已有推测,但没有被证实或者这个基因与其他记录所包含的基因位点的分离情况还不清楚;

“#”表示这种表型可以由两个或者多个基因中的一个发生突变而引起;

“+”表示这个记录包含基因的序列信息和表型;

“%”表示记录中描述了一个已知的孟德尔表型,但是对其潜在的分子机制还不清楚;

“^”表示该记录已不存在或者被其他记录所代替。本文档共65页;当前第19页;编辑于星期三\14点29分OMIM数据的下载

其中包含全部的OMIM的文件(),OMIM中的基因文件(genemap)及其解释文件(genemap.key),以及疾病信息(morbidmap)OMIM还提供genemap和morbidmap的网络查询形式本文档共65页;当前第20页;编辑于星期三\14点29分genemap查询页面本文档共65页;当前第21页;编辑于星期三\14点29分morbidmap查询页面本文档共65页;当前第22页;编辑于星期三\14点29分OMIM数据库的使用(以Alzheimer’sDisease为例)本文档共65页;当前第23页;编辑于星期三\14点29分本文档共65页;当前第24页;编辑于星期三\14点29分本文档共65页;当前第25页;编辑于星期三\14点29分二、遗传关联数据库(GAD)GAD(GeneticAssociationDatabase)GAD的发展史

由美国国立卫生研究院(NationalInstitutesofHealth,NIH)开发和维护可以通过访问该数据库本文档共65页;当前第26页;编辑于星期三\14点29分数据库中的信息来源于对目前已有的关联分析结果的搜集和整理数据库中的信息是以基因为核心的允许所有用户查看和提交记录截止到目前,数据库中的记录数已经达到了39930条,涉及到了2673个基因,5636种疾病表型,555种影响疾病的环境因素本文档共65页;当前第27页;编辑于星期三\14点29分GAD数据库主要提供三部分功能:

数据视图部分,数据查询部分,数据资源部分。用户可以在线查询某种特定遗传病相关的基因或某个兴趣基因相关的疾病的信息,也可以在免费注册账户后对整个数据库中的数据进行下载。本文档共65页;当前第28页;编辑于星期三\14点29分GAD的使用方法用户可以选择不同的角度,包括疾病角度、基因角度、染色体角度以及通过参考文献、环境因素等方面对数据表进行查询。也可以选择“All”同时从多个角度对数据库中的相关信息进行查询。用户可以选择“SimpleSearch”,利用关键字实现对数据库中相关记录的简单查询;还可以选择“AdvancedSearch”增加查询限定条件进行数据记录的高级搜索。本文档共65页;当前第29页;编辑于星期三\14点29分GAD的使用方法GAD支持对大量基因的批量查询。用户可以选择“PositiveOnly”以筛选得到疾病与基因间存在显著关联的记录。用户还可以通过“AddRecord”页面实现向数据库中提交记录;通过“Download”页面实现对数据库中数据的下载。本文档共65页;当前第30页;编辑于星期三\14点29分选择“BrowserAll”链接可以得到如下结果本文档共65页;当前第31页;编辑于星期三\14点29分应用GAD研究复杂疾病的实例Liu等人2009年发表在BMCBioinformatics杂志上的文章The"etiome":identificationandclusteringofhumandiseaseetiologicalfactors中,作者为了研究影响疾病的因素,从GAD数据库中获取了与1034种复杂疾病相关的1100个基因的相关数据;Yang等人2008年发表于BMCBioinformatics杂志上的文章Anintegrateddatabase-pipelinesystemforstudyingsinglenucleotidepolymorphismsanddiseases为了得到一个可用于研究遗传变异与疾病间关系的数据库,也从GAD中提取了疾病相关信息进行数据整合。本文档共65页;当前第32页;编辑于星期三\14点29分三、癌症基因数据库(CGAP)CancerGenomeAnatomyProject,癌基因组解剖计划是一项由美国癌症研究所(NationalCancerInstitute,NCI)于1996年发起并建立和主持的交叉学科计划用户可以通过进行访问CGAP的创建目的及总体目标本文档共65页;当前第33页;编辑于星期三\14点29分CGAP被分为五个互补的自主部分人类肿瘤基因索引(TheHumanTumorGeneIndex,hTGI)分子表达谱(MolecularProfiling,MP)癌症染色体变异计划(TheCancerChromosomeAberrationProject,CCAP)遗传注解索引(TheGeneticAnnotationIndex,GAI)小鼠肿瘤基因索引(TheMouseTumorGeneIndex,mTGI)本文档共65页;当前第34页;编辑于星期三\14点29分提供了七个相关模块,包括基因(Genes)、染色体(Chromosomes)、组织(Tissues)、SAGE精灵(SAGEGenie)、通路(Pathways)、工具(Tools)和RNA干扰(RNAi),用以提供对所有CGAP中包含的数据、生物信息学分析工具以及生物学相关资源的查询和获取,借助于这些模块,用户可以实现生物学问题的计算机模拟,从而快速地获得问题的解决方案。本文档共65页;当前第35页;编辑于星期三\14点29分下载页面图所示,其中包含了人和小鼠两个物种的基因注释、基因表达以及相关的一些文库中的数据。本文档共65页;当前第36页;编辑于星期三\14点29分四、WHO规范的疾病分类标准(ICD)国际疾病分类,简称ICD(InternationalClassificationofDiseases),是目前国际上共同使用的统一的疾病分类方法。ICD的目的是对不同国家或地区在不同时间收集到的死亡和疾病数据进行系统地记录、分析、解释和比较,其中包括对各人群组一般健康状况的分析,疾病发病和患病的监测以及其有关的其他健康问题。本文档共65页;当前第37页;编辑于星期三\14点29分ICD的主要内容及应用范围囊括了群体健康状况分析、疾病发病率及流行性监测等多方面内容。常被用于分类疾病及其他许多类型的生命活动相关的健康问题。该体系除了可以用于存储和获取有关临床、流行病等的诊断信息外,还为疾病的发病率和死亡率统计提供了基础。本文档共65页;当前第38页;编辑于星期三\14点29分ICD的发展史国际死因列表(InternationalListofCausesofDeath)ICD在第六版中首次加入了发病原因的信息,并于1948年被当时刚刚建立的世界卫生组织(WHO)接管和发布ICD-10的书名由过去的《国际疾病分类》改变为《国际疾病与相关健康问题统计分类》,首次引用了字母编目本文档共65页;当前第39页;编辑于星期三\14点29分ICD-10共分三卷第一卷是疾病和有关健康问题的国际统计分类,主要包括ICD-10全部3位数或4位数编码内容及其必要的注释和说明;第二卷是ICD-10指导手册,用于指导用户如何正确使用ICD-10的第一卷和第三卷,并对使用中需要遵循的各项规则和有关问题给予详细的介绍;第三卷是ICD-10字母索引,主要包括在查找疾病、损伤、中毒的临床表现和外部原因是详细的内容和编码。本文档共65页;当前第40页;编辑于星期三\14点29分ICD的分类及编码原则强调“以病因为主、解剖部位和其他为辅”的原则采用3位或4位数的“字母数字编码”形式,即第1位为英文字母,第2至4位为阿拉伯数字,从“A00-Z99”对所有的疾病归成21大类疾病,再逐渐细分成小类等详细内容。ICD-10在编码使用上只对前4位数有统一要求,对以后的扩展位数及编码排列没有限制本文档共65页;当前第41页;编辑于星期三\14点29分ICD-10编码查询(国际疾病分类编码)本文档共65页;当前第42页;编辑于星期三\14点29分五、DiseaseOntology2003年在Northwestern大学启动的Nugene计划的一部分提供一个与人类疾病相关的整合的生物医学数据集的开源Ontology体系促进各种疾病及相关健康状况向特定医学代码的映射期望构建成一个具有正确的Ontology体系结构并且在语义上可计算的结构形式本文档共65页;当前第43页;编辑于星期三\14点29分DO的构成DO是将不同数据库通过疾病概念整合到一起的开源的疾病体系:

MedicalSubjectHeadings(MeSH)

UniversalMedicalLanguageSystem(UMLS)InternationalClassificationofDisease(ICD)SystematizedNomenclatureofHumanVeterinaryMedicine—ClinicalTerm本文档共65页;当前第44页;编辑于星期三\14点29分DO的历史

DO发展至今已有3个版本:

DO_V1是基于ICD编码的疾病体系

DO_V2的体系主要基于SNOMED,MeSH和UMLSDO_V3在前一版本的基础上进行了修改,加入了更多的临床信息,如变异位点、环境、传染源和发病过程等等

DO是开源的,网址是:本文档共65页;当前第45页;编辑于星期三\14点29分本文档共65页;当前第46页;编辑于星期三\14点29分其他疾病数据库HGMDGeneCardsTGDBBCGDHuGENavigatorATLASGENETICSONCOLIGY本文档共65页;当前第47页;编辑于星期三\14点29分HGMD由卡迪夫大学医学遗传研究所开发和维护的,存储了大量的人类遗传病相关的基因突变数据,只存储了与人类遗传病相关的核基因突变数据,并不包含体细胞突变和线粒体基因突变本文档共65页;当前第48页;编辑于星期三\14点29分

GeneCards由以色列Weizmann科学研究所的Crown人类基因组中心开发和维护,整合了人类已知及预测基因的基因组、蛋白质组、转录组、遗传以及功能等多方面信息的综合性数据库,提供了更为全面的功能基因组数据及相关的其它数据库的外部链接可以获取疾病相关基因的染色体定位、表达数据、同源基因、对应的蛋白产物等众多信息。本文档共65页;当前第49页;编辑于星期三\14点29分TGDB(TheTumorGeneDatabase):癌症导致突变的基因、原癌基因、抑癌基因等相关信息的肿瘤基因数据库BCGD(TheBreastCancerGeneDatabase):存储乳腺癌相关基因信息的乳腺癌基因数据库HuGENavigator(TheHumanGenomeEpidemiologyNavigator):群体发病率、基因与疾病的关联关系、基因与基因及基因与环境间互作等信息的人类基因组流行病学导航ATLASGENETICSONCOLIGY(ATLASofGeneticsandCytogeneticsinOncologyandHaematology):肿瘤及血液病相关的遗传学和细胞遗传学数据库本文档共65页;当前第50页;编辑于星期三\14点29分第四节疾病网络重构的计算系统生物学方法本文档共65页;当前第51页;编辑于星期三\14点29分计算系统生物学

计算系统生物学(Computationalsystemsbiology)是系统生物学在运算法则和应用程序方面的发展,和生物信息学及计算生物学紧密相连。计算系统生物学旨在开发和运用更有效的算法、数据结构和通讯工具,以进一步整合海量生物数据,使生物学模式化本文档共65页;当前第52页;编辑于星期三\14点29分工作流程对选定的某一生物系统的所有组分进行了解和确定,描绘出该系统的结构,以此构造出一个初步的系统模型;系统地改变被研究对象的内部组成成分或外部生长条件,然后观测在这些情况下系统组分或结构发生的相应变化并把得到的有关信息进行整合;把通过实验得到的数据与根据模型预测的情况进行比较,并对初始模型进行修订;根据修正后的模型的预测或假设,设定和实施新的改变系统状态的实验,重复第二步和第三步,不断地通过实验数据对模型进行修订和精练,得到一个理想的模型,使其理论预测能够反映出生物系统的真实性。本文档共65页;当前第53页;编辑于星期三\14点29分Disease-Gene网络重构分析基因和疾病之间存在复杂的多向对应关系来源:通过文献获得的

根据关联分析的结果推测的

通过生物学实验证实的OMIM、GAD和CGAP等数据库提供了重要的资源和线索,可以获得与某一种疾病有关的多个基因,同时也可以得到某一个基因参与的多个疾病本文档共65页;当前第54页;编辑于星期三\14点29分TheHumanDiseaseNetwork本文档共65页;当前第55页;编辑于星期三\14点29分

DNA微阵列技术应用于疾病研究中,通过检测大量的疾病表达谱,获得了大量的疾病相关基因的信息开发了许多基于基因表达谱的疾病基因识别方法XuebingWu的CIPHER算法本文档共65页;当前第56页;编辑于星期三\14点29分Disease-Pathway网络重构分析代谢系统疾病是一类特殊的疾病,主要是由参与各种代谢通路的酶或编码酶的基因异常导致的Lee,D.S.等人根据基因在同一代谢通路中的邻近关系重新构造了人类代谢代谢相关疾病网络,研究了网络中聚集成团的疾病在流行性、致死性以及发生率等方面的特点内分泌系统疾病、神经系统疾病等也可以采取这一策略,有助于对疾病的认识的不断深入和系统化本文档共65页;当前第57页;编辑于星期三\14点29分Theimplicationsofhumanmetabolicnetworktopologyfordiseaseco-morbidity本文档共65页;当前第58页;编辑于星期三\14点29分Disease-microRNA

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论