




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基因表达数据的获得与分析徐 娟Email: 生物信息教研室 分子学馆106办公室基因芯片数据的基础分析思路预处理差异表达基因筛选聚类与分类功能注释和富集分析根据疾病风险基因识别疾病风险通路利用各种技术(基因表达谱、RNAseq、质谱、大规模突变、全基因组关联分析等)识别疾病风险基因注释这些基因到通路中识别疾病风险通路分析这些通路与疾病的相关性丙酮酸丙酮酸激酶2-磷酸甘油酸磷酸烯醇式丙酮酸烯醇化酶葡萄糖6-磷酸葡萄糖6-磷酸果糖1,6-双磷酸果糖3-磷酸甘油醛1,3-二磷酸甘油酸3-二磷酸甘油酸 葡萄糖代谢通路MAPK信号通路节点间的各种关系通过这些详细的互作关系,我们能够更清晰的了解通路! D
2、etail:泛素化去磷酸化抑制激活磷酸化绑定/相关 ERGOBioCyc GeneDB 通路数据库KEGG 其它通路数据库: Reactomewikipathways biocarta KEGG数据库介绍Kyoto Encyclopedia of Genes and Genomes1995年5月,日本的教育、科学、体育和文化部携手建立了KEGG数据库。由日本京都大学生物信息学中心的Kanehisa实验室开发 KEGG是系统地分析基因功能、链接基因组信息和功能信息的数据库,旨在揭示生命现象的遗传与化学蓝图。数据库的维护人员不定期的根据最近出版的一些学术论文和生物学实验得到的数据对该数据库进行更新
3、,经过了17年的发展,数据库的规模不断的扩大,其应用价值也得到了世界范围内的认可。与其他数据库相比,KEGG 的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系。KEGG主页KEGG分析工具KEGG PATHWAY 可以看到KEGG 收录的所有代谢途径信息通路类别 KEGG pathway 分类 1. Metabolism 2. Genetic Information Processing 3. Environmental Information Processing 4. Cellular Processes 5. Organismal
4、Systems 6. Human Diseases 6.1 Cancers 6.2 Immune System Diseases 6.3 Neurodegenerative Diseases 6.4 Cardiovascular Diseases 6.5 Metabolic Diseases 6.6 Infectious Diseases 心血管疾病(Cardiovascular Diseases )肥厚性心肌病(HCM)hypertrophic cardiomyopathy致心律失常性右心室心肌症(ARVC)Arrhythmogenic right ventricular cardiomyo
5、pathy扩张性心肌症(DCM)Dilated cardiomyopathy 病毒性心肌炎Viral myocarditis 糖尿病(Type II diabetes mellitus )结肠直肠癌(Colorectal cancer)KEGG通路中的疾病基因信息? 1. Metabolism 2. Genetic Information Processing 3. Environmental Information Processing 4. Cellular Processes 5. Organismal Systems 6. Human Diseases KEGG通路中的疾病信息?查询通
6、路中的疾病信息进入KEGG网站 选择一个通路(如:MAPK)进入该通路,改变通路显示方式为Homo sapiens (human) + Disease/drug 。点击GoMAPK通路结果: 浏览通路中与疾病相关的基因疾病基因 药靶基因 人类基因 培利替尼 案例:查看单个疾病风险基因注释到哪些通路神经胶质瘤(Glioma)风险基因(NCBI-GeneID :1956),该基因编码表皮生长因子受体(EGFR) 进入KEGG搜索界面 选择Search against为:hsa选择Primary ID 类型为:NCBI-GeneID输入EGFR基因(如格式:1956 red)点击Exec案例:查看多
7、个疾病风险基因注释到哪些通路(适用于复杂疾病)从通过差异表达分析获得动脉硬化(artherosclerosis)风险基因集合:共234个基因进入KEGG搜索界面 选择Search against为:hsa选择Primary ID 类型为:NCBI-GeneID输入差异表达基因,格式:19 red 368 red点击Exec234个动脉硬化相关基因凝血相关功能数据库:Gene Ontology (GO) Year19822005# of records60244, 202,133 Sequence databases:GenBank、EMBL、DDBJ背景 (1)传统认识功能的方法远远跟不上基因
8、发现的速度(2)大规模的基因功能预测的必要性;需系统水平上认识基因功能(3)功能的规范化和大规模处理的需要(4)基因功能的多效性?困难和挑战 问题一、一个基因多种功能TP53induction of apoptosisnegative regulation of apoptosis cellular response to UVchromosome organizationmitotic cell cycle G1/S transition DNA damage checkpoint negative regulation of DNA replication Glucose biosynth
9、esisGlucose synthesisGlucose formationGlucose anabolismGluconeogenesisAll refer to the process of making glucose from simpler components问题二、生物学功能的多种描述GO(gene ontology)是: 基因本体联合会(Gene Onotology Consortium)所建立的数据库,旨在建立一套适用于各种物种的,对基因和蛋白质功能从多个方面进行限定和描述的,并能随着研究不断深入而更新的语义(terms)词汇标准,即基因产物分类标准。GO数据库不是以其自身为
10、中心而是依靠外部数据库,这些外部数据库中收录的基因及其产物都将用GO定义的词汇进行注释。因此GO是与时俱进与相互合作的代表,它致力于统一基因及其产物注释的方式。 You can visit GO at .GO语义的分类分子功能(Molecular Function)描述在个体分子生物学上的活性,如催化活性或结合活性。生物学过程(Biological Process)由分子功能有序地组成的,具有多个步骤的一个过程,如细胞周期。细胞组件(Cellular Component)指基因产物位于何种细胞器或基因产物组中(如糙面内质网,核糖体,蛋白酶体等),即基因产物在什么地方起作用Cell agingt
11、erm: gluconeogenesisid: GO:0006094definition: The formation of glucose from noncarbohydrate precursors, such as pyruvate, amino acids and glycerol. Source: MetaCyc:GLUCONEO-PWY Ontology:Biological Process Synonyms exact: glucose biosynthesis exact: glucose biosynthetic process Whats in a GO term?Ont
12、ology StructureThe GO is structured as a hierarchical directed acyclic graph (DAG)GO isnt just a flat list of biological terms, terms are related within a hierarchyDirected Acyclic Graphs语义之间的关系is a:上一个概念包括下一个概念 , 下一个概念是上一个概念的实例 。part of:下一个概念是上一个概念的一部分 树松树叶子Part ofIs a(细胞质)(细胞器)(线粒体)(细胞器膜)Cell(细胞)p
13、art ofpart of案例:查看单个疾病风险基因注释到哪些通路神经胶质瘤(Glioma)风险基因(NCBI-GeneID :1956),该基因编码表皮生长因子受体(EGFR) 进入GO界面 输入EGFR基因(格式: EGFR )选择gene or protein name 点击Go!案例:查看多个疾病风险基因注释到哪些功能从通过差异表达分析获得动脉硬化(artherosclerosis)风险基因集合:共234个基因进入GO搜索界面 在Enter your query文本框中输入查询基因输入差异表达基因,格式:ABCA1 ABCC6Search type 选择Genes or protein
14、sSearch fields选择:symbol点击Exec最多查询50个基因Guide to GO Evidence CodesExperimental Evidence Codes EXP: Inferred from Experiment IDA: Inferred from Direct Assay IPI: Inferred from Physical Interaction IMP: Inferred from Mutant Phenotype IGI: Inferred from Genetic Interaction IEP: Inferred from Expression P
15、attern Computational Analysis Evidence Codes ISS: Inferred from Sequence or Structural Similarity ISO: Inferred from Sequence Orthology ISA: Inferred from Sequence Alignment ISM: Inferred from Sequence Model IGC: Inferred from Genomic Context IBA: Inferred from Biological aspect of Ancestor IBD: Inf
16、erred from Biological aspect of Descendant IKR: Inferred from Key Residues IRD: Inferred from Rapid Divergence RCA: inferred from Reviewed Computational Analysis 基因芯片数据的基础分析思路预处理差异表达基因筛选聚类与分类功能注释和富集分析基因集功能富集分析的原因一组基因直接注释的结果是得到大量的功能结点。这些功能具有概念上的交叠现象,不利于进一步的精细分析,所以研究人员希望对得到的功能结点加以过滤和筛选,以便获得更有意义的功能信息。富
17、集分析方法通常是分析一组基因在某个功能结点上是否过出现(over-presentation)。由单个基因的注释分析发展到大基因集合的成组分析。 由于分析的结论是基于一组相关的基因,而不是根据单个基因,所以富集分析方法增加了研究的可靠性,同时也能够识别出与生物现象最相关的生物过程。案例:利用DAVID工具进行动脉硬化风险通路识别从GAD数据库收集动脉硬化(artherosclerosis)风险基因集合:共234个基因将234个基因输入到DAVID系统利用EASE检验计算每个通路的富集显著性(P-value)EASE Score, a modified Fisher Exact P-Value 疾病风险基因数人类基因In Pathway340Not In Pathway29729960Fisher Exact P-Value = 0.008 EASE Score = 0.06 EASE分值更加严格!-1DAVID Tools 步骤1:进入DAVID网站,选择
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 光学安全管理规范
- 2025年上海建筑安全员《B证》考试题库及答案
- 低温防冻安全教育
- 2025年湖南建筑安全员-A证考试题库及答案
- 2025河北省建筑安全员-C证(专职安全员)考试题库
- 骨科常见临床表现
- 高温预防中暑指南
- 通过有效管理优化供应链推动提升金融领域的公开性及清晰性
- 初三化学上册知识总结
- 脑血管健康教育讲座
- 2025年全国国家版图知识竞赛(中小学组)题库及答案
- 课件-DeepSeek从入门到精通
- 2025年度国家铁路局安全技术中心面向社会公开招聘工作人员5人高频重点提升(共500题)附带答案详解
- 律师事务所保密制度
- DL-T5394-2021电力工程地下金属构筑物防腐技术导则
- 静物产品摄影PPT课件(PPT 50页)
- 丽声北极星分级绘本第一级下The King's Yu Player教学设计
- 显微操作技术(全面)
- (高清正版)T_CAGHP 060—2019地质灾害拦石墙工程设计规范(试行)
- 两立体相交相贯
- CAD批量标注点名
评论
0/150
提交评论