生物化学课件:第26章 基因表达及功能分析基本策略_第1页
生物化学课件:第26章 基因表达及功能分析基本策略_第2页
生物化学课件:第26章 基因表达及功能分析基本策略_第3页
生物化学课件:第26章 基因表达及功能分析基本策略_第4页
生物化学课件:第26章 基因表达及功能分析基本策略_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、目目 录录 目目 录录 第二十六章第二十六章 基因表达及功能分析的基因表达及功能分析的 基本策略基本策略 STRATEGIES FOR ANALYZING GENE EXPRESSION AND FUNCTION 目目 录录 目目 录录 第一节第一节 基因表达的分析策略基因表达的分析策略 Strategies for Analyzing Gene Expression 目目 录录 目目 录录 一、通过检测一、通过检测mRNA 揭示基因转录水平的表达特征揭示基因转录水平的表达特征 根据分析方法的原理和功能特性,可将基因表达分析分为根据分析方法的原理和功能特性,可将基因表达分析分为: 封闭性系统研

2、究方法封闭性系统研究方法:例如例如DNA微阵列、微阵列、Northern印迹、实印迹、实 时时RT-PCR等方法,其应用范围仅限于已测序的物种,只能等方法,其应用范围仅限于已测序的物种,只能 研究已知的基因。研究已知的基因。 开放性系统研究方法开放性系统研究方法: 如差异显示如差异显示PCR、双向基因表达指纹、双向基因表达指纹 图谱、分子索引法、随机引物图谱、分子索引法、随机引物PCR指纹分析等,可以发现指纹分析等,可以发现 和分析未知的基因。和分析未知的基因。 这里主要针对已知基因的常用表达分析方法做一介绍。这里主要针对已知基因的常用表达分析方法做一介绍。 目目 录录 目目 录录 (一)基于

3、杂交原理的方法可检测(一)基于杂交原理的方法可检测mRNAmRNA表达水平表达水平 1Northern印迹印迹(Northern blot) 既可分析既可分析mRNA表达又可验证表达又可验证cDNA新序列新序列 是一种基于是一种基于RNA-DNA杂交原理建立的一种杂交原理建立的一种RNA分析分析 技术技术 目目 录录 目目 录录 Northern印迹分析原理示意图 印迹分析原理示意图 目目 录录 目目 录录 2核糖核酸酶保护实验核糖核酸酶保护实验 (ribonuclease protection assay,RPA) 可用于可用于mRNA定量和定量和RNA剪接分析剪接分析 是一种基于杂交原理分

4、析是一种基于杂交原理分析mRNA的方法,既可对的方法,既可对 mRNA进行定量分析又可研究其结构特征,灵敏进行定量分析又可研究其结构特征,灵敏 度和特异性都很高。度和特异性都很高。 目目 录录 目目 录录 核糖核酸酶保护实验原理示意图核糖核酸酶保护实验原理示意图 目目 录录 目目 录录 可对可对mRNA进行区域定位进行区域定位 是利用杂交原理建立的组织原位是利用杂交原理建立的组织原位mRNA检测技术,可检测技术,可 对细胞或组织中原位表达的对细胞或组织中原位表达的mRNA进行区域定位。同进行区域定位。同 时也可作为定量分析的补充。时也可作为定量分析的补充。 通过设计与目标通过设计与目标mRNA

5、碱基序列互补的寡核苷酸序列,碱基序列互补的寡核苷酸序列, 标记后作为探针;该探针能够特异性地与目标靶序列标记后作为探针;该探针能够特异性地与目标靶序列 杂交,检测标记信号来确定基因在组织和细胞内表达杂交,检测标记信号来确定基因在组织和细胞内表达 的区位信息。的区位信息。 虽然原位杂交在功能性方面提供的信息较少,但是该虽然原位杂交在功能性方面提供的信息较少,但是该 技术还是被广泛用于组织中的基因表达分析,这是因技术还是被广泛用于组织中的基因表达分析,这是因 为其较高的稳定性、较广泛的靶点和组织适用性。为其较高的稳定性、较广泛的靶点和组织适用性。 3原位杂交(原位杂交(in situ hybrid

6、ization,ISH) 目目 录录 目目 录录 (二)两种变换的聚合酶链式反应是常用的(二)两种变换的聚合酶链式反应是常用的 mRNA检测方法检测方法 1反转录反转录PCR 可用于可用于mRNA的半定量分析的半定量分析 反转录反转录PCR(reverse transcription-PCR,RT-PCR) 是一种简单、快捷地对是一种简单、快捷地对RNA进行定性、定量分析的方进行定性、定量分析的方 法。它是以法。它是以mRNA为模板,体外扩增为模板,体外扩增cDNA,再以,再以 cDNA为模板进行特定基因转录产物的为模板进行特定基因转录产物的PCR扩增。扩增。RT- PCR技术一般用于技术一般

7、用于RNA的定性分析;如果设置阳性参的定性分析;如果设置阳性参 照,则可对待测照,则可对待测RNA样品进行半定量分析。样品进行半定量分析。 该方法适合对待测样品进行初步筛选,目前已广泛被该方法适合对待测样品进行初步筛选,目前已广泛被 实时定量实时定量PCR替代。替代。 目目 录录 目目 录录 常用于常用于mRNA的定量分析的定量分析 实时定量实时定量PCR (Real-time Quantitative Polymerase chain Reaction,RQ-PCR)是定量分析是定量分析mRNA的最通用、最快速、的最通用、最快速、 最简便的方法,该方法是对最简便的方法,该方法是对PCR反应进

8、行实时监测,具反应进行实时监测,具 有很高的灵敏度和特异性。有很高的灵敏度和特异性。 2实时定量实时定量PCR 目目 录录 目前有目前有5种技术用于实时定量种技术用于实时定量PCR: 其中最经济、简便的技术是利用荧光染料(如其中最经济、简便的技术是利用荧光染料(如SYBR Green )与双链)与双链DNA分子结合发光的特性,指示扩增产分子结合发光的特性,指示扩增产 物的增加;物的增加; 其他其他4种方法都是以荧光染料标记的寡核苷酸为探针种方法都是以荧光染料标记的寡核苷酸为探针 与正确的扩增子杂交,包括与正确的扩增子杂交,包括5核酸酶法(即人们熟知的核酸酶法(即人们熟知的 TaqManTM)、

9、分子信标、)、分子信标、ScropionsTM和探针杂交法,和探针杂交法, 它们拥有更强的特异性,可以避免对它们拥有更强的特异性,可以避免对PCR后溶解曲线的后溶解曲线的 需求,以及后续的需求,以及后续的Southern杂交或对扩增子的测序鉴定,杂交或对扩增子的测序鉴定, 但是成本较高。但是成本较高。 目目 录录 目目 录录 SYBR Green实时定量 实时定量PCR分析原理示意图分析原理示意图 目目 录录 目目 录录 二、通过蛋白质检测揭示基因二、通过蛋白质检测揭示基因 翻译水平的表达特征翻译水平的表达特征 Western印迹(印迹(Western blot)是一种免疫印迹技术,是一种免疫

10、印迹技术, 其基本原理与核酸分子杂交相似,只是以偶联标记物的抗其基本原理与核酸分子杂交相似,只是以偶联标记物的抗 体分子作为探针,检测转移到固相支持物上的蛋白质体分子作为探针,检测转移到固相支持物上的蛋白质/多肽多肽 分子。当在蛋白质水平上检测特定基因的表达活性时,最分子。当在蛋白质水平上检测特定基因的表达活性时,最 常用的方法就是利用常用的方法就是利用Western印迹对细胞或组织的总蛋白质印迹对细胞或组织的总蛋白质 中的特异蛋白质进行定性和半定量分析。中的特异蛋白质进行定性和半定量分析。 (一)采用特异抗体经(一)采用特异抗体经Western印迹可直接印迹可直接 测定基因编码多肽测定基因编

11、码多肽 目目 录录 1. 蛋白质样品的制备蛋白质样品的制备 2. SDS-PAGE分离分离 3. 蛋白质转膜蛋白质转膜 4. 特异抗体(即第一抗体)与膜上的蛋白质(抗原)印特异抗体(即第一抗体)与膜上的蛋白质(抗原)印 迹杂交迹杂交 5. 再经偶联了可检测标记信号的第二抗体(即抗抗体,再经偶联了可检测标记信号的第二抗体(即抗抗体, 商品试剂盒中多采用偶联辣根过氧化物酶的商品试剂盒中多采用偶联辣根过氧化物酶的Ig) 6. 最后经与酶的底物反应而显影、成像,经扫描后获取最后经与酶的底物反应而显影、成像,经扫描后获取 免疫印迹信息免疫印迹信息 Western blot基本程序基本程序 目目 录录 目

12、目 录录 酶联免疫吸附分析(酶联免疫吸附分析(Enzyme-linked immunosorbent assay,ELISA)也是一种建立在抗原也是一种建立在抗原-抗体反应基础上的蛋白抗体反应基础上的蛋白 质分析基本方法。质分析基本方法。 该方法不需经电泳分离待检样品蛋白质,而是预先将样该方法不需经电泳分离待检样品蛋白质,而是预先将样 品包被在支持体上,以后反应过程与品包被在支持体上,以后反应过程与Western印迹大致相同印迹大致相同 顺序结合(即顺序结合(即“吸附吸附”)特异抗体(一抗)及与酶连接的)特异抗体(一抗)及与酶连接的 第二抗体(也可预先包被抗体,第二抗体(也可预先包被抗体,“吸

13、附吸附”抗原),再进行酶抗原),再进行酶- 底物反应。反应后通过专门的酶标仪测定、记录数据。底物反应。反应后通过专门的酶标仪测定、记录数据。 (二)酶联免疫吸附分析与(二)酶联免疫吸附分析与Western印迹原理印迹原理 相似但形式不同相似但形式不同 目目 录录 目目 录录 特点:特点: 具有特异性;具有特异性; 灵敏度很高;灵敏度很高; 稳定、操作简便,标本用量少,适于大规模筛查,稳定、操作简便,标本用量少,适于大规模筛查, 尤其适用于检测体液中微量的特异性抗体或抗原;尤其适用于检测体液中微量的特异性抗体或抗原; 既可以做定性试验也可以做定量分析。既可以做定性试验也可以做定量分析。 被广泛应

14、用于微生物学、寄生虫学、肿瘤学和被广泛应用于微生物学、寄生虫学、肿瘤学和 免疫学等领域。免疫学等领域。 酶联免疫吸附分析酶联免疫吸附分析 目目 录录 目目 录录 免疫组织化学(免疫组织化学(immunohistochemistry)与与免疫免疫 细胞化学(细胞化学(immunocytochemistry)原理相同,都是利)原理相同,都是利 用标记的特异性抗体通过抗原用标记的特异性抗体通过抗原-抗体反应和显色反应,抗体反应和显色反应, 在组织或细胞原位检测特定抗原(即目标蛋白质)的在组织或细胞原位检测特定抗原(即目标蛋白质)的 方法,简称为免疫组化实验。近年来由于荧光标记抗方法,简称为免疫组化实

15、验。近年来由于荧光标记抗 体的广泛应用,这两种方法又被统称为体的广泛应用,这两种方法又被统称为免疫荧光法。免疫荧光法。 (三)免疫组化实验可对组织(三)免疫组化实验可对组织/ /细胞细胞 表达的蛋白质进行原位检测表达的蛋白质进行原位检测 目目 录录 目目 录录 (immunofluorescence),可应用荧光(倒置)显微镜或),可应用荧光(倒置)显微镜或 激光共聚焦显微镜(激光共聚焦显微镜(confocal microscopy)对靶分子进行对靶分子进行 定性、定量和定位分析,激光共聚焦显微镜还可进行断层定性、定量和定位分析,激光共聚焦显微镜还可进行断层 成像,是在蛋白质水平分析基因表达的

16、直观方法。成像,是在蛋白质水平分析基因表达的直观方法。 其中抗体对于蛋白质靶点的特异性、种间交叉反应、检测其中抗体对于蛋白质靶点的特异性、种间交叉反应、检测 系统的灵敏性以及细胞或组织的固定类型是该方法的关键系统的灵敏性以及细胞或组织的固定类型是该方法的关键 因素。因素。 运用双重着色或多重着色程序同时对多个感兴趣的靶分子运用双重着色或多重着色程序同时对多个感兴趣的靶分子 进行检测,是一种揭示更多有关细胞群的功能和它们之间进行检测,是一种揭示更多有关细胞群的功能和它们之间 相互作用信息的有效方法。相互作用信息的有效方法。 免疫组化主要是作为定性、定位的技术,若结合密度计量免疫组化主要是作为定性

17、、定位的技术,若结合密度计量 系统、图像分析系统等测量工具也可以得到定量的数据。系统、图像分析系统等测量工具也可以得到定量的数据。 目目 录录 目目 录录 流式细胞术(流式细胞术(flow cytometry)在细胞水平分析特定在细胞水平分析特定 蛋白质的基本原理也是抗原蛋白质的基本原理也是抗原-抗体反应,它利用荧光标记抗体反应,它利用荧光标记 抗体与抗原的特异性结合,经过流式细胞仪分析荧光信号,抗体与抗原的特异性结合,经过流式细胞仪分析荧光信号, 从而根据细胞表达特定蛋白质的水平对某种蛋白质阳性细从而根据细胞表达特定蛋白质的水平对某种蛋白质阳性细 胞(即特异基因表达的细胞)作出判断。胞(即特

18、异基因表达的细胞)作出判断。 (四)流式细胞术用于分析(四)流式细胞术用于分析 表达特异蛋白质的阳性细胞表达特异蛋白质的阳性细胞 目目 录录 流式细胞术可以检测活细胞,也可以检测用甲醛固定的流式细胞术可以检测活细胞,也可以检测用甲醛固定的 细胞。细胞。 广泛应用于细胞表面和细胞内分子表达水平的定量分析,广泛应用于细胞表面和细胞内分子表达水平的定量分析, 并能够根据各种蛋白质的表达模式区分细胞亚群。并能够根据各种蛋白质的表达模式区分细胞亚群。 此外,流式细胞术可以使用多个荧光标记的抗体同时对此外,流式细胞术可以使用多个荧光标记的抗体同时对 多个基因产物进行标记和监测,是对细胞进行快速分析、多个基

19、因产物进行标记和监测,是对细胞进行快速分析、 分选、特征鉴定的一种有效方法。分选、特征鉴定的一种有效方法。 目目 录录 目目 录录 三、高通量检测技术成为基因表达三、高通量检测技术成为基因表达 研究的有力工具研究的有力工具 高通量筛选高通量筛选(High throughput screening,HTS)技术技术 是在大量核酸、多肽信息累计(即资料库)基础上,采是在大量核酸、多肽信息累计(即资料库)基础上,采 用微板作为分子载体,制作集成用微板作为分子载体,制作集成“芯片芯片”,以自动化操,以自动化操 作系统进行分子杂交的试验过程。作系统进行分子杂交的试验过程。 因为快捷、灵敏、信息量大,适合

20、大规模操作,故因为快捷、灵敏、信息量大,适合大规模操作,故 称称“高通量高通量”。 高通量检测技术适合高通量检测技术适合“组学组学”(omics)研究,更)研究,更 适合生命活动过程相关的基因表达谱分析。适合生命活动过程相关的基因表达谱分析。 目目 录录 目目 录录 1. 1. 基因芯片已成为基因表达谱分析的常用方法基因芯片已成为基因表达谱分析的常用方法 基因芯片(基因芯片(gene chip)又称)又称DNA微阵列微阵列(DNA microarray)、 DNA芯片(芯片(DNA chip), 是将大量已知序列的核酸片段(包括是将大量已知序列的核酸片段(包括 寡核苷酸、寡核苷酸、cDNA、基

21、因组、基因组DNA、microRNA等等) 集成在同一基集成在同一基 片上,组成密集分子排列,通过与标记样品进行杂交,检测、片上,组成密集分子排列,通过与标记样品进行杂交,检测、 获取细胞或组织的基因信息。获取细胞或组织的基因信息。 其中其中基因表达谱(基因表达谱(expression prifile)分析)分析是目前基因芯片是目前基因芯片 应用最多的一个方面,主要采用应用最多的一个方面,主要采用cDNA芯片,基因表达谱芯片芯片,基因表达谱芯片 便于对不同状态(如生理和病理条件)下的基因表达谱进行比便于对不同状态(如生理和病理条件)下的基因表达谱进行比 较,揭示较,揭示转录组(转录组(tran

22、scriptome)差异表达的规律,对探索发差异表达的规律,对探索发 病机制、评价治疗效果、筛选药物靶标具有重要意义。病机制、评价治疗效果、筛选药物靶标具有重要意义。 (一)基因芯片和高通量测序技术可在基因(一)基因芯片和高通量测序技术可在基因 水平高通量地分析基因表达水平高通量地分析基因表达 目目 录录 目目 录录 2. 2. 高通量测序技术是新一代基因表达谱高通量测序技术是新一代基因表达谱 分析方法分析方法 高通量测序技术可以一次对几十万到几百万个高通量测序技术可以一次对几十万到几百万个 DNA分子片段进行序列测定,从而快速获得转录组或分子片段进行序列测定,从而快速获得转录组或 基因组的全

23、貌基因组的全貌, 又被称为又被称为深度测序深度测序(deep sequencing)。 目目 录录 目目 录录 在在DNA水平上,可以大规模地分析基因组甲基化、筛选突变基水平上,可以大规模地分析基因组甲基化、筛选突变基 因、检测基因多态性;因、检测基因多态性; 在在RNA水平上,可以对水平上,可以对RNA片段进行扫描、定量与鉴定,对全片段进行扫描、定量与鉴定,对全 基因组进行广谱表达研究。基因组进行广谱表达研究。 1)目前,高通量测序技术不仅仅在)目前,高通量测序技术不仅仅在DNA测序中起到重测序中起到重 要的作用,并且已经应用于基因组分析的各个方面:要的作用,并且已经应用于基因组分析的各个方

24、面: 2)高通量测序另一个被广泛应用的领域是小分子)高通量测序另一个被广泛应用的领域是小分子RNA 或非编码或非编码RNA(ncRNA)研究。测序方法能轻易地解决芯研究。测序方法能轻易地解决芯 片技术在检测小分子时遇到的技术难题片技术在检测小分子时遇到的技术难题(短序列短序列, 高度同高度同 源源), 而且小分子而且小分子RNA的短序列正好配合了高通量测序的的短序列正好配合了高通量测序的 长度长度,同时测序方法还能在实验中发现新的小分子同时测序方法还能在实验中发现新的小分子RNA。 目目 录录 目目 录录 基因芯片的缺点基因芯片的缺点: : 在于它是一个在于它是一个“封闭系统封闭系统”, ,

25、它只能检测人们已知它只能检测人们已知 序列的特征序列的特征( (或有限的变异或有限的变异) )。 高通量测序的优势高通量测序的优势: : 在于它是一个在于它是一个“开放系统开放系统”, , 它的发现能力和寻找它的发现能力和寻找 新信息的能力从本质上高于芯片技术。新信息的能力从本质上高于芯片技术。 目目 录录 目目 录录 (二)蛋白质芯片和双向电泳可在蛋白质水平(二)蛋白质芯片和双向电泳可在蛋白质水平 高通量地分析基因表达高通量地分析基因表达 蛋白质芯片(蛋白质芯片(protein chip)是一种对蛋白质的表达和是一种对蛋白质的表达和 功能进行高通量分析的技术。功能进行高通量分析的技术。 是将

26、具有高度亲和特异性的探针分子(如单克隆抗体)是将具有高度亲和特异性的探针分子(如单克隆抗体) 固定在基片上,用以识别复杂生物样品溶液中的目标多肽;固定在基片上,用以识别复杂生物样品溶液中的目标多肽; 蛋白质功能芯片可用来研究蛋白质修饰、蛋白质蛋白质功能芯片可用来研究蛋白质修饰、蛋白质-蛋白质蛋白质 /DNA-蛋白质蛋白质/RNA-蛋白质,以及蛋白质与脂质、蛋白质蛋白质,以及蛋白质与脂质、蛋白质 与药物、酶与底物、小分子与药物、酶与底物、小分子-蛋白质等的相互作用。蛋白质等的相互作用。 1 1蛋白质芯片有多种形式和用途蛋白质芯片有多种形式和用途 目目 录录 目目 录录 蛋白质检测芯片包括蛋白质检

27、测芯片包括: : 1. 1. 抗体芯片抗体芯片 2. 2. 抗原芯片抗原芯片 3. 3. 配体芯片配体芯片 4. 4. 碳水化合物芯片等碳水化合物芯片等 根据蛋白质芯片制作方法和用途不同,可将其分为根据蛋白质芯片制作方法和用途不同,可将其分为 1. 1. 蛋白质检测芯片蛋白质检测芯片 2. 2. 蛋白质功能芯片两大类蛋白质功能芯片两大类 目目 录录 目目 录录 目前比较和鉴定蛋白质表达谱更多采用双向聚丙烯酰目前比较和鉴定蛋白质表达谱更多采用双向聚丙烯酰 胺凝胶电泳结合质谱技术。双向聚丙烯酰胺凝胶电泳技术胺凝胶电泳结合质谱技术。双向聚丙烯酰胺凝胶电泳技术 又称又称二维电泳(二维电泳(two-di

28、mensional electrophoresis, 简称简称2-D 电泳)。电泳)。 原理原理: 根据蛋白质分子的两个属性根据蛋白质分子的两个属性等电点和分子等电点和分子 质量质量将蛋白质混合物进行分离。电泳结果经染色后,将蛋白质混合物进行分离。电泳结果经染色后, 即可对不同样品中蛋白质的表达谱进行比较;还可从凝胶即可对不同样品中蛋白质的表达谱进行比较;还可从凝胶 中将特定的蛋白质点切下,经胰蛋白酶消化后得到短肽片中将特定的蛋白质点切下,经胰蛋白酶消化后得到短肽片 段,利用段,利用质谱(质谱(mass spectrum)技术进行定性分析,对差)技术进行定性分析,对差 异表达的蛋白质进行鉴定。

29、异表达的蛋白质进行鉴定。 可同时分离数成百上千的蛋白质。可同时分离数成百上千的蛋白质。 2 2双向电泳结合质谱普遍用于蛋白质表达双向电泳结合质谱普遍用于蛋白质表达 谱的分析和鉴定谱的分析和鉴定 目目 录录 目目 录录 第二节第二节 生物信息学在预测基因生物信息学在预测基因 功能中的应用功能中的应用 Bioinformatics Application in Predicting Gene Function 目目 录录 目目 录录 一、利用生物信息学方法进行基因功能一、利用生物信息学方法进行基因功能 注释注释 (一)通过序列比对预测基因功能一)通过序列比对预测基因功能 序列比对是生物信息学最基本

30、的分析技术之一,最常序列比对是生物信息学最基本的分析技术之一,最常 用的方法是将目的用的方法是将目的DNA或蛋白质序列与已知的或蛋白质序列与已知的DNA和蛋白和蛋白 质序列数据库进行比对,搜索到与目的序列高度同源的功质序列数据库进行比对,搜索到与目的序列高度同源的功 能已知的基因或蛋白质,用这些基因和蛋白质预测目的基能已知的基因或蛋白质,用这些基因和蛋白质预测目的基 因和蛋白质的功能。局部比对搜索工具因和蛋白质的功能。局部比对搜索工具BLAST是进行序列是进行序列 比对的基本工具,它允许用户选择一条查询序列与一个数比对的基本工具,它允许用户选择一条查询序列与一个数 据库进行比对,找到数据库中与

31、输入的查询序列相匹配的据库进行比对,找到数据库中与输入的查询序列相匹配的 项。项。BLAST是一个序列数据库搜索程序家族,其中包括许是一个序列数据库搜索程序家族,其中包括许 多有特定用途的程序。多有特定用途的程序。 目目 录录 目目 录录 程序程序 查询序列查询序列 类型类型 数据库类型数据库类型注注 BLASTNDNADNA BLASTP蛋白质蛋白质蛋白质蛋白质 BLASTXDNA蛋白质蛋白质 将待搜索的核酸序列按将待搜索的核酸序列按6个阅读框翻译成蛋白个阅读框翻译成蛋白 质序列,然后与数据库中的蛋白质序列比对质序列,然后与数据库中的蛋白质序列比对 TBLASTN蛋白质蛋白质DNA 将数据库

32、中的核酸序列按将数据库中的核酸序列按6个阅读框翻译成蛋个阅读框翻译成蛋 白质序列,然后与待搜索的蛋白质序列比对白质序列,然后与待搜索的蛋白质序列比对 TBLASTXDNADNA 无论是待搜索的核酸序列还是数据库中的核无论是待搜索的核酸序列还是数据库中的核 酸序列都按酸序列都按6个阅读框翻译成蛋白质序列,然个阅读框翻译成蛋白质序列,然 后比对后比对 BLAST序列数据库搜索程序家族序列数据库搜索程序家族 目目 录录 目目 录录 (二)利用生物信息学方法分析基因芯片数据(二)利用生物信息学方法分析基因芯片数据 最常用的方法有:最常用的方法有: 差异表达分析(又称基因表达差异分析)差异表达分析(又称

33、基因表达差异分析) 聚类分析聚类分析 差异表达分析的目的:差异表达分析的目的: 识别两个条件下表达差异显著的基因,即一个基因识别两个条件下表达差异显著的基因,即一个基因 在两个条件中的表达水平,在排除各种偏差后,其差异在两个条件中的表达水平,在排除各种偏差后,其差异 具有统计学意义具有统计学意义 目目 录录 1. 1. 倍数分析:倍数分析:计算每个基因在两个条件下的表达比值;计算每个基因在两个条件下的表达比值; 2. 2. 统计分析中的统计分析中的t t检验和方差分析:检验和方差分析:通过计算表达差异的通过计算表达差异的 置信度来分析差异是否具有统计学意义;置信度来分析差异是否具有统计学意义;

34、 3. 3. 建模的方法:建模的方法:通过确定两个条件下的模型参数是否相通过确定两个条件下的模型参数是否相 同来判断表达差异的显著性。同来判断表达差异的显著性。 差异表达分析常用的分析方法有差异表达分析常用的分析方法有3类:类: 目目 录录 目目 录录 聚类分析所依据的基本假设:聚类分析所依据的基本假设: 若组内基因具有相似的表达模式,则它们可能具有若组内基因具有相似的表达模式,则它们可能具有 相似的功能,例如受共同的转录因子调控的基因,或者相似的功能,例如受共同的转录因子调控的基因,或者 产物构成同一个蛋白复合体的基因,或者参与相同调控产物构成同一个蛋白复合体的基因,或者参与相同调控 路径的

35、基因。路径的基因。 在具体应用中可按照相似的表达谱对基因进行聚类,在具体应用中可按照相似的表达谱对基因进行聚类, 从而预测组内未知基因的功能。从而预测组内未知基因的功能。 目前已经有很多种聚类的方法应用到基因芯片的研目前已经有很多种聚类的方法应用到基因芯片的研 究当中,如层次聚类究当中,如层次聚类(Hierarchical clustering)、K 均值聚均值聚 类类(K-means clustering)、自组织映射、自组织映射(self organizing map)、PCA (principlecomponet analysis)等。等。 目目 录录 目目 录录 在氨基酸序列整体同源性

36、不明显的情况下,对在氨基酸序列整体同源性不明显的情况下,对 蛋白质的功能域进行分析将对预测基因功能提供极蛋白质的功能域进行分析将对预测基因功能提供极 其有价值的信息。目前已通过多序列比对将蛋白质其有价值的信息。目前已通过多序列比对将蛋白质 的同源序列收集在一起,确定了大量蕴藏于蛋白质的同源序列收集在一起,确定了大量蕴藏于蛋白质 结构中的保守区域或序列,如结构域(结构中的保守区域或序列,如结构域(domain)和)和 模体(模体(motif),这些共享结构域和保守模体通常与),这些共享结构域和保守模体通常与 特定的生物学活性相关,反映了蛋白质分子的一些特定的生物学活性相关,反映了蛋白质分子的一些

37、 重要功能。重要功能。 (三)通过生物信息学方法分析蛋白质(三)通过生物信息学方法分析蛋白质 结构来预测蛋白质功能结构来预测蛋白质功能 目目 录录 目目 录录 运用蛋白质序列模体搜索工具预测蛋白质功能的方法是:运用蛋白质序列模体搜索工具预测蛋白质功能的方法是: 首先收集现有的蛋白质家族,构造模体数据库;首先收集现有的蛋白质家族,构造模体数据库; 而后通过搜索该数据库确定查询序列是否具有可能的序而后通过搜索该数据库确定查询序列是否具有可能的序 列模体,判断该序列是否属于一个已知的蛋白质家族;列模体,判断该序列是否属于一个已知的蛋白质家族; 然后根据该蛋白质家族的已知功能预测未知蛋白质的功然后根据

38、该蛋白质家族的已知功能预测未知蛋白质的功 能。能。 常用的模体数据库有常用的模体数据库有INTERPROSCAN、PROSITE、 SMART等。等。 目目 录录 目目 录录 基因组功能注释常用数据库基因组功能注释常用数据库 数据库数据库网址网址描述描述 AAThttp : / / genome. cs. mtu. edu / aat基因组分析和注释工具基因组分析和注释工具 COGhttp : / / www. ncbi. nlm. nih. gov / COG/直系同源体簇分析数据库直系同源体簇分析数据库 EcoCychttp : / / ecocyc. pangeasystems. com

39、/ ecocyc/ ecocyc. html 大肠杆菌的基因与代谢大肠杆菌的基因与代谢 OMIMhttp : / / www. ncbi. nlm. nih. gov / Omim/在线人类孟德尔遗传资料在线人类孟德尔遗传资料 PEDENThttp : / / pedant . mips. biochem. mpg. de/ frishman/ pedant . html 完整基因组的生物信息学分析完整基因组的生物信息学分析 SAShttp : / / www. biochem. ucl. ac. uk/ cgi2bin/ sas/ query. cgi 结构为基础的基因组序列分析结构为基础的

40、基因组序列分析 WIThttp : / / www. cme. msu. edu/ WIT/基因组代谢途径重构基因组代谢途径重构 目目 录录 目目 录录 现在人们已经越来越清楚地认识到,生物功能大多现在人们已经越来越清楚地认识到,生物功能大多 不是只由一个或几个基因控制的,而是通过生物体内众不是只由一个或几个基因控制的,而是通过生物体内众 多的分子(如多的分子(如DNADNA、RNARNA、蛋白质和其他小分子物质)、蛋白质和其他小分子物质) 共同构成的复杂生物网络实现的。当前生物学面临的巨共同构成的复杂生物网络实现的。当前生物学面临的巨 大挑战之一就是,了解生物体内复杂的相互作用网络以大挑战之

41、一就是,了解生物体内复杂的相互作用网络以 及它们的动态特征。要想全面系统地解析这些复杂的生及它们的动态特征。要想全面系统地解析这些复杂的生 物网络需要大量相关数据的积累,现代基因芯片、蛋白物网络需要大量相关数据的积累,现代基因芯片、蛋白 质芯片等大规模数据采集技术大大加快了这一进程。目质芯片等大规模数据采集技术大大加快了这一进程。目 前人们已经利用生物技术和信息技术建立了各种生物网前人们已经利用生物技术和信息技术建立了各种生物网 络数据库和网站,可为研究者提供基因调控、信号转导、络数据库和网站,可为研究者提供基因调控、信号转导、 代谢途径、蛋白质相互作用等方面的信息。代谢途径、蛋白质相互作用等

42、方面的信息。 二、利用生物网络全面系统地了解二、利用生物网络全面系统地了解 基因的功能基因的功能 目目 录录 目目 录录 生物体任何细胞的遗传信息、基因都是相同的,生物体任何细胞的遗传信息、基因都是相同的, 但同一个基因在不同组织、不同细胞中的表达却不相但同一个基因在不同组织、不同细胞中的表达却不相 同。一个基因的表达既影响其他的基因,又受其他基同。一个基因的表达既影响其他的基因,又受其他基 因的影响,基因之间相互促进、相互抑制,构成一个因的影响,基因之间相互促进、相互抑制,构成一个 复杂的基因调控网络。复杂的基因调控网络。 基因调控网络研究就是:利用生物芯片等高通量基因调控网络研究就是:利用

43、生物芯片等高通量 技术所产生的大量基因表达谱数据,以及蛋白质技术所产生的大量基因表达谱数据,以及蛋白质- - DNADNA间的相互作用等信息,结合实验室研究结果,用间的相互作用等信息,结合实验室研究结果,用 生物信息学方法构建基因调控模型,对某一物种或组生物信息学方法构建基因调控模型,对某一物种或组 织的基因表达关系进行整体性研究,从而推断基因之织的基因表达关系进行整体性研究,从而推断基因之 间的调控关系,揭示支配基因表达和功能的基本规律。间的调控关系,揭示支配基因表达和功能的基本规律。 (一)利用生物网络研究基因调控(一)利用生物网络研究基因调控 目目 录录 目目 录录 常用基因转录调控数据

44、库常用基因转录调控数据库 数据库数据库网址网址描述描述 EPD 真核生物启动子数据库真核生物启动子数据库 http:/www.epd.idb-sib.ch 包含已被实验证明的转录起始位点包含已被实验证明的转录起始位点 和组织特异性等启动子的一般信息和组织特异性等启动子的一般信息 TFD 转录因子数据库转录因子数据库 / 是转录因子及其特性的专门数据库,是转录因子及其特性的专门数据库, 收集有关多肽相互作用信息收集有关多肽相互作用信息 TRANSFAC数据库数据库 http:/www.gene-regulation. com/pub/database.html

45、# transcompel 提供转录因子结构、功能、序列、提供转录因子结构、功能、序列、 DNA结合谱以及分类,还包括基因结合谱以及分类,还包括基因 的转录因子结合位点的信息的转录因子结合位点的信息 TRRD 转录调控区数据库转录调控区数据库 http:/www.bionet.nsc.ru/ trrd/celcyc/ 收集了关于真核基因整个调控区分收集了关于真核基因整个调控区分 级结构和基因表达模式的信息级结构和基因表达模式的信息 目目 录录 目目 录录 信号转导是生物系统的重要生命活动过程,机体信号转导是生物系统的重要生命活动过程,机体 通过信号转导通路中分子之间的相互识别、联络和相通过信号

46、转导通路中分子之间的相互识别、联络和相 互作用互作用, , 实现整体功能上的协调统一。由于细胞内各种实现整体功能上的协调统一。由于细胞内各种 信号通路之间存在着紧密的联系和交叉调控信号通路之间存在着紧密的联系和交叉调控, , 形成了非形成了非 常复杂的信号转导网络。信号转导网络研究的目的是常复杂的信号转导网络。信号转导网络研究的目的是 期望通过建立细胞信号传导过程的模型,找出参与此期望通过建立细胞信号传导过程的模型,找出参与此 过程的各个蛋白质间的相互作用关系,阐明其在基因过程的各个蛋白质间的相互作用关系,阐明其在基因 调控、疾病发生中的作用。调控、疾病发生中的作用。 生物信息学方法利用已知数

47、据和生物学知识进行生物信息学方法利用已知数据和生物学知识进行 通路推断通路推断, , 可以帮助阐释信号分子作用机制可以帮助阐释信号分子作用机制, , 辅助实验辅助实验 设计设计, , 节省大量的人力物力。有关信号转导通路的网上节省大量的人力物力。有关信号转导通路的网上 数据库资源较多数据库资源较多 。 (二)利用生物网络研究信号转导(二)利用生物网络研究信号转导 目目 录录 目目 录录 常用信号通路数据库常用信号通路数据库 数据库数据库网址网址描述描述 Biocartahttp:/www. biocarta. com信号通路图片及注释数据库信号通路图片及注释数据库 Reactomehttp:/

48、www. reactome. org 生物核心通路及反应的挖掘知识库生物核心通路及反应的挖掘知识库 PIDhttp:/pid. nci. nih. gov 从其他数据库导入及文献挖掘的人从其他数据库导入及文献挖掘的人 信号通路数据库信号通路数据库 STKEhttp:/stke. sciencemag. org 参与信号转导的分子及其相互作用参与信号转导的分子及其相互作用 关系的信息关系的信息 AfCShttp:/www. signaling- gateway. org 参与信号通路的蛋白质相互作用和参与信号通路的蛋白质相互作用和 信号通路图信号通路图 DOQCShttp:/doqcs. ncb

49、s. res. in 细胞信号通路的量化数据库细胞信号通路的量化数据库, 提供提供 反应参数及注释信息反应参数及注释信息 SigPathhttp:/sigpath. org 提供细胞信号通路的量化信息提供细胞信号通路的量化信息 目目 录录 目目 录录 代谢网络处于生物体的功能执行阶段,其结构组代谢网络处于生物体的功能执行阶段,其结构组 成方式反映了生物体的功能构成。代谢网络把细胞内成方式反映了生物体的功能构成。代谢网络把细胞内 所有生化反应表示为网络形式,反映了代谢活动中所所有生化反应表示为网络形式,反映了代谢活动中所 有化合物及酶之间的相互作用。有化合物及酶之间的相互作用。 通过基因组注释信

50、息可以识别出编码催化生物体通过基因组注释信息可以识别出编码催化生物体 内生化反应的酶的基因内生化反应的酶的基因, ,结合相关的酶反应数据库就可结合相关的酶反应数据库就可 以预测物种特异的酶基因、酶以及酶催化反应,由此以预测物种特异的酶基因、酶以及酶催化反应,由此 产生了许多优秀的代谢数据库产生了许多优秀的代谢数据库, ,可以方便地检索某一生可以方便地检索某一生 物代谢网络中的代谢反应。物代谢网络中的代谢反应。 (三)利用生物网络研究代谢途径(三)利用生物网络研究代谢途径 目目 录录 目目 录录 常用代谢网络数据库常用代谢网络数据库 数据库数据库网址网址描述描述 KEGGhttp:/www.ge

51、nome.ad.jp/ke gg/ 包括了包括了700个以上物种的代谢、信号个以上物种的代谢、信号 转导、基因调控、细胞过程的通路转导、基因调控、细胞过程的通路 BioCyc/包括了包括了260个物种的代谢通路及基因个物种的代谢通路及基因 组数据组数据 PUMA2/p uma2/ 存放了预先计算的超过存放了预先计算的超过200个物种的个物种的 代谢通路信息代谢通路信息 BioSilicohttp:/biosilico.kaist.ac.kr:80 17/biochemdb/index.jsp 整合信息的数

52、据库,提供对多个代谢整合信息的数据库,提供对多个代谢 数据库的访问数据库的访问 目目 录录 目目 录录 (四)利用生物网络研究蛋白质相互作用(四)利用生物网络研究蛋白质相互作用 从某种程度上可以说,细胞进行的生命活动,是从某种程度上可以说,细胞进行的生命活动,是 蛋白质在一定条件下相互作用的结果,若蛋白质相互蛋白质在一定条件下相互作用的结果,若蛋白质相互 作用网络被破坏或稳定性丢失,会引起细胞的功能性作用网络被破坏或稳定性丢失,会引起细胞的功能性 障碍。阐明蛋白质相互作用的完整网络结构,有助于障碍。阐明蛋白质相互作用的完整网络结构,有助于 从系统的角度加深对细胞结构和功能的认识。从系统的角度加

53、深对细胞结构和功能的认识。 近年来各种预测蛋白质相互作用的计算方法被不近年来各种预测蛋白质相互作用的计算方法被不 断提出,将这些方法与实验方法结合,挖掘出了蛋白断提出,将这些方法与实验方法结合,挖掘出了蛋白 质相互作用网络中更多的相互作用节点,目前已有多质相互作用网络中更多的相互作用节点,目前已有多 个蛋白质相互作用的数据库应运而生,可用来研究蛋个蛋白质相互作用的数据库应运而生,可用来研究蛋 白质相互作用的生物学过程白质相互作用的生物学过程 。 目目 录录 目目 录录 常用蛋白质互作网络数据库常用蛋白质互作网络数据库 数据库数据库网址网址描述描述 BINDhttp:/www. bind. ca

54、 提供参与通路的分子的序列和相互作用信息提供参与通路的分子的序列和相互作用信息 DIPhttp:/dip.doe- 专门存放实验确定的蛋白质之间相互作用的专门存放实验确定的蛋白质之间相互作用的 数据数据,既包括经典实验手段也包括高通量实验既包括经典实验手段也包括高通量实验 手段确定的蛋白质相互作用数据手段确定的蛋白质相互作用数据 STRINGhttp:/string.embl.de存储实验确定的和预测得到的蛋白质相互作存储实验确定的和预测得到的蛋白质相互作 用数据,并对各种预测方法得到的结果的准用数据,并对各种预测方法得到的结果的准 确性给出了相应的权重确性给出了相应

55、的权重 MIPShttp:/mips.gsf.de包括酵母和哺乳动物的包括酵母和哺乳动物的PPI,可靠性很高可靠性很高,被作被作 为准金标准使用为准金标准使用 Yeast Interactome /rakesh/myindex.html 综合多种来源的由酵母双杂交技术确定的酵综合多种来源的由酵母双杂交技术确定的酵 母母PPI数据集数据集, 利用基因表达信息、蛋白亚细利用基因表达信息、蛋白亚细 胞定位信息以及已知的各种知识对其进行验胞定位信息以及已知的各种知识对其进行验 证形成高可信度的相互作用数据证形成高可信度的相互作用数据 目目 录录 目目 录录

56、 三、复杂疾病的生物信息学研究策略三、复杂疾病的生物信息学研究策略 包括信息提取、分析和建模包括信息提取、分析和建模 癌症、糖尿病、高血压等复杂疾病对人类健康影响癌症、糖尿病、高血压等复杂疾病对人类健康影响 巨大,这类疾病的发病机制一般与多种遗传或非遗传因巨大,这类疾病的发病机制一般与多种遗传或非遗传因 素,以及它们之间的相互作用有关,不能通过单基因、素,以及它们之间的相互作用有关,不能通过单基因、 单通路、单层次的变化解释。单通路、单层次的变化解释。 以系统的观点解释复杂疾病中遗传与环境的关系、以系统的观点解释复杂疾病中遗传与环境的关系、 描述复杂疾病中基因的特征、分析疾病基因型与表现型描述

57、复杂疾病中基因的特征、分析疾病基因型与表现型 之间的关系,已成为生物信息学研究复杂疾病的基本观之间的关系,已成为生物信息学研究复杂疾病的基本观 点,针对复杂疾病的研究模式,也开始从传统的点,针对复杂疾病的研究模式,也开始从传统的“序列序列 结构结构功能功能”向向“相互作用相互作用网络网络功能功能”转变。转变。 目目 录录 目目 录录 疾病的基因组合及相互作用信息的提取:即对复杂疾病相关疾病的基因组合及相互作用信息的提取:即对复杂疾病相关 靶基因的识别,以及利用靶基因的识别,以及利用SNPsSNPs、基因、蛋白质等不同类型、基因、蛋白质等不同类型 的信息,构建疾病驱使相关基因网络。的信息,构建疾

58、病驱使相关基因网络。 生物信息分析及多层次信息的融合:即从不同层次对疾病的生物信息分析及多层次信息的融合:即从不同层次对疾病的 遗传复杂性进行分析,对不同遗传网络间的映射算法进行研遗传复杂性进行分析,对不同遗传网络间的映射算法进行研 究,进而将究,进而将SNPsSNPs、基因、蛋白质等不同水平的信息进行融、基因、蛋白质等不同水平的信息进行融 合。合。 分子调控网络建模:即综合生理病理相关的基因、分子调控网络建模:即综合生理病理相关的基因、SNPsSNPs、 基因表达状况,蛋白质功能状态以及临床治疗等信息,以系基因表达状况,蛋白质功能状态以及临床治疗等信息,以系 统的方法将不同的测量数据、各种因

59、素的辨识、各个层次上统的方法将不同的测量数据、各种因素的辨识、各个层次上 的相互作用关系进行整合,建立数学模型,深入了解疾病过的相互作用关系进行整合,建立数学模型,深入了解疾病过 程、揭示复杂疾病的发病机制。程、揭示复杂疾病的发病机制。 复杂疾病的基本研究策略复杂疾病的基本研究策略 目目 录录 目目 录录 第三节第三节 基因的生物学功能鉴定技术基因的生物学功能鉴定技术 Methods for Identifying Biological Functions of Genes 目目 录录 目目 录录 目前在已知的目前在已知的2.52.5万万3 3万个人类基因中,大约万个人类基因中,大约70%70

60、%的基因我们还的基因我们还 不清楚它们的功能,有不清楚它们的功能,有90%90%的基因我们不知道它们在体内的确切的基因我们不知道它们在体内的确切 生理作用,因此,利用各种技术手段研究基因组中功能未知基生理作用,因此,利用各种技术手段研究基因组中功能未知基 因的作用,将是因的作用,将是“后基因组时代后基因组时代”功能基因组学研究的主要内功能基因组学研究的主要内 容。容。 生物信息学利用已知数据和生物学知识进行合理推断生物信息学利用已知数据和生物学知识进行合理推断, , 可以节省可以节省 大量的人力物力,但基因功能的鉴定最终仍需要通过实验来验大量的人力物力,但基因功能的鉴定最终仍需要通过实验来验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论