版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二十六章
基因表达及功能分析的基本策略STRATEGIESFORANALYZINGGENEEXPRESSIONANDFUNCTION第二十六章第一节基因表达的分析策略StrategiesforAnalyzingGeneExpression第一节一、通过检测mRNA揭示基因转录水平的表达特征根据分析方法的原理和功能特性,可将基因表达分析分为:封闭性系统研究方法:例如DNA微阵列、Northern印迹、实时RT-PCR等方法,其应用范围仅限于已测序的物种,只能研究已知的基因。开放性系统研究方法:
如差异显示PCR、双向基因表达指纹图谱、分子索引法、随机引物PCR指纹分析等,可以发现和分析未知的基因。这里主要针对已知基因的常用表达分析方法做一介绍。一、通过检测mRNA根据分析方法的原理和功能特性,可将基因表(一)基于杂交原理的方法可检测mRNA表达水平1.Northern印迹(Northernblot)既可分析mRNA表达又可验证cDNA新序列是一种基于RNA-DNA杂交原理建立的一种RNA分析技术(一)基于杂交原理的方法可检测mRNA表达水平1.NorthNorthern印迹分析原理示意图Northern印迹分析原理示意图2.核糖核酸酶保护实验(ribonucleaseprotectionassay,RPA)可用于mRNA定量和RNA剪接分析是一种基于杂交原理分析mRNA的方法,既可对mRNA进行定量分析又可研究其结构特征,灵敏度和特异性都很高。2.核糖核酸酶保护实验核糖核酸酶保护实验原理示意图核糖核酸酶保护实验原理示意图可对mRNA进行区域定位
是利用杂交原理建立的组织原位mRNA检测技术,可对细胞或组织中原位表达的mRNA进行区域定位。同时也可作为定量分析的补充。通过设计与目标mRNA碱基序列互补的寡核苷酸序列,标记后作为探针;该探针能够特异性地与目标靶序列杂交,检测标记信号来确定基因在组织和细胞内表达的区位信息。虽然原位杂交在功能性方面提供的信息较少,但是该技术还是被广泛用于组织中的基因表达分析,这是因为其较高的稳定性、较广泛的靶点和组织适用性。3.原位杂交(insituhybridization,ISH)可对mRNA进行区域定位3.原位杂交(insituhy(二)两种变换的聚合酶链式反应是常用的mRNA检测方法1.反转录PCR可用于mRNA的半定量分析
反转录PCR(reversetranscription-PCR,RT-PCR)是一种简单、快捷地对RNA进行定性、定量分析的方法。它是以mRNA为模板,体外扩增cDNA,再以cDNA为模板进行特定基因转录产物的PCR扩增。RT-PCR技术一般用于RNA的定性分析;如果设置阳性参照,则可对待测RNA样品进行半定量分析。该方法适合对待测样品进行初步筛选,目前已广泛被实时定量PCR替代。(二)两种变换的聚合酶链式反应是常用的mRNA检测方法1.反常用于mRNA的定量分析实时定量PCR(Real-timeQuantitativePolymerasechainReaction,RQ-PCR)是定量分析mRNA的最通用、最快速、最简便的方法,该方法是对PCR反应进行实时监测,具有很高的灵敏度和特异性。2.实时定量PCR2.实时定量PCR目前有5种技术用于实时定量PCR:其中最经济、简便的技术是利用荧光染料(如SYBRGreen
)与双链DNA分子结合发光的特性,指示扩增产物的增加;其他4种方法都是以荧光染料标记的寡核苷酸为探针与正确的扩增子杂交,包括5’核酸酶法(即人们熟知的TaqManTM)、分子信标、ScropionsTM和探针杂交法,它们拥有更强的特异性,可以避免对PCR后溶解曲线的需求,以及后续的Southern杂交或对扩增子的测序鉴定,但是成本较高。目前有5种技术用于实时定量PCR:SYBRGreen实时定量PCR分析原理示意图SYBRGreen实时定量PCR分析原理示意图二、通过蛋白质检测揭示基因翻译水平的表达特征
Western印迹(Westernblot)是一种免疫印迹技术,其基本原理与核酸分子杂交相似,只是以偶联标记物的抗体分子作为探针,检测转移到固相支持物上的蛋白质/多肽分子。当在蛋白质水平上检测特定基因的表达活性时,最常用的方法就是利用Western印迹对细胞或组织的总蛋白质中的特异蛋白质进行定性和半定量分析。(一)采用特异抗体经Western印迹可直接测定基因编码多肽二、通过蛋白质检测揭示基因Western印迹蛋白质样品的制备SDS分离蛋白质转膜特异抗体(即第一抗体)与膜上的蛋白质(抗原)印迹杂交再经偶联了可检测标记信号的第二抗体(即抗抗体,商品试剂盒中多采用偶联辣根过氧化物酶的Ig)最后经与酶的底物反应而显影、成像,经扫描后获取免疫印迹信息Westernblot基本程序Westernblot基本程序
酶联免疫吸附分析(Enzyme-linkedimmunosorbentassay,ELISA)也是一种建立在抗原-抗体反应基础上的蛋白质分析基本方法。该方法不需经电泳分离待检样品蛋白质,而是预先将样品包被在支持体上,以后反应过程与Western印迹大致相同——顺序结合(即“吸附”)特异抗体(一抗)及与酶连接的第二抗体(也可预先包被抗体,“吸附”抗原),再进行酶-底物反应。反应后通过专门的酶标仪测定、记录数据。(二)酶联免疫吸附分析与Western印迹原理相似但形式不同酶联免疫吸附分析(Enzyme-linke特点:具有特异性;灵敏度很高;稳定、操作简便,标本用量少,适于大规模筛查,尤其适用于检测体液中微量的特异性抗体或抗原;既可以做定性试验也可以做定量分析。被广泛应用于微生物学、寄生虫学、肿瘤学和免疫学等领域。酶联免疫吸附分析特点:酶联免疫吸附分析
免疫组织化学(immunohistochemistry)与免疫细胞化学(immunocytochemistry)原理相同,都是利用标记的特异性抗体通过抗原-抗体反应和显色反应,在组织或细胞原位检测特定抗原(即目标蛋白质)的方法,简称为免疫组化实验。近年来由于荧光标记抗体的广泛应用,这两种方法又被统称为免疫荧光法。(三)免疫组化实验可对组织/细胞表达的蛋白质进行原位检测免疫组织化学(immunohistochem(immunofluorescence),可应用荧光(倒置)显微镜或激光共聚焦显微镜(confocalmicroscopy)对靶分子进行定性、定量和定位分析,激光共聚焦显微镜还可进行断层成像,是在蛋白质水平分析基因表达的直观方法。其中抗体对于蛋白质靶点的特异性、种间交叉反应、检测系统的灵敏性以及细胞或组织的固定类型是该方法的关键因素。运用双重着色或多重着色程序同时对多个感兴趣的靶分子进行检测,是一种揭示更多有关细胞群的功能和它们之间相互作用信息的有效方法。免疫组化主要是作为定性、定位的技术,若结合密度计量系统、图像分析系统等测量工具也可以得到定量的数据。(immunofluorescence),可应用荧光(倒置)
流式细胞术(flowcytometry)在细胞水平分析特定蛋白质的基本原理也是抗原-抗体反应,它利用荧光标记抗体与抗原的特异性结合,经过流式细胞仪分析荧光信号,从而根据细胞表达特定蛋白质的水平对某种蛋白质阳性细胞(即特异基因表达的细胞)作出判断。(四)流式细胞术用于分析
表达特异蛋白质的阳性细胞流式细胞术(flowcytometry)流式细胞术可以检测活细胞,也可以检测用甲醛固定的细胞。广泛应用于细胞表面和细胞内分子表达水平的定量分析,并能够根据各种蛋白质的表达模式区分细胞亚群。此外,流式细胞术可以使用多个荧光标记的抗体同时对多个基因产物进行标记和监测,是对细胞进行快速分析、分选、特征鉴定的一种有效方法。流式细胞术可以检测活细胞,也可以检测用甲醛固定的细胞。三、高通量检测技术成为基因表达研究的有力工具
高通量筛选(Highthroughputscreening,HTS)技术是在大量核酸、多肽信息累计(即资料库)基础上,采用微板作为分子载体,制作集成“芯片”,以自动化操作系统进行分子杂交的试验过程。因为快捷、灵敏、信息量大,适合大规模操作,故称“高通量”。高通量检测技术适合“组学”(omics)研究,更适合生命活动过程相关的基因表达谱分析。三、高通量检测技术成为基因表达研究的有力工具基因芯片已成为基因表达谱分析的常用方法基因芯片(genechip)又称DNA微阵列(DNAmicroarray)、DNA芯片(DNAchip),是将大量已知序列的核酸片段(包括寡核苷酸、cDNA、基因组DNA、microRNA等)集成在同一基片上,组成密集分子排列,通过与标记样品进行杂交,检测、获取细胞或组织的基因信息。其中基因表达谱(expressionprifile)分析是目前基因芯片应用最多的一个方面,主要采用cDNA芯片,基因表达谱芯片便于对不同状态(如生理和病理条件)下的基因表达谱进行比较,揭示转录组(transcriptome)差异表达的规律,对探索发病机制、评价治疗效果、筛选药物靶标具有重要意义。(一)基因芯片和高通量测序技术可在基因水平高通量地分析基因表达基因芯片已成为基因表达谱分析的常用方法(一)基因芯片和高通量2.高通量测序技术是新一代基因表达谱分析方法高通量测序技术可以一次对几十万到几百万个DNA分子片段进行序列测定,从而快速获得转录组或基因组的全貌,又被称为深度测序(deepsequencing)。2.高通量测序技术是新一代基因表达谱分析方法
在DNA水平上,可以大规模地分析基因组甲基化、筛选突变基因、检测基因多态性;在RNA水平上,可以对RNA片段进行扫描、定量与鉴定,对全基因组进行广谱表达研究。1)目前,高通量测序技术不仅仅在DNA测序中起到重要的作用,并且已经应用于基因组分析的各个方面:2)高通量测序另一个被广泛应用的领域是小分子RNA或非编码RNA(ncRNA)研究。测序方法能轻易地解决芯片技术在检测小分子时遇到的技术难题(短序列,高度同源),而且小分子RNA的短序列正好配合了高通量测序的长度,同时测序方法还能在实验中发现新的小分子RNA。2)高通量测序另一个被广泛应用的领域是小分子RNA基因芯片的缺点:在于它是一个“封闭系统”,它只能检测人们已知序列的特征(或有限的变异)。高通量测序的优势:在于它是一个“开放系统”,它的发现能力和寻找新信息的能力从本质上高于芯片技术。基因芯片的缺点:(二)蛋白质芯片和双向电泳可在蛋白质水平高通量地分析基因表达
蛋白质芯片(proteinchip)是一种对蛋白质的表达和功能进行高通量分析的技术。是将具有高度亲和特异性的探针分子(如单克隆抗体)固定在基片上,用以识别复杂生物样品溶液中的目标多肽;蛋白质功能芯片可用来研究蛋白质修饰、蛋白质-蛋白质/DNA-蛋白质/RNA-蛋白质,以及蛋白质与脂质、蛋白质与药物、酶与底物、小分子-蛋白质等的相互作用。1.蛋白质芯片有多种形式和用途(二)蛋白质芯片和双向电泳可在蛋白质水平高通量地分析基因表达蛋白质检测芯片包括:抗体芯片抗原芯片配体芯片碳水化合物芯片等根据蛋白质芯片制作方法和用途不同,可将其分为1.蛋白质检测芯片2.蛋白质功能芯片两大类蛋白质检测芯片包括:根据蛋白质芯片制作方法和用途不同,可将其目前比较和鉴定蛋白质表达谱更多采用双向聚丙烯酰胺凝胶电泳结合质谱技术。双向聚丙烯酰胺凝胶电泳技术又称二维电泳(two-dimensionalelectrophoresis,简称2-D电泳)。原理:
根据蛋白质分子的两个属性——等电点和分子质量——将蛋白质混合物进行分离。电泳结果经染色后,即可对不同样品中蛋白质的表达谱进行比较;还可从凝胶中将特定的蛋白质点切下,经胰蛋白酶消化后得到短肽片段,利用质谱(massspectrum)技术进行定性分析,对差异表达的蛋白质进行鉴定。可同时分离数成百上千的蛋白质。2.双向电泳结合质谱普遍用于蛋白质表达谱的分析和鉴定目前比较和鉴定蛋白质表达谱更多采用双向聚丙烯第二节生物信息学在预测基因功能中的应用
BioinformaticsApplicationinPredictingGeneFunction第二节一、利用生物信息学方法进行基因功能注释(一)通过序列比对预测基因功能序列比对是生物信息学最基本的分析技术之一,最常用的方法是将目的DNA或蛋白质序列与已知的DNA和蛋白质序列数据库进行比对,搜索到与目的序列高度同源的功能已知的基因或蛋白质,用这些基因和蛋白质预测目的基因和蛋白质的功能。局部比对搜索工具BLAST是进行序列比对的基本工具,它允许用户选择一条查询序列与一个数据库进行比对,找到数据库中与输入的查询序列相匹配的项。BLAST是一个序列数据库搜索程序家族,其中包括许多有特定用途的程序。一、利用生物信息学方法进行基因功能注释(一)通过序列比对预测程序查询序列类型数据库类型注BLASTNDNADNABLASTP蛋白质蛋白质BLASTXDNA蛋白质将待搜索的核酸序列按6个阅读框翻译成蛋白质序列,然后与数据库中的蛋白质序列比对TBLASTN蛋白质DNA将数据库中的核酸序列按6个阅读框翻译成蛋白质序列,然后与待搜索的蛋白质序列比对TBLASTXDNADNA无论是待搜索的核酸序列还是数据库中的核酸序列都按6个阅读框翻译成蛋白质序列,然后比对BLAST序列数据库搜索程序家族程序查询序列类型数据库类型注BLASTNDNADNABLAS(二)利用生物信息学方法分析基因芯片数据最常用的方法有:差异表达分析(又称基因表达差异分析)聚类分析差异表达分析的目的:识别两个条件下表达差异显著的基因,即一个基因在两个条件中的表达水平,在排除各种偏差后,其差异具有统计学意义(二)利用生物信息学方法分析基因芯片数据最常用的方法有:倍数分析:计算每个基因在两个条件下的表达比值;统计分析中的t检验和方差分析:通过计算表达差异的置信度来分析差异是否具有统计学意义;建模的方法:通过确定两个条件下的模型参数是否相同来判断表达差异的显著性。差异表达分析常用的分析方法有3类:差异表达分析常用的分析方法有3类:聚类分析所依据的基本假设:若组内基因具有相似的表达模式,则它们可能具有相似的功能,例如受共同的转录因子调控的基因,或者产物构成同一个蛋白复合体的基因,或者参与相同调控路径的基因。在具体应用中可按照相似的表达谱对基因进行聚类,从而预测组内未知基因的功能。目前已经有很多种聚类的方法应用到基因芯片的研究当中,如层次聚类(Hierarchicalclustering)、K均值聚类(K-meansclustering)、自组织映射(selforganizingmap)、PCA(principlecomponetanalysis)等。聚类分析所依据的基本假设:
在氨基酸序列整体同源性不明显的情况下,对蛋白质的功能域进行分析将对预测基因功能提供极其有价值的信息。目前已通过多序列比对将蛋白质的同源序列收集在一起,确定了大量蕴藏于蛋白质结构中的保守区域或序列,如结构域(domain)和模体(motif),这些共享结构域和保守模体通常与特定的生物学活性相关,反映了蛋白质分子的一些重要功能。
(三)通过生物信息学方法分析蛋白质结构来预测蛋白质功能在氨基酸序列整体同源性不明显的情运用蛋白质序列模体搜索工具预测蛋白质功能的方法是:首先收集现有的蛋白质家族,构造模体数据库;而后通过搜索该数据库确定查询序列是否具有可能的序列模体,判断该序列是否属于一个已知的蛋白质家族;然后根据该蛋白质家族的已知功能预测未知蛋白质的功能。常用的模体数据库有INTERPROSCAN、PROSITE、SMART等。运用蛋白质序列模体搜索工具预测蛋白质功能的方法是:基因组功能注释常用数据库基因组功能注释常用数据库
现在人们已经越来越清楚地认识到,生物功能大多不是只由一个或几个基因控制的,而是通过生物体内众多的分子(如DNA、RNA、蛋白质和其他小分子物质)共同构成的复杂生物网络实现的。当前生物学面临的巨大挑战之一就是,了解生物体内复杂的相互作用网络以及它们的动态特征。要想全面系统地解析这些复杂的生物网络需要大量相关数据的积累,现代基因芯片、蛋白质芯片等大规模数据采集技术大大加快了这一进程。目前人们已经利用生物技术和信息技术建立了各种生物网络数据库和网站,可为研究者提供基因调控、信号转导、代谢途径、蛋白质相互作用等方面的信息。二、利用生物网络全面系统地了解基因的功能现在人们已经越来越清楚地认识到,生物功能大多
生物体任何细胞的遗传信息、基因都是相同的,但同一个基因在不同组织、不同细胞中的表达却不相同。一个基因的表达既影响其他的基因,又受其他基因的影响,基因之间相互促进、相互抑制,构成一个复杂的基因调控网络。基因调控网络研究就是:利用生物芯片等高通量技术所产生的大量基因表达谱数据,以及蛋白质-DNA间的相互作用等信息,结合实验室研究结果,用生物信息学方法构建基因调控模型,对某一物种或组织的基因表达关系进行整体性研究,从而推断基因之间的调控关系,揭示支配基因表达和功能的基本规律。
(一)利用生物网络研究基因调控生物体任何细胞的遗传信息、基因都常用基因转录调控数据库常用基因转录调控数据库信号转导是生物系统的重要生命活动过程,机体通过信号转导通路中分子之间的相互识别、联络和相互作用,实现整体功能上的协调统一。由于细胞内各种信号通路之间存在着紧密的联系和交叉调控,形成了非常复杂的信号转导网络。信号转导网络研究的目的是期望通过建立细胞信号传导过程的模型,找出参与此过程的各个蛋白质间的相互作用关系,阐明其在基因调控、疾病发生中的作用。生物信息学方法利用已知数据和生物学知识进行通路推断,可以帮助阐释信号分子作用机制,辅助实验设计,节省大量的人力物力。有关信号转导通路的网上数据库资源较多。
(二)利用生物网络研究信号转导信号转导是生物系统的重要生命活动过程,机体通常用信号通路数据库常用信号通路数据库代谢网络处于生物体的功能执行阶段,其结构组成方式反映了生物体的功能构成。代谢网络把细胞内所有生化反应表示为网络形式,反映了代谢活动中所有化合物及酶之间的相互作用。通过基因组注释信息可以识别出编码催化生物体内生化反应的酶的基因,结合相关的酶反应数据库就可以预测物种特异的酶基因、酶以及酶催化反应,由此产生了许多优秀的代谢数据库,可以方便地检索某一生物代谢网络中的代谢反应。
(三)利用生物网络研究代谢途径代谢网络处于生物体的功能执行阶段,其结构组成常用代谢网络数据库常用代谢网络数据库(四)利用生物网络研究蛋白质相互作用从某种程度上可以说,细胞进行的生命活动,是蛋白质在一定条件下相互作用的结果,若蛋白质相互作用网络被破坏或稳定性丢失,会引起细胞的功能性障碍。阐明蛋白质相互作用的完整网络结构,有助于从系统的角度加深对细胞结构和功能的认识。近年来各种预测蛋白质相互作用的计算方法被不断提出,将这些方法与实验方法结合,挖掘出了蛋白质相互作用网络中更多的相互作用节点,目前已有多个蛋白质相互作用的数据库应运而生,可用来研究蛋白质相互作用的生物学过程。(四)利用生物网络研究蛋白质相互作用从某种程常用蛋白质互作网络数据库常用蛋白质互作网络数据库三、复杂疾病的生物信息学研究策略包括信息提取、分析和建模癌症、糖尿病、高血压等复杂疾病对人类健康影响巨大,这类疾病的发病机制一般与多种遗传或非遗传因素,以及它们之间的相互作用有关,不能通过单基因、单通路、单层次的变化解释。以系统的观点解释复杂疾病中遗传与环境的关系、描述复杂疾病中基因的特征、分析疾病基因型与表现型之间的关系,已成为生物信息学研究复杂疾病的基本观点,针对复杂疾病的研究模式,也开始从传统的“序列→结构→功能”向“相互作用→网络→功能”转变。三、复杂疾病的生物信息学研究策略癌症、糖尿病①疾病的基因组合及相互作用信息的提取:即对复杂疾病相关靶基因的识别,以及利用SNPs、基因、蛋白质等不同类型的信息,构建疾病驱使相关基因网络。②生物信息分析及多层次信息的融合:即从不同层次对疾病的遗传复杂性进行分析,对不同遗传网络间的映射算法进行研究,进而将SNPs、基因、蛋白质等不同水平的信息进行融合。③分子调控网络建模:即综合生理病理相关的基因、SNPs、基因表达状况,蛋白质功能状态以及临床治疗等信息,以系统的方法将不同的测量数据、各种因素的辨识、各个层次上的相互作用关系进行整合,建立数学模型,深入了解疾病过程、揭示复杂疾病的发病机制。复杂疾病的基本研究策略——①疾病的基因组合及相互作用信息的提取:即对复杂疾病相关靶基因第三节基因的生物学功能鉴定技术MethodsforIdentifyingBiologicalFunctionsofGenes第三节目前在已知的2.5万~3万个人类基因中,大约70%的基因我们还不清楚它们的功能,有90%的基因我们不知道它们在体内的确切生理作用,因此,利用各种技术手段研究基因组中功能未知基因的作用,将是“后基因组时代”功能基因组学研究的主要内容。生物信息学利用已知数据和生物学知识进行合理推断,可以节省大量的人力物力,但基因功能的鉴定最终仍需要通过实验来验证。通常采用基因功能获得和/或基因功能缺失的策略,观察基因在细胞或生物个体中的,细胞生物学行为或个体表型遗传性状的变化,来鉴定基因的功能。此外,基于正向遗传学的随机突变筛选技术也成为揭示基因功能的重要手段。由于基因的功能必须在完整的生物个体及其生命过程中才能得到完整的体现,因此从整体水平研究基因的功能是必然的选择。目前在已知的2.5万~3万个人类基因中,大约70%的基因我们基因功能获得策略即通过将目的基因直接导入某一细胞或个体中,使其获得新的或更高水平的表达,通过细胞或个体生物性状的变化来研究基因的功能。常用的方法有转基因和基因敲入技术等。一、采用功能获得策略鉴定基因的功能基因功能获得策略即通过将目的基因直接导入某一细胞或个体中
转基因技术(transgenictechnology)是指将外源基因导入受精卵或胚胎干细胞中,通过随机重组使外源基因插入细胞染色体DNA,再将受精卵或胚胎干细胞植入受体动物的子宫,使得外源基因能够随细胞分裂遗传给后代。(一)用转基因技术获得基因功能转基因技术(transgenictech
转基因动物(transgenicanimal)是指应用转基因技术培育出的携带外源基因,并能稳定遗传的动物。其基本制作过程包括:转基因表达载体的构建,外源基因的导入,转基因动物的获得和鉴定,转基因动物品系的建立以及外源基因表达的鉴定。1.转基因动物可在整体水平研究基因的功能转基因动物(transgenicanim转基因动物制作原理示意图转基因动物制作原理示意图优点:利用转基因动物模型研究外源基因,能够接近真实地再现基因表达所导致的结果,及其在整体水平的调控规律,把复杂的系统简单化,具有系统性和独立性,是目前层次最高的实验体系。利用转基因技术建立的疾病动物模型具有遗传背景清楚、遗传物质改变简单、更自然更接近疾病的真实症状等优点。优点:但转基因动物模型仍存在一些亟待解决的问题:外源基因插入宿主基因组是随机的,可能产生插入突变,破坏宿主基因组功能;外源基因在宿主染色体上整合的拷贝数不等;整合的外源基因遗传丢失而导致转基因动物症状的不稳定遗传等。虽然转基因技术本身仍存在一些问题,但其在医学研究中的重要地位是毋庸置疑的,随着转基因技术的不断完善,其在医学及生物学领域必将有更加广泛的应用。但转基因动物模型仍存在一些亟待解决的问题:虽然目前,科学家已经采取了多种方法使转基因技术更加完善:为了更为精确地调控转基因的表达,使其获得时空特异性的调控,在构建转基因表达载体时,选择只在特定的细胞类型或特定的生命时期才启动基因表达的启动子,即可使外源基因获得时空特异性的表达。可调控的基因表达系统也是一种常用的方法:例如四环素调控系统,该表达系统可使转基因动物体内外源基因的表达受诱导剂(四环素)的调控,通过加入或去除诱导剂,就可以实现对外源基因表达时间及水平的控制。2.转基因技术在不断完善目前,科学家已经采取了多种方法使转基因技术更加完善:2.转当前转基因动物所涉及的转基因片段长度大多在几十个kb以下,但是,随着科学研究需要进行大片段DNA、多基因或基因簇的转基因。克隆大片段DNA常应用酵母人工染色体(YAC)、细菌人工染色体(BAC)等,可获得200kb以上的大DNA片段,能携带包含完整的基因或多个基因,以及基因的所有外显子,和附近的染色体调控区,为目的基因提供与其在正常染色体上一致的环境,保证了转基因在正常细胞中的时空表达。当前转基因动物所涉及的转基因片段长度大多在几十个kb以下,但(二)基因敲入可以实现基因的定向插入
基因敲入(geneknock-in)是通过同源重组的方法,用某一基因替换另一基因,或将一个设计好的基因片段插入到基因组的特定位点,使之表达并发挥作用。通过基因敲入,可以研究特定基因在体内的功能;也可以与之前基因的功能进行比较;或将正常基因引入基因组中置换突变基因以达到靶向基因治疗的目的。(二)基因敲入可以实现基因的定向插入基因敲基因敲入是基因打靶技术的一种,基因打靶技术是20世纪80年代后半期发展起来的,一种按预期方式准确改造生物遗传信息的实验手段。该技术的巧妙之处在于把胚胎干细胞技术和DNA同源重组技术“结合”起来,实现对染色体上某一基因的定向修饰和改造,从而深入地了解基因的功能。除基因敲入外,基因打靶还包括基因敲除、点突变、缺失突变、染色体组大片段删除等。基因敲入是基因打靶技术的一种,基因打靶技术是20世纪80年代基因打靶的原理和基本步骤首先,从小鼠囊胚分离出未分化的胚胎干细胞,然后利用细胞内的染色体DNA可以与导入细胞的外源DNA,在相同序列的区域内发生同源重组的原理,用含有正-负筛选标记的打靶载体,对胚胎干细胞中的特定基因实施“打靶”;之后将“中靶”的胚胎干细胞移植回小鼠囊胚(受精卵分裂至8个细胞左右即为囊胚,此时受精卵只分裂不分化),移植进去的中靶胚胎干细胞钻入囊胚胚层,与囊胚一起分化发育成相应的组织和器官;最后诞生出具有基因功能缺陷的“嵌合鼠”。由于中靶的胚胎干细胞保持分化的全能性,因此它可以发育成为嵌合鼠的生殖细胞,使得经过定向改造的遗传信息可以代代相传。基因打靶的原理和基本步骤
基因打靶的原理示意图基因打靶的原理示意图基因功能研究的功能失活策略是通过观察,细胞或个体的某一基因功能被部分或全部失活后,细胞生物学行为或个体遗传性状表型的变化,来鉴定基因的功能。常用的方法主要有基因敲除基因沉默二、采用功能失活策略鉴定基因的功能基因功能研究的功能失活策略是通过观察,细胞或个
基因敲除(geneknock-out)属于基因打靶技术的一种,其操作步骤和原理与基因打靶技术相同。基因敲除技术是利用细胞染色体DNA可以与导入的外源DNA在相同序列的区域发生同源重组的现象,在ES细胞中定点破坏内源基因,然后利用ES细胞发育的全能性,获得带有预定基因缺陷的杂合子,通过遗传育种最终获得目的基因缺陷的纯和个体。1987年,Thompsson首次建立了完整的ES细胞基因敲除的小鼠模型,此后基因敲除技术得到进一步的发展和完善,目前该技术已经成为研究基因功能最直接、最有效的方法之一。(一)基因敲除可以使基因的功能完全缺失基因敲除(geneknock-out)属于基因被完全敲除之后使得表型分析受到很多限制:有些重要的靶基因被敲除后会引起胚胎早期死亡,使得无法分析该基因在胚胎发育晚期和成年期的功能;某些基因在不同的细胞类型中执行不同的功能,完全敲除会导致突变小鼠出现复杂的表型,使研究者很难判断异常的表型是由一种细胞引起的,还是由几种细胞共同引起的。近年来,条件性基因打靶(conditionalgenetargeting)系统的建立,使得对基因靶位时间和空间上的操作更加明确,效果更加精确可靠,已达到对任何基因在不同发育阶段和不同器官、组织的选择性敲除。基因被完全敲除之后使得表型分析受到很多限制:Cre/loxP系统作用原理示意图Cre/loxP系统作用原理示意图这一技术亦存在一些缺点:费用太高周期较长许多基因在剔除后并未产生明显的表型改变,可能是这些基因的功能为其他基因代偿所致条件性基因打靶的优势:克服了重要基因被敲除所导致的早期致死并能客观、系统地研究基因在组织器官发生、发育以及疾病发生、治疗过程中的作用和机制这一技术亦存在一些缺点:条件性基因打靶的优势:
基因沉默(genesilencing)是指由外源基因导入引起的生物体内的特定基因不表达或表达受抑制的现象。该现象最早发现在转基因植物中,后来这种现象在线虫、真菌、果蝇、斑马鱼、小鼠早期胚胎中也有发现。目前最常用的基因沉默技术包括:RNA干涉(RNAinterference,RNAi)反义寡核苷酸(antisenseoligonucleotide,ASON)(二)基因沉默可以使基因的功能部分缺失基因沉默(genesilencing)是指RNAi是指双链RNA介导同源序列的mRNA特异性降解,导致的转录后基因沉默。RNAi是机体的一种天然防御机制,具有防御病毒感染、入侵等功能。目前利用RNAi能够在短时间内高效特异地抑制靶基因表达的特点研究基因的功能已成为功能基因组学的热点之一。1.RNA干涉技术可用来研究基因的功能RNAi是指双链RNA介导同源序列的mRNARNAi的作用机制:外源dsRNA可直接被导入细胞,或者通过转基因、病毒感染等方式进入细胞,并整合到基因组中获得表达;各种来源的dsRNA被核酸酶RNaseⅢ家族中,特异识别dsRNA的Dicer酶,以一种ATP依赖的方式逐步切割成长约21~23nt的双链小干扰RNA(smallinterferenceRNA,siRNA);siRNA识别mRNA链上的同源区域之后,结合一个核酶复合物形成RNA诱导的沉默复合体(RNA-inducesilencingcomplex,RISC);RISC定位到靶mRNA转录本上,并在距离siRNA3’端12个碱基的位置切割mRNA。RNAi的作用机制:RNAi的作用机制示意图RNAi的作用机制示意图目前有5种方法可用于制备siRNA:化学合成法体外转录法长链dsRNA的RNaseⅢ体外消化法siRNA表达载体法siRNA表达框架法前3种方法是在体外制备然后导入到细胞中;后两种则是基于具有合适启动子的载体或转录元件,在哺乳动物或细胞中转录生成。目前多采用RNA聚合酶Ⅲ启动子构建siRNA的表达载体或表达框架,常用的RNA聚合酶Ⅲ的启动子有人、鼠U6启动子、人H1启动子。目前有5种方法可用于制备siRNA:前3种研究者既可以将siRNA导入特定细胞,在细胞水平上研究基因的功能;也可以通过转基因的方法,在动物体内实现特异、稳定、长期地抑制靶基因的表达,从而在整体水平上研究基因的功能。若将RNAi技术与Cre/loxP重组系统以及基因表达调控系统相结合,建立转基因动物模型,则不仅具有稳定、可遗传、可诱导等特点,而且无需使用胚胎干细胞技术和基因打靶技术,与基因敲除相比具有简单、易操作、周期短等优势。已被作为一种简便和有效的工具广泛用于基因功能的研究。研究者既可以将siRNA导入特定细胞,在细胞缺点:该技术可能对靶基因的相似序列发生作用,导致脱靶(off-targeting)效应。还可能诱导干扰素和其他细胞因子的表达。缺点:反义寡核苷酸引发基因沉默的机制:(1)可能是通过与靶mRNA互补结合后以位阻效应抑制靶基因的翻译;(2)也可能通过与双链DNA结合形成三股螺旋而抑制转录;(3)也不能排除通过激活细胞内的Dicer酶进入RNA干涉途径而降解靶mRNA。
2.反义寡核苷酸也可引发基因沉默由于反义寡核苷酸技术简便易行,已成为研究基因功能的方法之一。反义寡核苷酸是指能与mRNA互补配对的RNA分子,长度一般为20nt左右。反义寡核苷酸引发基因沉默的机制:2.反义寡核苷酸也可引发基三、随机突变筛选策略利用转基因、基因敲除等技术从特定基因的改造到整体动物表型分析的“反向遗传学”研究大大推动了功能基因组学的进展,但是也存在明显的局限性:首先,由于生物体的代偿机制,使得基因敲除动物常常观察不到异常表型;其次,由于“反向遗传学”只能对已知的基因进行研究,而人类基因组中尚有90%以上的非编码序列处于未知状态;第三,由于“功能缺失”和“功能获得”小鼠常出现胚胎期死亡,而目前可用于条件性基因改造的启动子还很少,从而阻碍了特定基因在成体动物中的功能分析;第四,由于一个蛋白有多个不同的功能域,特定基因在不同位点上的突变可能产生不同的表型,应用单一的“功能缺失”方法,显然不可能发现这些不同的异常表型。三、随机突变筛选策略利用转基因、基因敲除等技因此,单单应用“反向遗传学”不足以完成功能基因组学的任务,而基于“正向遗传学”的,从异常表型到特定基因突变的随机突变筛选策略逐渐受到青睐。随机突变筛选策略的第一步是通过物理诱变、化学诱变或生物技术产生大量的基因组DNA突变。因此,单单应用“反向遗传学”不足以完成功能基ENU诱变是近年来发展起来的研究基因功能的新手段。ENU是一种化学诱变剂,它通过对基因组DNA碱基的烷基化修饰,诱导DNA在复制时发生错配而产生突变。ENU诱变主要诱发单碱基突变,造成单个基因发生突变(双突变的情况非常少),更接近于人类遗传性疾病的基因突变情况。同时,ENU的突变效率非常高,可以达到0.2%,是其他突变手段的10倍左右。由于ENU处理后雄鼠精子基因组发生点突变,使得后代小鼠有可能出现突变表型,经筛选及遗传试验即可得到突变系小鼠。通过对突变小鼠的深入研究、对突变基因定位及位置候选法克隆突变碱基就会得到突变基因的功能信息。ENU诱变是近年来发展起来的研究基因功能的新手
基因捕获(genetrapping)技术也是一种产生大规模随机插入突变的便利手段,对于揭示基因序列所对应的基因功能具有重要的应用价值。基因捕获技术的基本过程是:将一含报告基因的DNA载体随机插入基因组,产生内源基因失活突变,通过报告基因的表达,提示插入突变的存在,以及内源基因的表达特点。利用基因捕获可以建立一个携带随机插入突变的ES细胞库,每一种ES细胞克隆中含有不同的突变基因,ES细胞克隆经囊胚注射发育为基因突变动物模型,通过对动物模型的表型分析鉴定突变基因的功能。基因捕获(genetrapping)技术也基因捕获技术可节省大量构建特异打靶载体,以及筛选染色体组文库的工作及费用,成为可同时对基因的序列、基因的表达以及基因的功能进行研究的高效技术。随机突变筛选策略能够获得功能基因研究的新材料及人类遗传性疾病的新模型,这种“表型驱动”的研究方式有可能成为功能基因组研究最有前景的手段和捷径。基因捕获技术可节省大量构建特异打靶载体,以及筛选染色体组文库分析基因表达可以从RNA和蛋白质水平上进行。有许多技术可用来分析基因的表达,如何根据实验目的和条件选择最佳的实验方法是关键。生物信息学具有方便快捷和经济的优点,如何应用生物信息学技术充分利用已知数据和生物学知识,得到与目的基因功能有关的重要信息,预测基因的功能,进而制定实验室研究方案,是现代生物医学研究人员必备的技能。基因功能的鉴定最终仍需要通过实验来验证,尤其是在生物体内从整体水平对基因功能进行研究,是鉴定基因功能的最终解决方案。采用不同技术建立的模式生物是研究基因功能必不可少的工具,各种方法都具有各自的特点和局限性。结合基因功能获得和失活技术,从正反两方面对基因。小结分析基因表达可以从RNA和蛋白质水平上进行
ThankYou!ThankYou!第二十六章
基因表达及功能分析的基本策略STRATEGIESFORANALYZINGGENEEXPRESSIONANDFUNCTION第二十六章第一节基因表达的分析策略StrategiesforAnalyzingGeneExpression第一节一、通过检测mRNA揭示基因转录水平的表达特征根据分析方法的原理和功能特性,可将基因表达分析分为:封闭性系统研究方法:例如DNA微阵列、Northern印迹、实时RT-PCR等方法,其应用范围仅限于已测序的物种,只能研究已知的基因。开放性系统研究方法:
如差异显示PCR、双向基因表达指纹图谱、分子索引法、随机引物PCR指纹分析等,可以发现和分析未知的基因。这里主要针对已知基因的常用表达分析方法做一介绍。一、通过检测mRNA根据分析方法的原理和功能特性,可将基因表(一)基于杂交原理的方法可检测mRNA表达水平1.Northern印迹(Northernblot)既可分析mRNA表达又可验证cDNA新序列是一种基于RNA-DNA杂交原理建立的一种RNA分析技术(一)基于杂交原理的方法可检测mRNA表达水平1.NorthNorthern印迹分析原理示意图Northern印迹分析原理示意图2.核糖核酸酶保护实验(ribonucleaseprotectionassay,RPA)可用于mRNA定量和RNA剪接分析是一种基于杂交原理分析mRNA的方法,既可对mRNA进行定量分析又可研究其结构特征,灵敏度和特异性都很高。2.核糖核酸酶保护实验核糖核酸酶保护实验原理示意图核糖核酸酶保护实验原理示意图可对mRNA进行区域定位
是利用杂交原理建立的组织原位mRNA检测技术,可对细胞或组织中原位表达的mRNA进行区域定位。同时也可作为定量分析的补充。通过设计与目标mRNA碱基序列互补的寡核苷酸序列,标记后作为探针;该探针能够特异性地与目标靶序列杂交,检测标记信号来确定基因在组织和细胞内表达的区位信息。虽然原位杂交在功能性方面提供的信息较少,但是该技术还是被广泛用于组织中的基因表达分析,这是因为其较高的稳定性、较广泛的靶点和组织适用性。3.原位杂交(insituhybridization,ISH)可对mRNA进行区域定位3.原位杂交(insituhy(二)两种变换的聚合酶链式反应是常用的mRNA检测方法1.反转录PCR可用于mRNA的半定量分析
反转录PCR(reversetranscription-PCR,RT-PCR)是一种简单、快捷地对RNA进行定性、定量分析的方法。它是以mRNA为模板,体外扩增cDNA,再以cDNA为模板进行特定基因转录产物的PCR扩增。RT-PCR技术一般用于RNA的定性分析;如果设置阳性参照,则可对待测RNA样品进行半定量分析。该方法适合对待测样品进行初步筛选,目前已广泛被实时定量PCR替代。(二)两种变换的聚合酶链式反应是常用的mRNA检测方法1.反常用于mRNA的定量分析实时定量PCR(Real-timeQuantitativePolymerasechainReaction,RQ-PCR)是定量分析mRNA的最通用、最快速、最简便的方法,该方法是对PCR反应进行实时监测,具有很高的灵敏度和特异性。2.实时定量PCR2.实时定量PCR目前有5种技术用于实时定量PCR:其中最经济、简便的技术是利用荧光染料(如SYBRGreen
)与双链DNA分子结合发光的特性,指示扩增产物的增加;其他4种方法都是以荧光染料标记的寡核苷酸为探针与正确的扩增子杂交,包括5’核酸酶法(即人们熟知的TaqManTM)、分子信标、ScropionsTM和探针杂交法,它们拥有更强的特异性,可以避免对PCR后溶解曲线的需求,以及后续的Southern杂交或对扩增子的测序鉴定,但是成本较高。目前有5种技术用于实时定量PCR:SYBRGreen实时定量PCR分析原理示意图SYBRGreen实时定量PCR分析原理示意图二、通过蛋白质检测揭示基因翻译水平的表达特征
Western印迹(Westernblot)是一种免疫印迹技术,其基本原理与核酸分子杂交相似,只是以偶联标记物的抗体分子作为探针,检测转移到固相支持物上的蛋白质/多肽分子。当在蛋白质水平上检测特定基因的表达活性时,最常用的方法就是利用Western印迹对细胞或组织的总蛋白质中的特异蛋白质进行定性和半定量分析。(一)采用特异抗体经Western印迹可直接测定基因编码多肽二、通过蛋白质检测揭示基因Western印迹蛋白质样品的制备SDS分离蛋白质转膜特异抗体(即第一抗体)与膜上的蛋白质(抗原)印迹杂交再经偶联了可检测标记信号的第二抗体(即抗抗体,商品试剂盒中多采用偶联辣根过氧化物酶的Ig)最后经与酶的底物反应而显影、成像,经扫描后获取免疫印迹信息Westernblot基本程序Westernblot基本程序
酶联免疫吸附分析(Enzyme-linkedimmunosorbentassay,ELISA)也是一种建立在抗原-抗体反应基础上的蛋白质分析基本方法。该方法不需经电泳分离待检样品蛋白质,而是预先将样品包被在支持体上,以后反应过程与Western印迹大致相同——顺序结合(即“吸附”)特异抗体(一抗)及与酶连接的第二抗体(也可预先包被抗体,“吸附”抗原),再进行酶-底物反应。反应后通过专门的酶标仪测定、记录数据。(二)酶联免疫吸附分析与Western印迹原理相似但形式不同酶联免疫吸附分析(Enzyme-linke特点:具有特异性;灵敏度很高;稳定、操作简便,标本用量少,适于大规模筛查,尤其适用于检测体液中微量的特异性抗体或抗原;既可以做定性试验也可以做定量分析。被广泛应用于微生物学、寄生虫学、肿瘤学和免疫学等领域。酶联免疫吸附分析特点:酶联免疫吸附分析
免疫组织化学(immunohistochemistry)与免疫细胞化学(immunocytochemistry)原理相同,都是利用标记的特异性抗体通过抗原-抗体反应和显色反应,在组织或细胞原位检测特定抗原(即目标蛋白质)的方法,简称为免疫组化实验。近年来由于荧光标记抗体的广泛应用,这两种方法又被统称为免疫荧光法。(三)免疫组化实验可对组织/细胞表达的蛋白质进行原位检测免疫组织化学(immunohistochem(immunofluorescence),可应用荧光(倒置)显微镜或激光共聚焦显微镜(confocalmicroscopy)对靶分子进行定性、定量和定位分析,激光共聚焦显微镜还可进行断层成像,是在蛋白质水平分析基因表达的直观方法。其中抗体对于蛋白质靶点的特异性、种间交叉反应、检测系统的灵敏性以及细胞或组织的固定类型是该方法的关键因素。运用双重着色或多重着色程序同时对多个感兴趣的靶分子进行检测,是一种揭示更多有关细胞群的功能和它们之间相互作用信息的有效方法。免疫组化主要是作为定性、定位的技术,若结合密度计量系统、图像分析系统等测量工具也可以得到定量的数据。(immunofluorescence),可应用荧光(倒置)
流式细胞术(flowcytometry)在细胞水平分析特定蛋白质的基本原理也是抗原-抗体反应,它利用荧光标记抗体与抗原的特异性结合,经过流式细胞仪分析荧光信号,从而根据细胞表达特定蛋白质的水平对某种蛋白质阳性细胞(即特异基因表达的细胞)作出判断。(四)流式细胞术用于分析
表达特异蛋白质的阳性细胞流式细胞术(flowcytometry)流式细胞术可以检测活细胞,也可以检测用甲醛固定的细胞。广泛应用于细胞表面和细胞内分子表达水平的定量分析,并能够根据各种蛋白质的表达模式区分细胞亚群。此外,流式细胞术可以使用多个荧光标记的抗体同时对多个基因产物进行标记和监测,是对细胞进行快速分析、分选、特征鉴定的一种有效方法。流式细胞术可以检测活细胞,也可以检测用甲醛固定的细胞。三、高通量检测技术成为基因表达研究的有力工具
高通量筛选(Highthroughputscreening,HTS)技术是在大量核酸、多肽信息累计(即资料库)基础上,采用微板作为分子载体,制作集成“芯片”,以自动化操作系统进行分子杂交的试验过程。因为快捷、灵敏、信息量大,适合大规模操作,故称“高通量”。高通量检测技术适合“组学”(omics)研究,更适合生命活动过程相关的基因表达谱分析。三、高通量检测技术成为基因表达研究的有力工具基因芯片已成为基因表达谱分析的常用方法基因芯片(genechip)又称DNA微阵列(DNAmicroarray)、DNA芯片(DNAchip),是将大量已知序列的核酸片段(包括寡核苷酸、cDNA、基因组DNA、microRNA等)集成在同一基片上,组成密集分子排列,通过与标记样品进行杂交,检测、获取细胞或组织的基因信息。其中基因表达谱(expressionprifile)分析是目前基因芯片应用最多的一个方面,主要采用cDNA芯片,基因表达谱芯片便于对不同状态(如生理和病理条件)下的基因表达谱进行比较,揭示转录组(transcriptome)差异表达的规律,对探索发病机制、评价治疗效果、筛选药物靶标具有重要意义。(一)基因芯片和高通量测序技术可在基因水平高通量地分析基因表达基因芯片已成为基因表达谱分析的常用方法(一)基因芯片和高通量2.高通量测序技术是新一代基因表达谱分析方法高通量测序技术可以一次对几十万到几百万个DNA分子片段进行序列测定,从而快速获得转录组或基因组的全貌,又被称为深度测序(deepsequencing)。2.高通量测序技术是新一代基因表达谱分析方法
在DNA水平上,可以大规模地分析基因组甲基化、筛选突变基因、检测基因多态性;在RNA水平上,可以对RNA片段进行扫描、定量与鉴定,对全基因组进行广谱表达研究。1)目前,高通量测序技术不仅仅在DNA测序中起到重要的作用,并且已经应用于基因组分析的各个方面:2)高通量测序另一个被广泛应用的领域是小分子RNA或非编码RNA(ncRNA)研究。测序方法能轻易地解决芯片技术在检测小分子时遇到的技术难题(短序列,高度同源),而且小分子RNA的短序列正好配合了高通量测序的长度,同时测序方法还能在实验中发现新的小分子RNA。2)高通量测序另一个被广泛应用的领域是小分子RNA基因芯片的缺点:在于它是一个“封闭系统”,它只能检测人们已知序列的特征(或有限的变异)。高通量测序的优势:在于它是一个“开放系统”,它的发现能力和寻找新信息的能力从本质上高于芯片技术。基因芯片的缺点:(二)蛋白质芯片和双向电泳可在蛋白质水平高通量地分析基因表达
蛋白质芯片(proteinchip)是一种对蛋白质的表达和功能进行高通量分析的技术。是将具有高度亲和特异性的探针分子(如单克隆抗体)固定在基片上,用以识别复杂生物样品溶液中的目标多肽;蛋白质功能芯片可用来研究蛋白质修饰、蛋白质-蛋白质/DNA-蛋白质/RNA-蛋白质,以及蛋白质与脂质、蛋白质与药物、酶与底物、小分子-蛋白质等的相互作用。1.蛋白质芯片有多种形式和用途(二)蛋白质芯片和双向电泳可在蛋白质水平高通量地分析基因表达蛋白质检测芯片包括:抗体芯片抗原芯片配体芯片碳水化合物芯片等根据蛋白质芯片制作方法和用途不同,可将其分为1.蛋白质检测芯片2.蛋白质功能芯片两大类蛋白质检测芯片包括:根据蛋白质芯片制作方法和用途不同,可将其目前比较和鉴定蛋白质表达谱更多采用双向聚丙烯酰胺凝胶电泳结合质谱技术。双向聚丙烯酰胺凝胶电泳技术又称二维电泳(two-dimensionalelectrophoresis,简称2-D电泳)。原理:
根据蛋白质分子的两个属性——等电点和分子质量——将蛋白质混合物进行分离。电泳结果经染色后,即可对不同样品中蛋白质的表达谱进行比较;还可从凝胶中将特定的蛋白质点切下,经胰蛋白酶消化后得到短肽片段,利用质谱(massspectrum)技术进行定性分析,对差异表达的蛋白质进行鉴定。可同时分离数成百上千的蛋白质。2.双向电泳结合质谱普遍用于蛋白质表达谱的分析和鉴定目前比较和鉴定蛋白质表达谱更多采用双向聚丙烯第二节生物信息学在预测基因功能中的应用
BioinformaticsApplicationinPredictingGeneFunction第二节一、利用生物信息学方法进行基因功能注释(一)通过序列比对预测基因功能序列比对是生物信息学最基本的分析技术之一,最常用的方法是将目的DNA或蛋白质序列与已知的DNA和蛋白质序列数据库进行比对,搜索到与目的序列高度同源的功能已知的基因或蛋白质,用这些基因和蛋白质预测目的基因和蛋白质的功能。局部比对搜索工具BLAST是进行序列比对的基本工具,它允许用户选择一条查询序列与一个数据库进行比对,找到数据库中与输入的查询序列相匹配的项。BLAST是一个序列数据库搜索程序家族,其中包括许多有特定用途的程序。一、利用生物信息学方法进行基因功能注释(一)通过序列比对预测程序查询序列类型数据库类型注BLASTNDNADNABLASTP蛋白质蛋白质BLASTXDNA蛋白质将待搜索的核酸序列按6个阅读框翻译成蛋白质序列,然后与数据库中的蛋白质序列比对TBLASTN蛋白质DNA将数据库中的核酸序列按6个阅读框翻译成蛋白质序列,然后与待搜索的蛋白质序列比对TBLASTXDNADNA无论是待搜索的核酸序列还是数据库中的核酸序列都按6个阅读框翻译成蛋白质序列,然后比对BLAST序列数据库搜索程序家族程序查询序列类型数据库类型注BLASTNDNADNABLAS(二)利用生物信息学方法分析基因芯片数据最常用的方法有:差异表达分析(又称基因表达差异分析)聚类分析差异表达分析的目的:识别两个条件下表达差异显著的基因,即一个基因在两个条件中的表达水平,在排除各种偏差后,其差异具有统计学意义(二)利用生物信息学方法分析基因芯片数据最常用的方法有:倍数分析:计算每个基因在两个条件下的表达比值;统计分析中的t检验和方差分析:通过计算表达差异的置信度来分析差异是否具有统计学意义;建模的方法:通过确定两个条件下的模型参数是否相同来判断表达差异的显著性。差异表达分析常用的分析方法有3类:差异表达分析常用的分析方法有3类:聚类分析所依据的基本假设:若组内基因具有相似的表达模式,则它们可能具有相似的功能,例如受共同的转录因子调控的基因,或者产物构成同一个蛋白复合体的基因,或者参与相同调控路径的基因。在具体应用中可按照相似的表达谱对基因进行聚类,从而预测组内未知基因的功能。目前已经有很多种聚类的方法应用到基因芯片的研究当中,如层次聚类(Hierarchicalclustering)、K均值聚类(K-meansclustering)、自组织映射(selforganizingmap)、PCA(principlecomponetanalysis)等。聚类分析所依据的基本假设:
在氨基酸序列整体同源性不明显的情况下,对蛋白质的功能域进行分析将对预测基因功能提供极其有价值的信息。目前已通过多序列比对将蛋白质的同源序列收集在一起,确定了大量蕴藏于蛋白质结构中的保守区域或序列,如结构域(domain)和模体(motif),这些共享结构域和保守模体通常与特定的生物学活性相关,反映了蛋白质分子的一些重要功能。
(三)通过生物信息学方法分析蛋白质结构来预测蛋白质功能在氨基酸序列整体同源性不明显的情运用蛋白质序列模体搜索工具预测蛋白质功能的方法是:首先收集现有的蛋白质家族,构造模体数据库;而后通过搜索该数据库确定查询序列是否具有可能的序列模体,判断该序列是否属于一个已知的蛋白质家族;然后根据该蛋白质家族的已知功能预测未知蛋白质的功能。常用的模体数据库有INTERPROSCAN、PROSITE、SMART等。运用蛋白质序列模体搜索工具预测蛋白质功能的方法是:基因组功能注释常用数据库基因组功能注释常用数据库
现在人们已经越来越清楚地认识到,生物功能大多不是只由一个或几个基因控制的,而是通过生物体内众多的分子(如DNA、RNA、蛋白质和其他小分子物质)共同构成的复杂生物网络实现的。当前生物学面临的巨大挑战之一就是,了解生物体内复杂的相互作用网络以及它们的动态特征。要想全面系统地解析这些复杂的生物网络需要大量相关数据的积累,现代基因芯片、蛋白质芯片等大规模数据采集技术大大加快了这一进程。目前人们已经利用生物技术和信息技术建立了各种生物网络数据库和网站,可为研究者提供基因调控、信号转导、代谢途径、蛋白质相互作用等方面的信息。二、利用生物网络全面系统地了解基因的功能现在人们已经越来越清楚地认识到,生物功能大多
生物体任何细胞的遗传信息、基因都是相同的,但同一个基因在不同组织、不同细胞中的表达却不相同。一个基因的表达既影响其他的基因,又受其他基因的影响,基因之间相互促进、相互抑制,构成一个复杂的基因调控网络。基因调控网络研究就是:利用生物芯片等高通量技术所产生的大量基因表达谱数据,以及蛋白质-DNA间的相互作用等信息,结合实验室研究结果,用生物信息学方法构建基因调控模型,对某一物种或组织的基因表达关系进行整体性研究,从而推断基因之间的调控关系,揭示支配基因表达和功能的基本规律。
(一)利用生物网络研究基因调控生物体任何细胞的遗传信息、基因都常用基因转录调控数据库常用基因转录调控数据库信号转导是生物系统的重要生命活动过程,机体通过信号转导通路中分子之间的相互识别、联络和相互作用,实现整体功能上的协调统一。由于细胞内各种信号通路之间存在着紧密的联系和交叉调控,形成了非常复杂的信号转导网络。信号转导网络研究的目的是期望通过建立细胞信号传导过程的模型,找出参与此过程的各个蛋白质间的相互作用关系,阐明其在基因调控、疾病发生中的作用。生物信息学方法利用已知数据和生物学知识进行通路推断,可以帮助阐释信号分子作用机制,辅助实验设计,节省大量的人力物力。有关信号转导通路的网上数据库资源较多。
(二)利用生物网络研究信号转导信号转导是生物系统的重要生命活动过程,机体通常用信号通路数据库常用信号通路数据库代谢网络处于生物体的功能执行阶段,其结构组成方式反映了生物体的功能构成。代谢网络把细胞内所有生化反应表示为网络形式,反映了代谢活动中所有化合物及酶之间的相互作用。通过基因组注释信息可以识别出编码催化生物体内生化反应的酶的基因,结合相关的酶反应数据库就可以预测物种特异的酶基因、酶以及酶催化反应,由此产生了许多优秀的代谢数据库,可以方便地检索某一生物代谢网络中的代谢反应。
(三)利用生物网络研究代谢途径代谢网络处于生物体的功能执行阶段,其结构组成常用代谢网络数据库常用代谢网络数据库(四)利用生物网络研究蛋白质相互作用从某种程度上可以说,细胞进行的生命活动,是蛋白质在一定条件下相互作用的结果,若蛋白质相互作用网络被破坏或稳定性丢失,会引起细胞的功能性障碍。阐明蛋白质相互作用的完整网络结构,有助于从系统的角度加深对细胞结构和功能的认识。近年来各种预测蛋白质相互作用的计算方法被不断提出,将这些方法与实验方法结合,挖掘出了蛋白质相互作用网络中更多的相互作用节点,目前已有多个蛋白质相互作用的数据库应运而生,可用来研究蛋白质相互作用的生物学过程。(四)利用生物网络研究蛋白质相互作用从某种程常用蛋白质互作网络数据库常用蛋白质互作网络数据库三、复杂疾病的生物信息学研究策略包括信息提取、分析和建模癌症、糖尿病、高血压等复杂疾病对人类健康影响巨大,这类疾病的发病机制一般与多种遗传或非遗传因素,以及它们之间的相互作用有关,不能通过单基因、单通路、单层次的变化解释。以系统的观点解释复杂疾病中遗传与环境的关系、描述复杂疾病中基因的特征、分析疾病基因型与表现型之间的关系,已成为生物信息学研究复杂疾病的基本观点,针对复杂疾病的研究模式,也开始从传统的“序列→结构→功能”向“相互作用→网络→功能”转变。三、复杂疾病的生物信息学研究策略癌症、糖尿病①疾病的基因组合及相互作用信息的提取:即对复杂疾病相关靶基因的识别,以及利用SNPs、基因、蛋白质等不同类型的信息,构建疾病驱使相关基因网络。②生物信息分析及多层次信息的融合:即从不同层次对疾病的遗传复杂性进行分析,对不同遗传网络间的映射算法进行研究,进而将SNPs、基因、蛋白质等不同水平的信息进行融合。③分子调控网络建模:即综合生理病理相关的基因、SNPs、基因表达状况,蛋白质功能状态以及临床治疗等信息,以系统的方法将不同的测量数据、各种因素的辨识、各个层次上的相互作用关系进行整合,建立数学模型,深入了解疾病过程、揭示复杂疾病的发病机制。复杂疾病的基本研究策略——①疾病的基因组合及相互作用信息的提取:即对复杂疾病相关靶基因第三节基因的生物学功能鉴定技术MethodsforIdentifyingBiologicalFunctionsofGenes第三节目前在已知的2.5万~3万个人类基因中,大约70%的基因我们还不清楚它们的功能,有90%的基因我们不知道它们在体内的确切生理作用,因此,利用各种技术手段研究基因组中功能未知基因的作用,将是“后基因组时代”功能基因组学研究的主要内容。生物信息学利用已
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机器人在旅游规划服务的创新考核试卷
- 人工智能在医疗诊断上的优势和限制考核试卷
- 放射性金属矿床的地学指标选用与开发利用考核试卷
- 电气机械技术在化学工程与生物技术中的应用考核试卷
- 印刷业在文化传承中的作用考核试卷
- DB11T 765.2-2010 档案数字化规范 第2部分:纸质档案数字化加工
- 蜜蜂主题课件教学课件
- DB11∕T 1771-2020 地源热泵系统运行技术规范
- 幼儿园万圣节活动方案
- 做家务课件教学课件
- 2024-2025学年八年级上学期地理期中模拟试卷(人教版+含答案解析)
- 江苏省扬州市2023-2024学年高一上学期物理期中考试试卷(含答案)
- 2024年初级消防设施操作员考试题库800题(基础知识+实操技能)
- AQ/T 9009-2015 生产安全事故应急演练评估规范(正式版)
- 改进维持性血液透析患者贫血状况PDCA
- 关于上海初中综评典型事例【五篇】
- 哈利·波特全集英文版收藏(全7册)
- 焙烧炉烟气换热器的设计方案
- 燃气公司安全管理奖罚办法
- 客位大金湖旅游船初步设计
- KCl-NaCl-H2O三元体系相图
评论
0/150
提交评论