分子遗传学要点整理_第1页
分子遗传学要点整理_第2页
分子遗传学要点整理_第3页
分子遗传学要点整理_第4页
分子遗传学要点整理_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Chapter1:Genomes,TranscriptomesandProteomes1.概述基因组(Genome):指生物的整套染色体所含有的全部DNA或RNA序列。基因组是地球上每一物种具有的生物学信息的存储库。基因组学(Genomics):指研究生物的整个基因组,涉及基因组作图、测序和功能分析的一门学科。基因组所包含的生物信息的利用需要酶及其他参与基因组表达过程中一系列复杂生化反应的蛋白质的协同活性。基因组表达的最初产物是转录组,即那些含有细胞在特定时间所需生物信息、编码蛋白质的基因衍生而来的RNA分子的集合。转录组由转录过程来维持。基因组表达的第二个产物是蛋白质组,即细胞中那些决定细胞能够进行生化反应的所有蛋白质组分。这是通过翻译过程来完成的。2.1GenesaremadeofDNA奥地利神父孟德尔1865年根据7个碗豆性状的实验提出了遗传因子假说,认为每个性状由遗传因子控制,并提出了遗传因子的分离与自由组合两大遗传规律。证明基因由核酸(DNA或RNA)组成的3个著名实验:肺炎双球菌的转化试验;DNA是遗传物质②噬菌体感染实验;只有DNA是联系亲代和子代的物质③烟草花叶病毒的感染实验。RNA也是遗传物质

2.2ThestructureofDNAA.NucleotidesandpolynucleotidesB.Themodelofdoublehelix

DNA晶体X射线衍射图谱 为揭示DNA分子的二级结构提供了重要实验证据a.WatsonandCrick(1953)提出的DNA双螺旋结构模型:" DNA分子通常以右手双螺旋形式存在,两条核苷酸链反向平行,且互为互补链。" 戊糖-磷酸骨架在分子的外铡,在分子表面形成大沟和小沟,碱基堆积于螺旋内部。" 碱基间通过氢键相互连接,A和T以2个氢键配对,G和C以3个氢键配对。" 螺旋中相邻碱基间相隔0.34nm,每10个碱基对螺旋上升一圈,螺距为3.4nm,直径为2.37nm。b.DNA双螺旋结构的稳定力:

• 碱基间形成的氢键/• 相邻碱基间的疏水堆积力/• 碱基相互作用的范德华力

尽管氢键使得双链中的碱基间的配对具有特异性(只有互补的两条链之间才能形成DNA双链),但其对于双螺旋的总体上的稳定性并无太大贡献。核酸分子的稳定性的根源在于碱基对之间的疏水堆积力。作为芳香族化合物,碱基的平面使其不能在自由溶液中与水分子形成氢键,即它们是疏水的。疏水效应使双链DNA成为能量上最为稳定的结构。尽管这种堆积作用在RNA中也存在,但其在双链DNA中达到了最大化。c.DNA双螺旋结构的类型:

三种形态的DNA:A-DNA,B-DNA,Z-DNA

两类:右手螺旋和左手螺旋

3.RNAandtheTranscriptome• 基因组表达的最初产物是转录组,即那些含有细胞在特定时间所需生物信息、编码蛋白质的基因衍生而来的RNA分子的集合。

• 转录组中的RNA分子以及其他来自非编码基因的RNA都由转录过程产生。

1. 稳定性差2. 主要以单链形式存在

3.2细胞内的RNA组分(mRNA/rRNA/tRNA)核小RNA(SnRNA):发现于真核生物细胞核中,与前体mRNA剪接成成熟mRNA的过程相关。核仁小RNA(snoRNA):发现于真核细胞核的核仁区,在rRNA分子的加工过程中起到核心作用(比如在某个核苷酸位点上加上一个甲基)。微小RNA(miRNA)和短干扰RNA(siRNA):是调控个别基因表达的小RNA。3.3ProcessingofprecursorRNA末端修饰/剪接/剪切/化学修饰

化学修饰在rRNA、tRNA和mRNA中都存在;其中,mRNA的化学修饰称作RNA编辑。3.4Thetranscriptome

转录组虽然不到细胞总RNA的4%,却是细胞中最重要的组分,因为它包含了基因组表达的下一个阶段中所要使用的编码RNA。转录组从不从头合成(denovo),一个细胞通过细胞分裂诞生时就接收了其上一代的部分转录组,并维持一生。

各蛋白质编码基因的转录过程并不是导致转录组的合成,而是通过替换被降解的mRNA来维持转录组,并通过开闭不同的基因的表达来改变转录组的组成。3.5转录组研究的方法A.通过序列分析研究转录组1)RNA-seq研究转录组最直接的方法是将其中的mRNA为cDNA,并对所有cDNA克隆进行测序,再与基因组序列进行比较分析。

这可以借助第二、三代测序技术进行。

2)基因表达系列分析(Serialanalysisofgeneexpression,SAGE)

SAGE技术不是研究完整的cDNA,它产生长度12bp的短序列,每一条都代表了转录组中存在的一种mRNA。技术基础:412=16,777,216bp,真核mRNA平均1500bp,412相当于11,000个转录物,这比最复杂的转录组中存在转录物数目还多,因此12bp序列能够代表某一种mRNA。SAGE切下来的片段被收集起来,头尾相连以产生一个串联体,进行测序分析。串联体中的各个标签序列信息被读取并与基因组中的基因序列比对,从而可以分析哪些基因被转录,表达水平如何。B.通过微阵列或芯片分析来研究转录组构成转录组的mRNA总体被反转录成一个cDNA的混合物,然后被标记,用于和芯片或微阵列杂交。

优点:可用于快速评估两个或多个转录组间的差异。

用不同的荧光来标记cDNA样品,微阵列与两个样品同时杂交,可以减少由于试验误差引起的差异。4.ProteinsandtheProteome基因组表达的第二个产物是蛋白质组,即细胞中那些决定细胞能够进行生化反应的所有蛋白质组分。这些蛋白质是通过翻译那些组成转录组的mRNA分子而合成的。4.1Proteinstructure蛋白质和DNA分子一样,是一个线性的无分支的多聚体。蛋白质中的单体亚单位称为氨基酸。氨基酸形成的多聚体或多肽在长度上很少超过2000个单位。a.primarystructure氨基酸通过肽键连接成一条多肽链。b.secondarystructure指多肽采取的不同构象,由不同氨基酸之间形成的氢键所稳定。α螺旋;β片层

c.tertiarystructure是将多肽链的二级结构组分折叠成为三维构型而形成的。它被各种化学力所稳定:氨基酸残基间的氢键;带电荷的氨基酸R基团间的静电相互作用;疏水相互作用;半胱氨酸残基间的二硫键d.quaternarystructure两条或更多已形成三级结构的多肽链组合在一起形成一个多亚基蛋白质。

不是所有蛋白质都有四级结构;稳定力包括:二硫键(稳定);氢键,疏水作用(松散)

X射线晶体学;核磁共振波谱学;三维电镜重构B.蛋白质的多样性取决于氨基酸的多样性组成蛋白质的氨基酸在化学性质上有多样性,因此蛋白质的功能也是多种多样的。

氨基酸的多样性源于R基团。非极性(疏水)极性(亲水)带负电荷带正电荷4.2Theproteome蛋白质组包括了在特定时间存在于细胞中的所有蛋白质。

A.ThelinkbetweenthetranscriptomeandtheproteomeB.蛋白质组和细胞生化功能之间的联系基因组编码的生物学信息最终由蛋白质表现。蛋白质能够执行各种生物学功能:

生物催化作用(酶);结构(细胞骨架由蛋白质决定);运动(收缩蛋白);运输(血红蛋白运输血液中的氧);调节细胞进程(信号蛋白、活化调节因子);保护细胞个体(抗体);储藏功能(麦醇溶蛋白)。4.3蛋白质组研究的方法A.蛋白谱(表达蛋白质组学)用来研究一个蛋白质组组成的特定技术。

蛋白谱基于两项技术:蛋白电泳和质谱

a.双向电泳:

等电点等电点:蛋白质的净电荷为零时溶液的PH值。

b.MALDI-TOF(基质辅助激光解吸电离飞行时间质谱)

• 用于鉴定蛋白组中的蛋白质,最多可以分析出50个氨基酸长度的多肽,因此一个蛋白质可以通过胰酶将其消化后进行测定。• 一旦多肽片段被离子化,多肽的质量/电荷比就可以通过它在质谱仪中从电离源到检测器的“飞行时间”来确定。通过质荷比能够确认多肽片段的分子质量。

• 计算机中含有一个由所研究的物种基因组编码的每一个蛋白质经胰酶消化后各个片段的预计相对分子质量的数据库,计算机通过比较数据库与检测到的多肽片段的分子质量来确认最可能的初始蛋白质。

B.蛋白质印迹法(Western杂交)Western杂交是将蛋白质电泳、印迹、免疫测定融为一体的特异性蛋白质的检测方法。

其原理是:生物中含有一定量的目标蛋白。先从生物细胞中提取总蛋白或目标蛋白,将蛋白质样品溶解于含有去污剂和还原剂的溶液中,经SDS电泳将蛋白质按分子量大小分离,再把分离的各蛋白质条带原位转移到固相膜(硝酸纤维素膜或尼龙膜)上。然后加入特异性抗体(一抗),膜上的目的蛋白(抗原)与一抗结合后,再加入能与一抗专一性结合的带标记的二抗(通常一抗用兔来源的抗体时,二抗常用羊抗兔免疫球蛋白抗体),最后通过二抗上带标记化合物(一般为辣根过氧化物酶或碱性磷酸酶,或用同位素或生物素标记)的特异性反应进行检测。

根据检测结果,从而可得知被检生物细胞内目的蛋白的表达与否、表达量及分子量等情况。

C.鉴定与某一蛋白质相互作用的蛋白质

通过鉴定有相互作用的成对或成组的蛋白质能够获得基因组活性相关的重要数据。

构建蛋白质相互作用图谱被视为是连接蛋白质组学与细胞生物化学过程的一个重要步骤。

a.噬菌体展示

该技术采用了一种基于λ噬菌体或某种丝状噬菌体的独特的克隆载体。

待测基因被插入载体后,它的蛋白质产物能与噬菌体外壳蛋白以融合形式表达。

使用噬菌体展示库来寻找与待测蛋白质相互作用的蛋白质的噬菌体。

b.酵母双杂交

激活因子(转录因子):一类控制基因表达的蛋白质,包含DNA结合结构域和转录激活结构域。

双杂交系统使用缺乏某一报告基因相应激活因子的酿酒酵母菌株,此时报告基因是不表达的。D.蛋白质相互作用图谱也叫蛋白质相互作用网络,能展现一个蛋白质组中各成员间发生的相互作用。

Chapter2StudyingDNA概述DNA重组技术:借助工具酶按预定的方式操作DNA分子,将DNA分子切成小片段,并重新将它们连接在一起,形成自然界不存在的组合体。聚合酶链式反应(PCR)2.1DNA聚合酶/核酸酶、连接酶、末端修饰酶以现有DNA或RNA分子为模板合成DNA的酶,称为(依赖模板的)DNA聚合酶。

A.依赖模板的DNA聚合酶的工作模式按照碱基互补配对的原则,从5’→3’方向合成,需要寡聚核苷酸作为引物。DNA聚合酶I(Kornberg聚合酶)聚合酶功能、3’-5’外切核酸酶活性、5’-3’外切核酸酶活性

Klenow聚合酶用枯草杆菌蛋白酶处理DNA聚合酶I,可获得两个片段,大片段的分子质量约76kDa,保留聚合酶活性和3’-5’外切核酸酶活性,又叫Klenow片段。

小片段的分子质量约34kDa,具有5’-3’外切核酸酶活性。

DNA体外标记的方法缺口平移法(Nicktranslation)(DNA聚合酶I)利用PolyI在双链DNA的缺口处进行离体合成。

断裂双链内部的一个磷酸二酯键,PolyI从缺口处的3’-OH开始新链合成。同时原有的同源链被排开,被5’-3’外切酶作用降解,缺口的位置沿双链移动。

缺口转移是DNA体外放射性标记的重要技术。B.末端标记法(Klenow片段)C.随机引物法(Klenow片段)

2.2核酸酶:外切核酸酶和内切核酸酶A.限制性内切核酸酶在特定的位置切割DNA分子

按限制性内切酶的组成、是否具有修饰酶活性以及切断核酸的情况不同,限制酶可分为三类:I型,II型和III型。a.I和III型限制性内切酶既能催化宿主DNA的甲基化,又催化非甲基化的DNA的降解,但切割位置不固定。

b.II型限制性内切酶只催化非甲基化的DNA的降解(无修饰酶活性),且具有识别位点的专一性和切割位点的专一性,一般在识别序列内切割,不需要ATP提供能量,是重组DNA技术中常用的限制性内切酶。

细菌中三种不同类型的限制-修饰酶

B.检查限制性消化的结果在指明pH与温度下,在50µL反应体系中,1小时消化1µg的λDNA的酶量为1单位(1U)。

Southern杂交2.3DNA连接酶通过DNA连接酶可以将限制性内切核酸酶消化产生的DNA片段重新连接起来,或者连接到一个新的分子上。T4DNA连接酶:从T4噬菌体感染后的大肠杆菌细胞中提取。

•粘性末端连接的高效率推动了将钝末端转变成粘性末端方法的发展。

•一种方法是将称为连接子(linker)或接头(adaptor)的小双链分子连接到钝末端。

•另一种方法是利用末端脱氧核糖核苷酸转移酶进行同聚物加尾,即在钝末端的3’末尾一个接一个地添加核苷酸。

2.4末端修饰酶

末端修饰酶:改变DNA分子末端,为连接实验的设计增加可操作空间。A.末端脱氧核糖核苷酸转移酶:属于模板非依赖的DNA聚合酶。

B.碱性磷酸酶:去掉DNA分子5’端磷酸基团,从而阻止这些分子连接到其他分子上。

C.T4多聚核苷酸激酶:向DNA分子5’端添加磷酸基团,主要用于DNA分子的末端标记。

3.DNACloning

3.1克隆载体及其使用方式

质粒,噬菌体,人工染色体等它们都含有复制起始位点。A.以大肠杆菌质粒为基础的载体

pUC系列

(蓝白斑挑白色的)pUC8,2.7kb,除了起始位点外,还携带氨苄青霉素抗性基因(pUC8的选择性标记)和lacZ’基因(编码β-半乳糖苷酶的一部分)。

某些大肠杆菌菌株具有一个修饰的lacZ基因,该基因中缺失lacZ’部分。

B.建立在大肠杆菌噬菌体基因组基础上的克隆载体

最初尝试着发展能操作大片段DNA分子的载体集在λ噬菌体上。

λ噬菌体存在两种感染周期:裂解性感染周期/溶源性感染周期λ噬菌体基因组大小为48.5kb,其中有15kb为随意区域,可以被删除而不影响噬菌体感染细菌的能力。

据此,目前发明了两种类型的载体:插入型载体:该载体中部分或全部随意DNA被删除,并在删切后的基因组内部的某些位点引入一个单一的限制性酶切位点。

替代型载体:该载体中随意DNA位于一填充片段内,两侧有一对限制性酶切位点,当要克隆的DNA连接到该载体时,这个区段就被取代。λ噬菌体基因组是一个线性分子,但其两个末端具有12个核苷酸的单链突出,称为串联体cos位点。

cos位点序列与λ噬菌体的体外包装密切相关。

C.用于更长DNA片段的载体

a).考斯质粒(cosmid)、黏粒具有λcos位点的质粒,与λ噬菌体一样具有感染性。

插入片段可高达44kbb).酵母人工染色体(YAC)

在YAC中,构成这些染色体组件的DNA序列与一个或多个选择性标记物,至少一个限制性酶切位点连接起来,酶切位点是为了插入新的DNA,可用来克隆600-1400kb的片段。一些类型的YAC载体有插入不稳定的问题,即克隆的DNA重排形成新的序列组合c).细菌人工染色体(BAC)

是基于天然的大肠杆菌F质粒构建的;

能够克隆300kb及更长的片段,并且插入的片段很稳定;

可以通过Lac筛选来鉴定重组体,是目前克隆大片段DNA最常用的载体。d).P1噬菌体载体

与λ载体相似,以天然噬菌体基因组的缺失形式为基础;

P1基因组比λ基因组大,因此能克隆的DNA片段比λ载体大;

运用目前的技术可以克隆长达125kb的片段。

e).P1衍生的人工染色体(PAC)

综合了P1载体和BAC的特点,具有克隆长达300kb片段的容量。

f).Fosmids

包含F质粒的复制起始位点和λ载体的cos位点,有出现不稳定问题的倾向。4.ThePolymeraseChainReaction(PCR)PCR是一种在体外借助于DNA聚合酶实现特定基因或DNA序列扩增的方法。4.1PCR基本原理4.2参与PCR反应体系的因素•模板核酸:基因组DNA(genomicDNA,gDNA),互补DNA(complementaryDNA,cDNA)。

•引物:16-30bp,四种碱基随机发布,G+C%=40-60%,引物3’端不能错配。

•TaqDNA聚合酶:来自嗜热水生古细菌,耐高温,不具3’-5’外切酶活性。

•缓冲液•Mg2+:与Taq酶的活性有关。

•dNTP(脱氧核糖核苷三磷酸)

•PCR仪:自动升降温,程序化。

•30个循环后能将目标序列扩增10亿倍以上。4.3PCR的局限性和应用•局限性:a.必需知道被扩增DNA的边界序列才能PCR,因此不能用来纯化从未被研究过的基因片段。

b.扩增片段的长度。一般扩增长达5kb的片段不会有太大困难,但要扩增更长片段存在麻烦。

c.存在非特异性扩增的问题。主要是由于Taq酶缺少3’-5’外切酶的功能。

•应用:基于PCR的分子标记;临床诊断;考古研究;基因表达分析(RT-PCR、实时定量PCR)等。4.4RT-PCR•反转录PCR(RT-PCR)是一种从RNA扩增cDNA拷贝的方法。

•RT-PCR对于克隆mRNA的5’、3’端序列和从非常少量的mRNA样品构建大容量的cDNA文库以及测定基因表达的强度等方面都是极为灵敏和通用的方法。

•常用的逆转录酶有两种:AMV逆转录酶和MMLV逆转录酶。

两步法适用于mRNA表达分析、效率高、使用Random和Oligo-dt引物制备cDNA库、cDNA可以长期保存一部法适用于病毒、病原菌检测,操作简单、污染率低4.5实时荧光定量PCR(FQ-PCR)实时荧光定量PCR技术(real-timefluorescentquantitativePCR,FQ-PCR)是一种在PCR反应体系中加入荧光基团,利用荧光信号积累实时监测整个PCR进程,最后通过标准曲线对未知模板进行定量分析的方法,实现了PCR从定性到定量的飞跃。

简单的说,就是在PCR体系中加入荧光,以便对反应体系和反应进程进行监测,记录,分析。而PCR仪无非是在普通PCR的基础上加上个荧光探头和相应的数据处理软件而已。

在实时荧光定量PCR反应中,随着PCR反应的进行,PCR产物不断累加,荧光信号的强度也等比例增加,这样我们就可以通过荧光强度的变化来监测产物量的变化,从而得到一条荧光扩增曲线图。

一般而言,荧光扩增曲线可以分成三个阶段:荧光背景信号阶段,荧光信号指数扩增阶段和平台期。

在荧光背景信号阶段,扩增的荧光信号被荧光背景信号所掩盖,我们无法判断产物量的变化。而在平台期,扩增产物已不再呈指数级的增加,PCR的终产物量与起始模板量之间没有线性关系,所以根据最终的PCR产物量不能计算出起始DNA拷贝数。只有在荧光信号指数扩增阶段,PCR产物量与起始模板量的对数值之间存在线性关系,我们可以选择在这个阶段进行定量分析。

为了定量和比较的方便,在实时荧光定量PCR技术中引入了两个非常重要的概念:荧光阈值和CT值。

荧光阈值是在荧光扩增曲线上人为设定的一个值,它可以设定在荧光信号指数扩增阶段任意位置上,但一般荧光域值的缺省设置是3-15个循环的荧光信号的标准偏差(sd)的10倍。

CT值:每个反应管内的荧光信号到达设定的阈值(荧光阈值)时所经历的循环数被称为CT值(thresholdvalue)。

CT值与起始模板的关系研究表明,每个模板的CT值与该模板的起始拷贝数的对数存在线性关系,起始拷贝数越多,CT值越小。利用已知起始拷贝数的标准品可作出标准曲线。

•因此,只要获得未知样品的CT值,即可从标准曲线上计算出该样品的起始拷贝数。

FQ-PCR的化学原理

•实时荧光定量PCR的化学原理包括探针类和非探针类两种。•探针类是利用与靶序列特异杂交的探针来指示扩增产物的增加;非探针类则是利用荧光染料或者特殊设计的引物来指示扩增产物的增加。

•前者由于增加了探针的识别步骤,特异性更高,但后者则简便易行。

分子信标

SYBRGreenI是一种结合于小沟中的双链DNA结合染料。由于SYBRGreenI能与所有的双链DNA相结合,不必因为模板不同而特别定制,因此设计的程序通用性好,且价格相对较低。TaqMan探针是一种寡核苷酸探针,它的荧光与目标序列的扩增相关。•分子信标是一种在靶DNA不存在时会形成茎环结构的双标记寡核苷酸探针。

•在此发夹结构中,位于分子一端的荧光基团与分子另一端的淬灭基团紧紧靠近。在此结构中,荧光基团被激发后不是产生光子,而是将能量传递给淬灭剂,这一过程称为荧光谐振能量传递(FRET)。由于淬灭剂的存在,由荧光基团产生的能量以红外而不是可见光形式释放出来。

•分子信标的茎环结构中,环一般为15-30个核苷酸长,并与目标序列互补;茎一般5-7个核苷酸长,并相互配对形成茎的结构。荧光基团连接在茎臂的一端,而淬灭剂则连接于另一端。

•分子信标必须非常仔细的设计,以致于在复性温度下,模板不存在时形成茎环结构,模板存在时则与模板配对。

•与模板配对后,分子信标的构象改变使得荧光基团与淬灭剂分开。此时荧光基团被激发,发出自身波长的光子。

4.6反向PCR(inversePCR)

反向PCR是对已知DNA片段两侧的未知序列进行扩增和研究的一种简捷方法。

其原理是:用限制性内切酶A消化DNA片段,然后用连接酶将酶切产物连接成环状,再用已知序列上两端相反方向的引物进行PCR扩增。A和B分别为限制性内切酶及其酶切位点;P1和P2分别为引物;黑色区域为已知序列;空白区域为未知序列

Chapter3MappingGenomes

1.概述•测序工作中有一个局限性:在一个测序反应中一般只能测出1kb左右的准确序列。这就意味着长的DNA分子必须由一系列短的序列拼接而成,即需将大分子分解为片段,测出每一段的序列,再用计算机寻找重叠的部分,从而拼接成长的序列-鸟枪法(shotgun)。•这种鸟枪法是小的原核生物测序的标准方法,但是对于较大的真核生物基因组来说是相当困难的,特别是当分析基因组的重复区域时会发生错误。

鸟枪法中遇到的问题-1、串联重复DNA,丢失2、基因组范围内的重复,错误拼接

•因此,必须首先建立一个基因组的图谱,通过标明基因或其他显著特征的位置,为测序提供指导。

•一旦得到了基因组图谱,基因组计划中的测序阶段可以采用下面两种方法之一进行:

(1)全基因组鸟枪法(whole-genomeshotgun):使用基因组图谱上的显著特征为界标,指引着将用鸟枪法获得的大量短序列拼接成主序列。(2)克隆重叠群法(clonecontig):将基因组打断成长度为数百kb或数个Mb的大片段,将这些大片段定位到基因组图谱上并拼接成重叠群,利用鸟枪法对大片段分别测序后再进行拼接。2.遗传图谱和物理图谱

遗传图谱:指应用遗传学技术(遗传重组)构建的能在基因组上显示基因和其它序列特征位置的线性排列图,反映了基因或标记间的相对距离和顺序。cM

物理图谱:指应用分子生物学技术直接分析DNA分子,从而构建的能显示包括基因在内的序列特征位置的图谱,它反映了基因或标记间的实际距离。Bp,kb,Mb3.1基因是首先被利用的标记

•最初的遗传图谱是在20世纪初针对果蝇等生物使用基因作为标记构建的。

•一个基因必须以指定一个表型的两种替换形式存在或以等位基因形式存在,才能用于遗传学分析。比如豌豆茎的高与矮,果蝇眼睛颜色的红与白等。

3.2用于遗传学作图的遗传标记遗传标记:可以示踪染色体、染色体某一片段、某个基因座在家系中传递的任何一种遗传特征。

•形态标记•细胞学标记•生化标记•DNA分子标记

所有的标记都必须具有多态性!

DNA分子标记:简称分子标记指在DNA水平,具有相对差异的等位基因的DNA多态性标记是DNA水平上遗传变异的直接反映。RFLP/SSR/SNP优点:

1、不受时间和环境的限制2、遍布整个基因组,数量无限3、不影响性状表达4、变异丰富,多态性好5、大部分为共显性,能鉴别纯合体和杂合体

A.限制性片段长度多态性(restrictionfragmentlengthpolymorphism,RFLP)用限制性内切酶酶切基因组DNA时,在同一种生物的不同个体间出现含同源序列的酶切片段长度的差异。Southern/CAPSB.简单重复序列Simplesequencerepeat,SSR,Microsatellite(微卫星)指重复单位相对较小(2-6bp的基序),由于重复单位数目的变化而形成的多态性。SSR的检测方法:1、PCR+平板PAGE电泳2、PCR+毛细管电泳(引物需要荧光标记可获得片段的准确长度)C.单核苷酸多态性(Simplenucleotidepolymorphism,SNP)基因组中的某些位点上,有些个体只有一个核苷酸与其它个体不同,这种分散在基因组中的单个碱基的差异就称为SNP。

绝大多数SNP是双等位基因;

有的能形成RFLP,绝大多数不能。

a.通过寡核苷酸杂交分析检测SNP寡核苷酸是在试管中合成的长度小于50bp的DNA分子,寡核苷酸只有与待测DNA在高严谨杂交条件下,分子形成完全的碱基配对时,二者才能杂交;如果有一个碱基错配,杂交体会非常不稳定,不能形成杂交信号。(1)DNA芯片技术:应用面积为2cm2或更小的玻璃或硅质晶片,在上面高密度的排列着许多寡核苷酸,待测DNA用荧光标记后与芯片杂交,再用荧光显微镜检测,发出荧光的表明寡核苷酸与待测DNA杂交上了。

此方法在一次实验中可以检测许多个SNP。

(2)液相杂交技术:在微量滴分子信标定板的孔中进行,每个孔中含有一种不同的寡核苷酸;寡核苷酸的一端与荧光染料连接,另一端与荧光淬灭复合物连接,且其两个末端可以形成碱基配对;当淬灭复合物与荧光染料相邻时,无荧光发出;如果寡核苷酸与待测DNA能够杂交,则会破坏环形结构,此时淬灭复合物远离荧光染料,有荧光发出。

b.通过耐扩增突变系统检测SNP(AmplificationRefractoryMutationSystem,ARMS)将SNP位点引入PCR引物3’端的最后一个碱基,直接进行PCR扩增。在严谨的PCR条件下,存在SNP的引物对不能扩增出目的条带。4.物理作图遗传图谱的局限性:1.遗传图谱的分辨率依赖于所得到的交换数目;2.遗传图谱的准确率有限

物理作图的常用方法:

1)限制性作图:在DNA分子上定位限制性内切酶酶切位点的相对位置;

2)荧光原位杂交(FISH):将分子标记与完整染色体杂交来确定标记的位置;

3)序列标签位点(STS)作图:通过对批量的基因组片段进行PCR和(或)杂交分析,来对短序列进行定位作图。

4.1限制性作图(Restrictionmapping)A.限制性作图的基本方法

1)双酶解(doubledigest)Key:分析重叠片段

2)部分酶解+完全酶解:比较分析这两种情况下的片段大小。

3)末端标记+部分酶解

a)利用放射性的同位素标记DNA的3’端或5’端b)部分酶解c)放射自显影多克隆位点(multiplecloningsites,MCS):指多个限制性内切酶的单一切点簇,由许多限制酶切位点组成。MCS往往是人工合成的一段外源基因的插入部位的DNA序列。B.限制性作图的规模受限于限制性片段的大小

•如果使用的限制酶在DNA上切点相对较少,构建限制性图谱就比较容易。•限制性作图更适用于小分子。如果DNA分子小于50kb,通常选用6碱基识别序列的限制性酶来构建限制图谱。•对于大于50kb的DNA分子,可以选用“稀有酶”进行构建。稀有酶:

(1)选用识别序列为7或8碱基的限制性内切酶进行切割。如:SapI(7);SgfI(8)。

(2)选用识别序列所含基序在靶DNA分子中稀少的酶。如人类基因组中,5’-CG-3’序列就比较稀少,如果选用NotI(5’-GCGGCCGC-3’)进行消化,平均约10Mb才有一个切点。可用该技术构建原核生物和低等真核生物(酵母和真菌)等染色体较小的生物的限制图谱。限制性作图不能用于大型基因组。如果用普通琼脂糖凝胶电泳来分离大片段DNA分子,电泳分辨率会大大降低。交变脉冲场凝胶电泳(PFGE):1984年,Schwartz和Centor发明;这项技术采用定时改变电场方向的交变电源,每次电流方向改变后持续1s到5min左右,然后再改变电流方向,反复循环,所以称之为脉冲式交变电场。•正交变电场凝胶电泳(OFAGE)两对电极间的电场可以改变,每对电极与凝胶长度方向成45度角;电场的每次改变都迫使DNA分子重新排列,从而提高分辨率•电场转换凝胶电泳(FIGE)

•等高加压均匀电场(CHEF)4.2荧光原位杂交(FISH)A.用荧光探针进行原位杂交

原位杂交是以标记的DNA分子为探针,检测完整染色体的一种杂交分析方法。•用于原位杂交的探针的标记要同时满足高灵敏度和高分辨率两个条件,非放射性的DNA荧光标记技术能满足这一要求。

•现已设计出具有不同发光特性的荧光标记物,可以将一组不同的探针与单个染色体杂交,并分辨出每种杂交信号,从而检测出各探针的相对位置。

•在过去,探针必须是相当长的DNA的分子,通常至少是40kb的克隆片段;随着荧光信号放大技术的应用,现在最小可以检测500bp的DNA片段。

一种封闭探针重复序列的方法:如果探针中含有一些重复序列,它可能会和染色体上的多个位点发生非特异性杂交;因此,探针在使用前要和来自被研究组织中的未标记DNA混合;用于混合的未标记DNA可以是总的这时探针只与特异序列发生杂交核DNA,但最好是富含重复序列的DNA片段。B.FISH应用的局限性•中期染色体是高度凝聚的,每条染色体都具有可识别的形态。

•使用中期染色体的缺点在于,由于它的高度浓缩的性质,只能进行低分辨率作图,两个标记间至少相隔1Mb才能分辨出来。

•因此,中期染色体FISH主要用于确定新标记在染色体上的大概位置,为更精细的作图做准备。

•操作较繁琐,数据积累速度太慢。

更精细作图的两种途径:

•机械伸展的染色体:通过离心产生的剪切力可将染色体伸展到正常长度的20倍,这样分辨率可明显提高,能够区分出相隔200-300kb的标记。

•非中期染色体:相比之下,分裂间期的染色体更为有用,因为此时的染色体包装程度最低,分辨率有可能达到25kb以下。但染色体形态特征消失,失去了定位探针位置所必需的外部参照位点。因此,一般在获得粗略图谱后,用该技术来确定染色体一小段区域内一系列标记间的顺序。4.3序列标签位点作图(STS作图)•用STS技术绘制物理图是到目前为止最为有效的方法。

•STS其实只是基因组中任何单拷贝的短DNA序列,长度在100-500bp,但要求序列已知且在染色体上有唯一的定位。

•要得到至少5套包含相关染色体或整个基因组的DNA片段(染色体上每一点平均有5个片段相对应),然后用各个DNA片段做模板,用不同STS标签上的序列做引物进行PCR扩增,筛选阳性克隆。

•如果某两个STS标签在基因组上靠的很近,它们同时出现在一个DNA大片段上的概率就会很大,反之就会很小。因此,可以根据两个STS的分离频率来计算它们间的图距。

•只要有一定数量的STS标签,所有DNA大片段在染色体上的位置就能被确定下来,从而构建由DNA大片段(YAC/BAC克隆)重叠群组成的物理图谱。

一个DNA序列要成为STS,要满足两个条件:

1)它的序列必须是已知的,以便于用RCR方法检测该STS在不同DNA片段中存在与否;

2)STS必须在拟研究的染色体或基因组上有唯一的定位。因此,需要确保STS不位于重复DNA区域。可以通过以下途径获得STS:

1)表达序列标签(EST):通过对cDNA克隆测序获得的短序列,代表了表达的基因的一部分。如果EST来自单一序列DNA,不是基因家族中的某一成员,可以被用作STS;

2)简单序列长度多态性(SSLP):如果将被遗传定位的SSLP用作STS进行物理定位,会很有价值,因为它们可以在遗传图谱和物理图谱间提供直接联系;

3)随机基因组序列:通过对克隆的基因组DNA随机小片段测序获得。

B.用于STS作图的DNA片段群

•STS作图必需的第二个要素是覆盖拟研究的染色体或基因组5倍以上的DNA片段群(作图试剂)。

•作图试剂可以来自克隆文库和放射杂交体组。a.克隆文库可用于STS分析•基因组计划进入测序阶段的前提是将基因组或分离的染色体断裂成片段,并将每个片段克隆到高容量载体中,这样产生的一个克隆文库,即DNA片段的集合,它可用于STS分析。

•可以利用流式细胞计数仪来分离单独的染色体。利用流式细胞计数仪分离染色体荧光染色的染色体混合物通过一个小孔,使产生的每一个液滴只含有一条染色体;荧光探测器检测到含有目标染色体的液滴发出的信号,并将一个电荷加到液滴上;当液滴到达偏转电板时,带电荷的液滴偏转进入收集器中。•克隆文库用于STS作图有一个明显的优势,就是单个克隆即为可提供测序的DNA;

•来自STS分析的数据既可用作STS作图,又可用于构建克隆重叠群(clonecontig);

•如果STS也包括已遗传定位的SSLP,那么DNA序列、物理图谱和遗传图谱就可以有机结合在一起。

b.放射杂交体组可用于STS分析

•放射杂交体:利用高剂量的射线将供体细胞染色体打断成若干小片段,再与近缘物种的受体细胞融合,形成放射杂交体;

•放射杂交作图是基于染色体上的两个STS相距越近其通过断裂分开的频率越低的原理,通过PCR方法研究细胞中供体的STS的分布,利用统计学的手段计算STS间的断裂分离频率,从而可以推算出STS间的距离和在染色体上的排列顺序。

•使用PCR方法鉴定STS时,必需保证其只能从供体,而不能从受体基因组中扩增出相应片段。本章学习要点基因组测序需要借助基因组图谱的原因;遗传图谱和物理图谱的区别;描述用于构建遗传图谱的分子标记,以及每种标记是如何检测的;描述用于遗传作图的群体,以及它们是如何构建的;掌握构建物理图谱的三种方法,特别是限制酶切图谱的构建方法和STS图谱的构建方法,并评价三种方法的优缺点;描述放射杂交体是如何产生的?Chapter4SequencingandAnnotationofGenomesA.GenomeSequencing1.DNA测序方法1.1链终止DNA测序法(化学降解法测序、焦磷酸测序)基本依据:聚丙烯酰胺凝胶电泳(PAGE)能够把长度只差一个核苷酸的单链DNA分子区分开。10-1500bp两种形式的聚丙烯酰胺凝胶电泳:平板胶、毛细管胶链终止法测序概述• 链终止法测序的起始材料是均一的单链DNA分子。• 首先由短寡聚核苷酸在每个分子的相同位置上退火,并充当引物合成与模板互补的新DNA链。• 在测序反应体系中加入少量的被不同荧光标记物标记的双脱氧核糖核苷三磷酸(ddNTP)后,合成的互补链可在不同位置随机终止反应,产生一系列只差一个核苷酸的DNA分子。• 通过PAGE电泳可以读出待测DNA分子的序列。链终止法测序需要单链DNA模板制备单链DNA的方法:(1)把DNA克隆到质粒载体中,再通过碱或煮沸变性形成单链DNA。缺点是质粒DNA会被少量的细菌DNA或RNA污染。(2)把DNA克隆到M13噬菌体载体中。在噬菌体颗粒中,DNA分子以单链形式存在。缺点是该系统只能用于短片段DNA,大于3kb的片段被克隆到M13载体后会发生缺失和重排。(3)把DNA克隆到噬菌粒中。噬菌粒是一种质粒克隆载体,除含有自身的复制起点外,还包含来源于M13噬菌体的起始位点。如果大肠杆菌中既有噬菌粒又有噬菌体,噬菌粒上的噬菌体起始位点就会被激活,产生含有噬菌粒单链形式的噬菌体颗粒,双链质粒DNA就被转变为单链DNA。这一系统避免了M13克隆的不稳定性,可用于克隆10kb或更长的片段。通过在M13噬菌体载体中克隆获得单链DNAM13载体有两种形式:双链复制型分子和在噬菌体颗粒中发现的单链型。链终止法测序所用的DNA聚合酶测序酶必须满足3个标准:(1)高持续合成能力:保证在掺入ddNTP之前,反应不会停止。 (2)可忽略的或没有5’-3’外切核酸酶活性。(3)可忽略的或没有3’-5’外切核酸酶活性。Klenow聚合酶:持续合成能力较低,合成片段长度小于250bp;测序酶:T7噬菌体所编码的DNA聚合酶I的修饰形式,该酶具备高持续合成能力,且无外切核酸酶活性。D引物决定了待测序的模板DNA区域链终止法测序所用的不同类型引物:通用引物/内部引物E.热循环法测序代替传统方法学热循环法测序类似于进行PCR反应,相对于传统链终止法测序有如下优点:(1)它用双链而不是单链DNA作为起始材料。(2)只需要很少量的DNA就可以进行测序,产物以线性方式积累,因此DNA在测序前不必克隆,可直接对挖带回收纯化后的PCR产物进行测序。1.2DNA测序的其他方法化学降解法测序:链终止法测序的一个局限性是:如果模板DNA能形成链内碱基配对的话,那么它就可能不会提供正确序列。• 化学降解法也是通过检查末端核苷酸已知的分子的长度来确定序列的。• 这些不同长度的分子是通过能在特定的核苷酸处进行特异切割的化学试剂的处理而产生的。• 利用化学降解法测序,至少需要进行4个单独的测序反应,每种核苷酸对应一个反应。(测2)化学降解法测序• 起始材料是双链DNA。•每条链的5’端连接一个放射性的磷基团对DNA进行标记• 双链中的一条链可能比另一条链含有更多的嘌呤核苷酸,因此就稍微重一些,电泳过程中就迁移得慢。•从凝胶中纯化出一条链后,分成4份样品,每份样品都用一种切割试剂进行处理。有限量:保证每条链上平均只有一个G残基被甲基化修饰。• 每个反应所产生的分子上样到PAGE平板凝胶的一个泳道上,电泳后条带在凝胶上的位置通过放射自显影来观察。• 移动最远的条带代表最小的DNA片段。(测3)焦磷酸测序:边合成边测序每种核苷酸分别依此加入;如果核苷酸未渗入到正在合成的链中,就会被反应体系中的核苷酸酶降解;如果核苷酸渗入到正在合成的链中,释放的焦磷酸盐会引起化学发光,发出的荧光信号可以被检测到。在6.4cm2的芯片上可以同时进行160万个反应,4h内可以获得包含2500万个核苷酸的序列。2.连续DNA序列的组装(鸟枪法、全基因组鸟枪法和克隆重叠群法)2.1通过鸟枪法拼接序列• 对于相对较小的原核生物基因组,可以通过鸟枪法直接进行测序。• 测序实验中得到的短序列可通过检查重叠区而直接叠加成主要序列。“序列间隙”:可以通过对文库中已经存在的克隆进一步筛选和测序来封闭的间隙。物理间隙:指克隆文库中不存在的序列,可能是因为这些序列在所使用的克隆载体中不稳定造成的。两种解决策略:a.换一种载体重新构建一个克隆文库,用与重叠群末端相对应的寡聚核苷酸与该文库进行杂交。b.用成对的寡聚核苷酸为引物进行PCR扩增。流感嗜血杆菌序列证实了鸟枪法测序的能力• 现在普遍认为,任何小于5Mb的基因组序列,即使在计划开始前不知道基因组的任何信息,几个月的时间足够获得它的全部序列。• 因此,鸟枪法的优点在于测序速度快,并且能够在遗传图谱和物理图谱不存在的情况下进行工作。2.2用克隆重叠群方法组装序列• 克隆重叠群方法被看作是获得真核生物基因组序列的传统方法。• 在该方法中,基因组通常经部分酶切而产生较长的DNA片段,再把这些片段克隆到高容量载体,如BAC中。再借助基因组图谱的信息,建立BAC克隆重叠群,然后通过鸟枪法对克隆群进行分别测序再组装。可以通过染色体步移来建立克隆重叠群,但该方法费力• 最简单的构建克隆重叠群的方法是从基因组文库的一个克隆开始,鉴定出与第一个克隆中的插入片段重叠的第二个克隆,依此类推。这就是染色体步移法。• 该方法的存在问题是,如果用作探针的插入片段含有重复序列,那么它不仅能与重叠的克隆杂交,还能与含有重复序列拷贝的非重叠克隆杂交。• 如果用插入片段末端的一个片段作为探针,出现重复序列的机会就回减少。还可对末端序列进行测序来确保不存在重复DNA。• 如果末端片段序列已知,可以通过PCR而不是杂交来筛选,这样可以加速步移的速度。更快的克隆重叠群组装方法• 染色体步移是一个比较慢的过程,几乎不可能用该方法拼接出多于15-20个克隆的重叠群。• 一个改进的方法是使用克隆指纹图谱技术。该技术提供了待克隆DNA片段的物理结构信息,将这些物理结构信息和其它克隆的相关信息做一些比较分析,就能鉴定出重叠序列。克隆指纹图谱技术• 限制性图谱:通过用多种限制性内切酶消化克隆,并在琼脂糖凝胶上分离消化产物而得到。• 重复DNA指纹图谱:通过对利用一类或多类重复序列特异的探针进行Southern杂交所得到的一系列限制性片段进行分析而获得的。• 重复DNA的PCR或散步重复元件的PCR:运用在重复序列内退火的引物,能够扩增出两相邻重复序列之间的单拷贝DNA。为了鉴定出可能的重叠区,重复DNA进行PCR之后获得的产物大小可以作为与其他克隆相比较的指纹。• STS作图:非常有用,因为它能够产生一个定位于STS物理图谱上的克隆重叠群。2.3全基因组鸟枪法测序全基因组鸟枪法测序的主要特征• 鸟枪法测序中最费时的地方是将单个序列重叠群通过封闭序列间隙和物理间隙而连在一起的阶段。• 通过使用两种或两种以上的不同载体中所克隆的片段产生的序列能够有效提高基因组的整体覆盖面。• 解决由于重复序列引起的组装问题的有效策略是确保其中一个克隆文库中插入片段的长度大于所研究基因组中最长的重复序列。• 序列组装的最初结果是一系列骨架(scaffold),每个骨架包括一组被序列间隙分开的序列重叠群,骨架与骨架间被物理间隙分开。scaffold:可利用STS图谱对骨架进行定位,并检查骨架拼接是否正确。• 序列间隙位于成对端点序列之间,通过成对端点序列筛选文库,获得阳性克隆并测序,可以封闭间隙。• 全基因组鸟枪法有可行性,准确性方面仍存在问题。• 部分问题是序列产生的随机性,基因组的某些部分被微小片段覆盖许多次,而其他部分只被覆盖一两次。B.UnderstandingGenomeSequences1.在基因组序列中定位基因1.1通过序列筛查定位基因基因不是核苷酸的随机排列,而是具有明显的特征:基因的编码区是可读框• 编码蛋白质的基因含有可读框(ORF),可读框包含一系列能规定基因编码蛋白质中氨基酸序列的密码子,并开始于起始密码子(通常是ATG),结束于终止密码子(TAA,TAG,TGA)。• 成功寻找ORF的关键在于终止密码子在DNA序列中出现的频率。ORF扫描是一种在细菌基因组中定位基因的有效方法单纯的ORF扫描对高等真核生物DNA效果不佳• 原因之一是真核生物基因组中基因间的间隔很大,发现假ORF的概率就会增加。• 原因之二是真核生物的ORF是不连续的,经常被内含子所隔开,而且单个外显子的长度一般小于100个密码子。对ORF扫描的基本程序已经作了三项改良:• 密码子偏倚(codonbias)被考虑在内。密码子偏倚:指特定生物体的基因中,并不是所有密码子的使用频率都是平等的。如亮氨酸可由6种密码子编码,但在人类基因组中,亮氨酸大多由CTG编码。• 外显子-内含子边界。GU-AG规则:核mRNA的剪接点一般都为GU….AG。• 上游调控序列可用来定位基因起始区。上游调控序列也具有显著的序列特征,它们作为识别信号在参与基因表达的DNA结合蛋白中起重要作用。但调控序列是易于变化的,对于真核生物尤为明显,因此通过该方法定位基因也存在很大局限性。尽管上述三种ORF扫描方法都有局限性,但普遍适用于所有高等真核生物基因组。另外的可能适用于单个生物体的策略:脊椎动物基因组中,许多基因的上游都有CpG岛。CpG岛一般位于基因上游区域,大约有1kb长,其中GC含量比整个基因组的平均含量要高。人类基因中40-50%的基因上游都含有CpG岛。为功能性RNA定位基因• 功能RNA基因不包含ORF,所以不能用前面讲的方法进行定位。• 这些功能RNA分子具有它们自己的特征,其中最重要的是它们能折叠形成二级结构。• 如tRNA分子具有三叶草结构对于其他一些功能RNA可用如下方法进行定位:•大多数功能RNA都包含一个或多个茎环或发夹结构,搜寻DNA序列中这样结构的程序就能鉴别出功能RNA基因可能的存在区域。• 搜寻与功能RNA基因相关的调控序列(前面/内部)。• 在基因组较小的基因组中,仔细检查蛋白质编码基因广泛搜寻之后留下的“空位置”区域,可能会发现一个或多个功能RNA基因的存在。同源性搜索和比较基因组学为序列筛查提供了一个特殊的方向1、同源性搜索:通过查询DNA数据库来判断所检测序列是否与已知基因的序列相同或相似。• 通过同源性搜索可以来检验一系列三联体密码子是真正外显子还是随机序列,一定程度上可以弥补ORF识别的局限性。• 同源性搜索的另一个主要用途是为新基因确定功能。2、比较基因组学:相关种属的基因组序列既具有从它们的共同祖先继承过来的相似性,又具有由于物种开始单独进化而产生的种属特异性。由于自然选择,序列相似性在基因内部最大,而在基因间区域最小,当相关基因组进行比较时,同源基因由于它们的序列相似性很高,就很容易被鉴定出来。• 可以通过比较基因组学来检测ORF的真实性,如果某一个新定位的ORF在相关基因组中都不存在,那么它很有可能不是一个真正基因。自动标注基因组序列• 运用计算机方法进行基因组标注是从序列分析开始的,运用能扫描ORF、外显子-内含子边界及上游调控区并能在数据库中检测同源基因ORF的程序进行序列分析,这些程序同时也用于寻找重复序列及功能RNA基因的特异性特征。• 运用这些程序还可以扫描cDNA序列数据库,以寻找与基因组序列中任何相匹配的片段,任何这样的匹配都表明是一段能转录成mRNA的区域1.2基因定位的实验技术• 大多数基因定位的实验方法不是直接检测DNA分子,而是检测由基因转录成的mRNA分子。• 转录物通常比基因编码部分要长,因为转录物中包含5’-UTR区和3’-UTR区。• 因此,转录物分析不能准确定位基因编码区的起始和终止点,但能告诉你一个基因确实存在于某特定区域中,并且可以定位外显子-内含子边界。杂交实验可以判断某一片段是否含有转录序列• 可通过northern杂交检测某一DNA片段是否含有转录序列。• 通过northern杂交检测有两个缺点:1、一些单个基因有两个或更多长度不等的转录物,因此杂交后可能会检测出两条或多条杂交带。如果该基因是多基因家族的一员也会出现同样的问题。2、基因表达具有组织特异性和发育阶段特异性,因此很难制备完整的mRNA样品。也有一些基因表达量太低,很难被杂交检测到。原理:同源基因具有相似的序列,而基因间区域片段是否含有转录序列序列相似性很低。• 种属间印迹(zooblotting):用一个物种的DNA片段与相关物种的DNA进行Southern杂交,如果能得到一个或多个杂交信号的话,就表明该探针中可能含有一个或多个基因。cDNA测序有助于在DNA片段中进行基因作图• Northern杂交和种属间印迹能够判断DNA片段中有无基因的存在,但却不能给出基因在DNA序列上的定位信息。获得定位信息最容易的方法是对相关cDNA进行测序。• 将cDNA序列与相关基因组DNA序列进行比较,可以描述相关基因的位置并找到外显子-内含子边界。cDNA测序作为基因定位方法的成功率取决于两个因素:(1)所研究的cDNA在文库中出现的频率。如果表达丰度很低,就很难从cDNA文库中筛选到所需要的基因。(2)单个cDNA分子的完整性。如果反转录不完全,会形成截短的cDNA。截短的cDNA可能缺少定位基因起点和终点及外显子-内含子边界所需要的一些信息。精确定位转录物末端的有效方法• 快速扩展cDNA末端(RapidamplificationofcDNAend,RACE)• 异源双链分析(Heteroduplexanalysis)准确定位外显子-内含子边界的方法• 异源双链分析(Heteroduplexanalysis)• 外显子捕获(exontrapping):需要一种特殊类型的包含一个小基因的载体,此小基因包含一个内含子和位于内含子两侧的两个外显子,第一个外显子前还要有起始转录所需要的序列信息(启动子序列)。2.确定单个基因的功能• 一旦一个新基因在基因组序列中获得定位,就要探索它的功能问题。• 这是基因组研究的重点所在,因为已完成的测序计划表明我们对基因组内容的了解要比想象的贫乏的多。• 像定位基因一样,也尝试着用计算机分析和实验研究来确定未知基因的功能。2.1基因功能的计算机分析A.同源性反映出进化关系• 同源基因具有共同的进化祖先,是通过基因间的序列相似性而发现的。• 同源基因分为两类:(1)直系同源基因(orthologousgene):指不同物种生物体间存在的同源基因,它们的共同祖先早于物种间的分裂。同源基因通常具有相同或类似的功能。如人类和黑猩猩的肌红蛋白基因是同源基因。(2)旁系同源基因(paralogousgene):指存在于相同生物体中的同源物,常是可识别的多基因家族的成员,它们的共同祖先可能早于或晚于物种间的分裂。• 由于进化过程中发生突变,同源基因间具有不完全相同的核苷酸序列。• 由于突变起始于相同的起始序列,因此序列又具有相似性。同源分析可以提供整个基因或基因片段的功能信息• 可以用DNA序列进行同源性搜索,但一般将假定基因的序列转换为氨基酸序列后再进行同源性搜索,就不太可能得到假结果。• 同源性搜索程序是通过将查询序列和数据库序列之间进行比较而开始的。对于每个比较而言,都可以算出一个得分,根据得分可以估量查询序列和数据库序列同源的可能性。当在氨基酸水平进行比较时,两个序列之间缺少同源性就更明显产生得分的两种方法:• 计算氨基酸在两条序列中都存在的位点数。这个数值被转化后就可以给出两条序列间的相似程度。• 运用不同氨基酸之间的化学相关性为比对中的每个位点进行评分,相同或相近的氨基酸分数就高(如亮氨酸-异亮氨酸,天冬氨酸-天冬酰胺),不相关的氨基酸分数就低(半胱氨酸-酪氨酸,苯丙氨酸-丝氨酸)。• Identities(低一些);Positives(高一些)利用同源性搜索来鉴定基因功能有如下局限性:• 如果数据库中描述的基因的功能不正确,就会传递到新序列上。• 同源基因可能具有不同的生物学功能。例如一些眼晶状体的晶体蛋白和代谢酶同源。• 有些蛋白虽然具有相似的功能,但序列相似性不高,只是拥有某些共同的结构域。结构域在决定基因功能方面起到了关键作用。2.2用实验分析阐明基因功能• 很明显,同源分析并不是确定所有新基因功能的万能药,需要通过实验的方法来验证和扩展同源性研究的结果。• 常规的从表型到基因的方法属于正向遗传学的范畴,而这里是在发现了新基因的基础上去研究其功能,属于反向遗传学的范畴。通过基因失活进行功能分析• 通过将待研究基因突变掉,观察基因突变后引起的表型改变,这是大多数用于确定未知基因功能的技术基础。a.同源重组可以使单个基因失活• DNA重组:是指由于不同DNA链的断裂和连接而产生的DNA片段的交换和重新组合,形成新的DNA分子的过程。• 同源重组:两个具有相似序列的DNA分子同源区段间的相互交换。• 基因失活的第二个例子使用相似的方法,但使用小鼠而不是酵母。• 小鼠基因组中含有许多与人类相似的基因,可作为人类基因功能研究的模式生物。• 一个存在问题是:我们不想只得到一个突变的细胞,而想得到整个突变小鼠,这样才能充分评价基因失活对表型的影响。• 因此,必须使用一类特殊类型的小鼠细胞:胚胎干细胞(ES细胞),它是全能细胞。• 制备基因敲除小鼠的过程如下:将已经用基因工程处理过的ES细胞注射到小鼠子宫中,小鼠胚胎会发育形成一个嵌合体。嵌合体小鼠的细胞由来自ES细胞突变体和胚胎其它细胞的非突变体混合组成。• 嵌合体小鼠间进行交配,两个突变配子的融合就会产生纯合型的基因敲除小鼠。b.利用插入突变进行基因失活入突变是将外源的已知插入元件随机插入植物基因组中,引起插入位点基因的变化,影响其正常表达,进而引起植株在表型上的变化,产生插入突变体,并以此插入元件为标记来分离和克隆因插入而失活的基因,对该基因进行反向和正向遗传学研究。• 目前常用的插入元件有转座子或逆转录转座子、T-DNA等。• (1)转座子标记技术:通过向基因中插入转座元件或转座子使基因功能失活。• 正常情况下,转座是小概率事件,但运用DNA重组技术修饰转座子,可使其对外界刺激产生反应而发生转座,如酵母转座子Ty1。人工诱导转座当半乳糖缺乏时,Ty1元件不被转录而保持沉默;当细胞被转到含有半乳糖的培养基上时,启动子被激活,Ty1元件被转录,从而开始转座过程。• (2)T-DNA插入技术:通过农杆菌介导的T-DNA插入使基因功能失活。• 近年来,随着农杆菌介导的遗传转化技术的不断完善,T-DNA插入已成为构建插入突变体库的主要方法。• T-DNA是根癌农杆菌Ti质粒上的一段DNA序列,它能稳定地整合到植物基因组中并稳定地表达。• T-DNA在植物中一般都以低拷贝插入,多为单拷贝。单拷贝T-DNA一旦整合到植物基因组中,就会表现出孟德尔遗传特性,在后代中长期稳定表达,且插入后不再移动,便于保存• 早期研究认为,T-DNA在基因组中的整合是一个随机过程,没有明显的偏爱性。但近年来有研究表明,T-DNA往往偏向于整合在染色体中基因丰富、转录活性高的区域,以及基因的非翻译区及启动子区,在重复区插入频率较低,在基因类型上没有偏向性。• 由于插入的T-DNA序列是已知的,因此可以利用质粒挽救法、反向PCR、TAIL-PCR、加接头的PCR步移法对插入片段侧翼的基因组序列进行克隆和分析,并对比突变的表型研究基因的功能。I.质粒挽救法:是在载体上T-DNA左、右边界内加入大肠杆菌复制起始点和相应的选择标记基因,通过限制性内切酶进行酶切,将酶切片段自连成环状DNA分子,然后将连接产物转化大肠杆菌,从而使目的片段通过大肠杆菌复制起始位点在大肠杆菌中进行复制,分离得到的质粒上含有T-DNA插入位点的侧翼序列。II.反向PCR法:用限制性内切酶对突变体基因组DNA进行酶切,酶切产物用琼脂糖凝胶分离,然后用T-DNA片段为探针进行杂交,将有杂交信号的酶切片段进行自连,然后利用特异引物对环形DNA分子进行PCR扩增。反向PCR的关键是选取合适的限制性内切酶。III.热不对称交错PCR法(TAIL-PCR):通过3个嵌套的特异性引物(SP1,SP2,SP3,约20bp)分别和1个具有低Tm值的短的随机简并引物(AD,约14bp)组合进行连续的PCR扩增,利用不对称的温度循环选择性地扩增目标片段,所获得的片段可以直接用做探针和测序模板。IV.加接头的PCR步移法:是将一段已知序列的接头连接到含有插入片段侧翼序列的限制性片段两端,然后根据两侧的已知序列和插入T-DNA序列来设计引物,从而扩增到T-DNA侧翼的未知序列。接头的两条互补链长短不等,其长链具有与接头引物相同的连续序列,而短链的3’-端缺乏接头引物的结合位点,因此接头引物结合位点只能通过T-DNA特异性引物延伸出来的接头长链互补链而产生。插入突变技术的缺点是它很难瞄准单个基因,因为一般情况下插入元件的插入是一种随机事件,就很难预测它会在哪里定位。• 如果目的是失活一个特定基因,那就必须诱导大量的插入突变体,并进行筛选和分析,以发现目标基因被转座子或T-DNA插入的个体。• 因此,插入突变技术更适用于整体研究基因组的功能,通过检查感兴趣的表型变化的后代来鉴别出具有相似功能的各类基因。c.定向的基因沉默方法• (1)RNA干扰(RNAi):利用双链小RNA高效、特异性降解细胞内同源RNA,从而阻断靶基因表达,使细胞出现靶基因缺失的表型。为真核细胞植入一段双链RNA后,细胞质内的Dicer酶(一种RNaseIIInuclease)会识别该外来基因,并将其切断成短链小干扰RNA(siRNA)。恰巧,真核细胞内又存在一组RNA诱导的沉默复合体蛋白(RISC),它能够找到siRNA,并把它解旋为一条自由的ssRNA(singlestrandedRNA)和一条绑在RISC上的ssRNA。基于碱基互补配对原则,被绑在RISC上的那条ssRNA可以从细胞质中存在的自然RNA中选出互配的mRNA序列,并引导RISC将其切断,从而抑制该mRNA的翻译过程。• (2)病毒诱导的基因沉默系统(virus-inducedgenesilencing,VIGS):指携带植物功能基因cDNA的病毒,在侵染植物体后可诱导植物发生基因沉默而出现表型变异,从而可以通过植物表型或生理指标上的变化反映该基因的功能。• 目前已有多种病毒载体在VIGS上成功应用,如烟草花叶病毒、马铃薯X病毒、番茄金色花叶病毒、烟草脆裂病毒、卫星病毒诱导的沉默系统、大麦条状花叶病毒、甘蓝缩叶病毒等• 每种病毒载体都存在一定的宿主范围,诱导沉默效果也不同。• 其作用机制为:含有目的基因片段的病毒载体在被侵染的植物组织中大量复制,病毒载体中的目的基因片段在RNA引导的RNA聚合酶(RdRP)作用下合成大量的双链RNA(dsRNA)。• dsRNA在Dicer酶作用下产生21~25个核苷酸的短干扰RNA(siRNA)。• siRNA的反义链与RNA诱导的基因沉默复合物(RISC)结合,特异性识别细胞质中的目的基因的单链mRNA,造成目的基因mRNA特异性降解,从而导致目的基因在RNA水平上的沉默。VIGS的优点:• VIGS克服了传统遗传转化方法所带来的诸多困难,能够鉴别当代植株特定基因功能缺失的表现型,直接靶定受关注的基因,使得具有特别意义的基因能够快速通过VIGS技术分析功• 利用包含多基因序列的病毒载体,使几个基因同时发生沉默成为可能。• VIGS技术还克服了基因家族功能冗余的问题,通过利用来自基因家族高度保守区域的目标序列,可以来沉默特定家族的全部或部分成员。VIGS的局限性:• 虽然VIGS的优势显而易见,但其作为功能验证一个重要手段的同时,也存在着固有的局限性:• 首先,针对不同的寄主植物需要选择不同类型的病毒载体。• 其次,用病毒接种植物能改变植物的生长发育状态,尤其会影响植株高度和叶片形态。• 再次,VIGS很少使目标基因表达完全抑制,导致其所表现出的表型特征可能不是很明显• VIGS还可能不小心抑制非目标基因功能,这个可能性对于一个未进行基因测序的植物品种是很难排除的。• 最后,VIGS不能诱使整个侵染植株的基因一致沉默,而且不同植株间基因的沉默水平也可能发生变化,这使得要清楚地阐明结果就变得更加复杂。2.2用实验分析阐明基因功能B.基因过表达也可以用来探索功能• 通过基因过表达进行功能分析:通过使生物体中被检测基因的活性比正常情况更高时检测表型的改变。• 过表达一个基因,必须使用一种特殊类型的载体,载体必须含有高活性启动子,以便使每个拷贝的待测基因能被转变成大量mRNA,从而确保合成尽可能的蛋白质。C.基因失活或过表达对表型的影响可能很难辨别• 基因失活或过表达实验的关键之处是需要鉴别表型改变。• 对于任何生物体,必须检查的表型范围是很广的,很难全面评价。• 即使进行最认真的筛选时,许多基因失活引起的表型变化可能也辨别不出。• 对于秀丽隐杆线虫来说,大规模的基因失活计划到目前为止只在不到10%的预测基因中发现到表型变化。2.3未知基因编码蛋白质活性的详细研究基因失活和过表达是基因组研究人员探索新基因功能的基本技术,但并不是能提供基因活性信息的唯一方法。定点诱变可以用来详细探索基因的功能• 定点诱变:为了改变蛋白质的结构和可能的活性,在基因序列中产生精确突变的方法。(1)寡聚核苷酸定点诱变;(2)PCR方法。• 诱变后,必须将突变基因导入宿主细胞中,以便用同源重组的方法将原有的基因替换掉。• 通常是在突变基因旁设计一个标记基因来寻找发生了同源重组的细胞。• 但有可能是标记基因而不是突变基因导致了表型的改变。• 为解决这一问题,设计了一种两步基因替换法。报告基因和免疫细胞化学可以用来定位基因的时空表达• 基因功能的线索通常可以通过研究基因的时空表达来获得。• 运用报告基因,可以确定生物体内的待测基因表达模式,这可以通过用报告基因的ORF代替待测基因的ORF,而其他调控基因不变来实现。• 表达报告基因的细胞会变蓝、发荧光或释放其它可见信号。常用的报告基因:β-半乳糖苷酶、β-葡糖苷酸酶、荧光素

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论