版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Chapter 1: Genomes, Transcriptomes andProteomes1.概述基因组(Genome :指生物的整套染色体所含有的全部 DN颂RNA序列。基因 组是地球上每一物种具有的生物学信息的存储库。基因组学(Genomics):指研究生物的整个基因组,涉及基因组作图、测序和 功能分析的一门学科。基因组所包含的生物信息的利用需要酶及其他参与基因组表达过程中一系列复杂生化反应的蛋白质的协同活性。基因组表达的最初产物是 转录组,即那些含有细胞在特定时间所需生物信息、编码蛋白质的基因衍生而来的 RN的子的集合。转录组由转录过程来维持。基因组表达的第二个产物是 蛋白质组,即细
2、胞中那些决定细胞能够进行生 化反应的所有蛋白质组分。这是通过翻译过程来完成的。Genes are made of DNA奥地利神父孟德尔1865年根据7个碗豆性状的实验提出了遗传因子假说认为每个性状由遗传因子控制 ,并提出了遗传因子的分离与 自由组合两大遗传 规律。证明基因由核酸(DNA或RNA)组成的3个著名实验:肺炎双球菌的转化试验;DNA1遗传物质噬菌体感染实验;只有DNA1联系亲代和子代的物质烟草花叶病毒的感染实验。RNAt是遗传物质The structure of DNANucleotides and polynucleotidesThe model of double helixD
3、NA晶体X射线衍射图谱刻揭示DNA分子的二级结构提供了重要实验 证据Watson and Crick (1953) 提出的DNA螺旋结构模型:?DN的子通常以右手双螺旋形式存在,两条核甘酸链反向平行,且互为互补链。我糖-磷酸骨架在分子的外侧,在分子表面形成大沟和小沟,碱基堆积于螺旋内部。碱基间通过氢键相互连接,A和T以2个氢键配对,G和C以3个氢键配对。”嫖旋中相邻碱基间相隔0.34nm ,每10个碱基对螺 旋上升一圈,螺距为3.4nm ,直径为 2.37 nm。DNA双螺旋结构的稳定力:?碱基间形成的氢键/ ?才目邻碱基间的疏水堆积力/ ?碱基相互作用的范德华力 尽管氢键使得双链中的碱基间的
4、配对具有特异性 (只有互补的两条链之间才能形成DN做链),但其对于双螺旋的总体上的稳 定性并无太大贡献。核酸分子的稳定性的根源在于碱基对之间的疏水堆积力。作为芳香族化合物,1 碱基的平面使其不能在自由溶液中与水分子形成氢键 ,即它们是疏水的。疏水 效应使双链DNA成为能量上最为稳定的结构。尽管这种堆积作用在RNA中也存 在,但其在双链DNA中达到了最大化。DNA双螺旋结构的类型:三种形态的 DNA : A-DNA, B-DNA, Z-DNA两类:右手螺旋和左手螺旋RNA and the Transcriptome?基因组表达的最初产物是转录组,即那些含有细胞在特定时间所需生物信息编码蛋白质的基
5、因衍生而来的 RNA子的集合。?转录组中的RN砌子以及其他来自非编码基因的 RNA由转录过程产生。稳定性差2. ?主要以单链形式存在细胞内的 RNAfi分(mRNA/rRNA / tRNA)核小RNA(SnRNA):发现于真核生物细胞核中 ,与前体mRN鹤接成成熟 mRNA勺过程相关。核仁小RNA(snoRNA :发现于真核细胞核的核仁区,在 rRNA分子的加工 过程中起到核心作用(比如在某个核甘酸位点上加上一个甲基)。微小RNA(miRNA和短干扰RNA(siRNA):是调控个别基因表达的小 RNA。Processing of precursor RNA末端修饰/ 剪接/剪切/化学修饰化学修
6、饰在rRNA tRNA和mRNAt者B存在;其中, mRNA的化学修饰称作 RNA 编辑。The transcriptome转录组虽然不到细胞总RNA的4% ,却是细胞中最重要的组分,因为它包 含了基因组表达的下一个阶段中所要使用的编码RNA。转录组从不从头合成(denovo), 一个细胞通过细胞分裂诞生时就接收了其 上一代的部分转录组,并维持一生。各蛋白质编码基因的转录过程并不是导致转录组的合成,而是通过替换被降解的mRN林维持转录组,并通过开闭不同的基因的表达来改变转录组的组 成。转录组研究的方法A.通过序列分析研究转录组RNA-seq研究转录组最直接的方法是将其中的 mRNA; cDNA
7、,并对所有cDNA克隆进 行测序,再与基因组序列进行比较分析。这可以借助第二、三代测序技术进行。2)基因表达系列分析(Serial analysis of gene expression, SAGE )SAG豉术不是研究完整的cDNA,它产生长度12bp的短序列,每一条都代 表了转录组中存在的一种mRNA技术基础:412=16,777,216 bp,真核 mRNAR1 1500 bp , 412相当于 11,000个转录物,这比最复杂的转录组中存在转录物数目还多,因此12bp序列能够代表某一种mRNASAGE切下来的片段被收集起来,头尾相连以产生一个串联体,进行测序分析。串联体中的各个标签序列
8、信息被读取并与基因组中的基因序列比对,从而可以分析哪些基因被转录,表达水平如何。B.通过微阵列或芯片分析来研究转录组构成转录组的mRNA总体被反转录成一个cDNA的混合物,然后被标记,用 于和芯片或微阵列杂交。优点:可用于快速评估两个或多个转录组间的差异。用不同的荧光来标记cDNA羊品,微阵列与两个样品同时杂交,可以减少由于试 验误差引起的差异。Proteins and the Proteome基因组表达的第二个产物是蛋白质组 ,即细胞中那些决定细胞能够进行生 化反应的所有蛋白质组分。这些蛋白质是通过翻译那些组成转录组的 mRN给子而合成的。Protein structure蛋白质和DNA子一
9、样,是一个线性的无分支的多聚体。蛋白质中的单体亚单位称为氨基酸。氨基酸形成的多聚体或多肽在长度上很少超过2000个单位。primary structure氨基酸通过肽键连接成一条多肽链。secondary structure指多肽采取的不同构象,由不同氨基酸之间形成的氢键所稳定。a螺旋;B片层tertiary structure是将多肽链的二级结构组分折叠成为三维构型而形成的。它被各种化学力所稳定:氨基酸残基间的氢键;带电荷的氨基酸R基团间的静电相互作用;疏水相互作用;半胱氨酸残基间的二硫键quaternary structure两条或更多已形成三级结构的多肽链组合在一起形成一个多亚基蛋白质。
10、不是所有蛋白质都有四级结构;稳定力包括:二硫键(稳定);氢键,疏水作用(松散)X射线晶体学;核磁共振波谱学;三维电镜重构B.蛋白质的多样性取决于氨基酸的多样性组成蛋白质的氨基酸在化学性质上有多样性,因此蛋白质的功能也是多种多样的。氨基酸的多样性源于R基团。非极性(疏水)极性(亲水)带负电荷带正电荷The proteome蛋白质组包括了在特定时间存在于细胞中的所有蛋白质。A. The link between the transcriptome and the proteomeB.蛋白质组和细胞生化功能之间的联系基因组编码的生物学信息最终由蛋白质表现。蛋白质能够执行各种生物学功 能:生物催化作用
11、(酶);3结构(细胞骨架由蛋白质决定);运动(收缩蛋白);运输(血红蛋白运输血液中的氧);调节细胞进程(信号蛋白、活化调节因子);保护细胞个体(抗体);储藏功能(麦醇溶蛋白)。蛋白质组研究的方法A.蛋白谱(表达蛋白质组学)用来研究一个蛋白质组组成的特定技术。蛋白谱基于两项技术:蛋白电泳和质谱a.双向电泳:等电点等电点:蛋白质的净电荷为零时溶液的 PH值。b. MALDI-TOF (基质辅助激光解吸电离飞行时间质谱)?用于鉴定蛋白组中的蛋白质,最多可以分析出50个氨基酸长度的多肽,因 此一个蛋白质可以通过胰酶将其消化后进行测定。?一旦多肽片段被离子化,多肽的质量/电荷比就可以通过它在质谱仪中从电
12、 离源到检测器的“飞行时间”来确定。通过质荷比能够确认多肽片段的分子质 县 里 。?计算机中含有一个由所研究的物种基因组编码的每一个蛋白质经胰酶消化后各个片段的预计相对分子质量的数据库,计算机通过比较数据库与检测到的多 肽片段的分子质量来确认最可能的初始蛋白质。B.蛋白质印迹法(Western杂交)Western杂交是将蛋白质电泳、印迹、免疫测定融为一体的特异性蛋白质的检测方法。其原理是:生物中含有一定量的目标蛋白。先从生物细胞中提取总蛋白或目标蛋白,将蛋白质样品溶解于含有去污剂和还原剂的溶液中,经SDSfe泳将蛋白质按分子量 大小分离,再把分离的各蛋白质条带原位转移到固相膜(硝酸纤维素膜或尼
13、龙膜)上。然后加入特异性抗体(一抗),膜上的 目的蛋白(抗原) 与一抗结合后,再加入能与一抗专一性结合的带标记 的二抗(通 常一抗用兔来源的抗体时,二抗常用羊抗兔免疫球蛋白抗体),最后通过二抗上 带标记化合物(一般为辣根过氧化物酶或碱性磷酸酶 ,或用同位素或生物素标 记)的特异性反应进行检测。根据检测结果,从而可得知被检生物细胞内目的蛋白的表达与否、表达量及分子量等情况。C.鉴定与某一蛋白质相互作用的蛋白质通过鉴定有相互作用的成对或成组的蛋白质能够获得基因组活性相关的 重要数据。构建 蛋白质相互作用图谱 被视为是连接 蛋白质组学与细胞生物化学过程 的一个重要步骤。a.噬菌体展示该技术采用了一种
14、基于 入噬菌体或某种丝状噬菌体的独特的克隆载体。待测基因被插入载体后,它的蛋白质产物能与噬菌体外壳蛋白以融合形式 表达。使用噬菌体展示库来寻找与待测蛋白质相互作用的蛋白质的噬菌体。b.酵母双杂交激活因子(转录因子):一类控制基因表达的蛋白质,包含 DN阂合结构域 和转录激活结构域。双杂交系统使用缺乏某一报告基因相应激活因子的酿酒酵母菌株,此时报告基因是不表达的。D.蛋白质相互作用图谱也叫蛋白质相互作用网络,能展现一个蛋白质组中各成员间发生的相互作 用。Chapter 2 Studying DNA.概述DNA组技术:借助工具酶按预定的方式操作 DN砌子,将DN协子切成小片段, 并重新将它们连接在
15、一起,形成自然界不存在的组合体。聚合酶链式反应(PCRDNA聚合酶/核酸酶、连接酶、末端修饰酶以现有DNAt RNA子为模板合成DNA勺酶,称为(依赖模板的)DNA5合A.依赖模板的DNA合酶的工作模式按照碱基互补配对的原则,从5 一3方向合成,需要寡聚核甘酸作为引DNAK合酶I (Kornberg聚合酶)聚合酶功能、3 - 5外切核酸酶活性、5 -3外切核酸酶活性Klenow聚合酶用枯草杆菌蛋白酶处理DNA聚合酶I ,可获得两个片段,大片段的分子质 量约76 kDa ,保留聚合酶活性和 3 - 5外切核酸酶活性,又叫 Klenow片 段。小片段的分子质量约34 kDa ,具有5 -3外切核酸
16、酶活性。DNA#外标记的方法A.缺口平移法(Nick translation)( DNA聚合酶 I )利用Poly I在双链DNA勺缺口处进行离体合成。断裂双链内部的一个磷酸二酯键,Poly I从缺口处的3 -OH开始新链合成。同时原有的同源链被排开,被5 -3外切酶作用降解,缺口的 位置沿双链 移动。缺口转移是DNA#外放射性标记的重要技术。端标记法 (Klenow片段 )C.随机引物法 (Klenow片段)核酸酶:外切核酸酶和 内切核酸酶A.限制性内切核酸酶在特定的位置切割 DN吩子按限制性内切酶的组成、是否具有修饰酶活性以及切断核酸的情况不同,限制酶可分为三类:I型,II型和III型。I
17、和III型限制性内切酶既能催化宿主 DNA勺甲化,又催化非甲某化的 DNA 的降解,但切割位置不固定。II型限制性内切酶只催化非甲基化的 DNA勺降解 (无修饰酶活性),且具有 识别位点的专一性和切割位点的专一性,一般在识别序列内切割,不需要 ATP 提供能量,是重组DNAK术中常用的限制性内切酶。细菌中三种不同类型的限制-修饰酶中三看不同集嬖的M制新埠1*226 bp1000 bp rrom RSB.检查限制性消化的结果在指明pH与温度下,在50 口反应体系中,1小时消化1窥的入DNA的酶量为1单位(1U)oSouthern 杂交DNA连接酶通过DN啦接酶可以将限制性内切核酸酶消化产生的 D
18、NAt段重新连接起来, 或者连接到一个新的分子上。T4 DNA连接酶:从T4噬菌体感染后的大肠杆菌细胞中提取。?粘性末端连接的高效率推动了将钝末端转变成粘性末端方法的发展。? 一种方法是将称为连接子(linker )或接头(adaptor )的小双链分子连接 到钝末端。?另一种方法是利加末端脱氧核糖核昔酸转移酶进行同聚物加尾,即在钝末端的3末尾一个接一个地添加核昔酸。末端修饰酶末端修饰酶:改变DN砌子末端,为连接实验的设计增加可操作空间。A.末端脱氧核糖核甘酸转移酶:属于模板非依赖的DNAIK合酶。B.碱性磷酸酶:去掉DNA分子5端磷酸基团,从而阻止这些分子连接到其他C. T4多聚核甘酸激酶:
19、向DNA子5端添加磷酸基团,主要用于 DNA子的 末端标记。DNA Cloning克隆载体及其使用方式质粒,噬菌体,人工染色体等它们都含有复制起始位点。A.以大肠杆菌质粒为基础的载体pUC系列(蓝白斑挑白色的)pUC8 2.7kb,除了起始位点外,还携带 氨苇青霉素抗性基 因(pUC8的选择性标记)和lacZ 基因(编码B-半乳糖甘酶的一部分)。 某些大肠杆菌菌株具有一个修饰的lacZ基因,该基因中缺失lacZ 部分。B.建立在大肠杆菌噬菌体基因组基础上的克隆载体最初尝试着发展能操作大片段 DN的子的载体集在入噬菌体上。入噬菌体存在两种感染周期: 裂解性感染周期/溶源性感染周期入噬菌体基因组大
20、小为48.5 kb ,其中有15 kb为随意区域,可以被删除而 不影响噬菌体感染细菌的能力。据此,目前发明了两种类型的载体:插入型载体:该载体中部分或全部随意 DNAt删除,并在删切后的基因组内部的 某些位点引入一个单一的限制性酶切位点。替代型载体:该载体中随意DN也于一填充片段内,两侧有一对限制性酶切位点, 当要克隆的DNA!接到该载体时,这个区段就被取代。入噬菌体基因组是一个线性分子,但其两个末端具有12个核甘酸的单链突出,称为串联体cos位点0cos位点序列与 入噬菌体的体外包装密切相关。C.用于更长DNAt段的载体.考斯质粒(cosmid)、黏粒具有 入cos位点的质粒,与 入噬菌体一
21、样具 有感染性。插入片段可高达44 kb.酵母人工染色体(YAC在YAC中,构成这些染色体组件的 DNA序列与一个或多个选择性标记物,至少 一个限制性酶切位点连接起来,酶切位点是为了插入新的DNA,可用来克隆600-1400 kb 的片段。一些类型的YAC载体有插入不稳定的问题,即克隆的DNA1排形成新的序列组合 c).细菌人工染色体(BAC是基于天然的大肠杆菌F质粒构建的;能够克隆300kb及更长的片段,并且插入的片段很稳定;可以通过Lac筛选来鉴定重组体,是目前克隆大片段 DNAI1常用的载体。. P1噬菌体载体与人载体相似,以天然噬菌体基因组的缺失形式为基础;P1 基因组比入基因组大,因
22、此能克隆的 DNA片段比入载体大;运用目前的技术可以克隆长达125kb的片段。. P1衍生的人工染色体(PAC综合了 P 1载体和B A C的特点,具有克隆长达300kb片段的容量。f). Fosmids包含F质粒的复制起始位点和 入载体的cos位点,有出现不稳定问题的 倾向。The Polymerase Chain Reaction (PCR)PCR是一种在体外借助于DN咪合酶实现特定基因或DNAff列扩增的方法。PCR基本原理参与PCRS应体系的因素? 模板核酸:基因组 DNA genomic DNA,gDNA,互补 DNA (complementary DNA, cDNA。?引物:16-
23、30 bp,四种碱基随机发布,G+C%=40-60%引物3端不能错配。? Taq DNA合酶:来自嗜热水生古细菌,耐高温,不具3 - 5外切酶活性。?缓冲液? Mg2+ :与Taq酶的活性有关。? dNTP (脱氧核糖核甘三磷酸)? PCR仪:自动升降温,程序化。? 30个循环后能将目标序列扩增10亿倍以上。PCR的局限性和应用?局限性:a.必需知道被扩增DNA勺边界序列才能PCR ,因此不能用来纯化从未被研究过 的基因片段。b.扩增片段的长度。一般扩增长达5 kb的片段不会有太大困难,但要扩增更长 片段存在麻烦。c.存在非特异性扩增的问题。主要是由于Taq酶 缺少3 -5外切酶的功能。?应用
24、:基于PCR勺分子标记;临床诊断;考古研究;基因表达分析(RT-PCR 实时定量PCR等。RT-PCR? 反转录PCR( RT-PCR是一种从RNAT增cDN阳贝的方法。? RT-PCR对于克隆mRNA勺5、3端序列和从非常少量的 mRN麻品构建大 容量的cDNW库以及测定基因表达的强度等方面都是极为灵敏和通用的方法。?常用的逆转录酶有两种:AMVt转录酶和MML地转录酶。两步法适用于mRNAfe达分析、效率高、使用 RandonO Oligo-dt引物制备cDNA 库、cDNAM以长期保存一部法适用于病毒、病原菌检测,操作简单、污染率低实时荧光定量 PCR (FQ-PCR)实时荧光定量 PC
25、RK术(real-time fluorescent quantitative PCRFQ-PCR 是一种在PC网应体系中加入荧光基团,利用荧光信号积累实时监测整个PCR8程,最后通过标准曲线对未知模板进行定量分析的方法,实现了PC网定性到定量的飞跃。简单的说,就是在PC林系中加入荧光,以便对反应体系和反应进程进行监 测,记录,分析。而PCF无非是在普通PCR勺基础上加上个荧光探头和相应 的数据处理软件而已。在实时荧光定量PCRK应中,随着PCRK应的进行,PCFT物不断累加,荧 光信号的强度也等比例增加,这样我们就可以通过荧光强度的变化来监测产物量的变化,从而得到一条荧光扩增曲线图。一般而言,
26、荧光扩增曲线可以分成三个阶段:荧光背景信号阶段,荧光信号 指数扩增阶段和平台期。在荧光背景信号阶段,扩增的荧光信号被荧光背景信号所掩盖, 我们无法判 断产物量的变化。而在平台期,扩增产物已不再呈指数级的增加,PCR的终产物 量与起始模板量之间没有线性关系,所以根据最终的PC蜻物量不能计算出起始DN刚贝数。只有在荧光信号指数扩增阶段,PCFT物量与起始模板量的对数值之间存在 线性关系,我们可以选择 在这个阶段进行定量分析。为了定量和比较的方便,在实时荧光定量PC叱术中引入了两个非常重要的 概念:荧光阈值和CT值。荧光阈值是在荧光扩增曲线上人为设定的一个值,它可以设定在荧光信号指 数扩增阶段任意位
27、置上, 但一般荧光域值的缺省设置是 3-15个循环的荧光信 号的标准偏差(sd)的10倍。CT值:每个反应管内的荧光信号到达设定的阈值(荧光阈值)时所经历的循环数被称为C T值(threshold value )。CT值与起始模板的关系研究表明,每个模板的CT值与该模板的起始拷贝数 的对数存在线性关系,起始拷贝数越多,CT值越小。利用已知起始拷贝数的标 准品可作出标准曲线。?因此,只要获得未知样品的CT值,即可从标准曲线上计算出该样品的起始拷 贝数。FQ-PCR的化学原理?实时荧光定量PCR的化学原理包括探针类和非探针类两种。?探针类是利用与靶序列特异杂交的探针来指示扩增产物的增加;非探针类则
28、是利用荧光染料或者特殊设计的引物来指示扩增产物的增加。?前者由于增加了探针的识别步骤,特异性更高,但后者则简便易行 。分子信标SYBR Green I是一种结合于小沟中的双链 DNA结合染料。由于SYBRGreen I能与所有的双链DNAf结合,不必因为模板不同而特别定制, 因此设计的程序通用性好,且价格相对较低。TaqMa咻针是一种寡核甘酸探针,它的荧光与目标序列的扩增相关。?分子信标是一种在靶DNA存在时会形成茎环结构的双标记寡核甘酸探针。?在此发夹结构中,位于分子一端的荧光基团与分子另一端的淬灭基团紧紧靠近。在此结构中,荧光基团被激发后不是产生光子,而是将能量传递给淬灭剂,这一过程称为荧
29、光谐振能量传递(FRET。由于淬灭剂的存在,由荧光基团产生的能量以红外而不是可见光形式释放出来。?分子信标的茎环结构中,环一般为 15-30个核甘酸长,并与目标序列互补; 茎一般5-7个核甘酸长,并相互配对形成茎的结构。荧光基团连接在茎臂的一 端,而淬灭剂则连接于另一端。?分子信标必须非常仔细的设计,以致于在复性温度下,模板不存在时形成茎 环结构,模板存在时则与模板配对。?与模板配对后,分子信标的构象改变使得荧光基团与淬灭剂分开。此时荧光10基团被激发,发出自身波长的光子。反向 PCR (inverse PCR )反向PCRg对已知DNA片段两侧的未知序列进行扩增和研究的一种简捷方法。其原理是
30、:用限制性内切酶A消化DNAt段,然后用连接酶将酶切产物连接成环状,再用已知序列上两端相反方向的引物进行 PCFT增。A和B分别为限制性内切 酶及其酶切位点;P1和P2分别为引物;黑色区 域为 已知序列;空白区域为未知序列11Chapter 3 Mapping Genomes1.概述?测序工作中有一个局限性:在一个测序反应中一般只能测出 1 kb左右的准确 序列。这就意味着长的DN肪子必须由一系列短的序列拼接而成, 即需将大分子 分解为片段,测出每一段的序列,再用计算机寻找重叠的部分,从而拼接成长的 序列鸟枪法 (shotgun )。?这种鸟枪法是小的原核生物测序的标准方法,但是对于较大的真核
31、生物基因组 来说是相当困难的,特别是当分析基因组的重复区域时会发生错误。鸟枪法中遇到的问题一1、串联重复DNA丢失2、基因组范围内的重复,错误拼接?因此,必须首先建立一个基因组的图谱,通过标明基因或其他显著特征的位 置,为测序提供指导。? 一旦得到了基因组图谱,基因组计划中的测序阶段可以采用下面两种方法之一 进行:(1)全基因组鸟枪法 (whole-genome shotgun ):使用基因组图谱上的显著特征 为界标,指引着将用鸟枪法获得的大量短序列拼接成主序列。(2)克隆重叠群法 (clone contig ):将基因组打断成长度为数百 kb或数个Mb 的大片段,将这些大片段定位到基因组图谱
32、上并拼接成重叠群,利用鸟枪法对大片段分别测序后再进行拼接。2.遗传图谱和物理图谱遗传图谱:指应用遗传学技术(遗传重组)构建的能在基因组上显示基因和其它序列特征位置的线性排列图,反映了基因或标记间的相对距离和顺序。cM物理图谱:指应用分子生物学技术直接分析 DN的子,从而构建的能显示包括基 因在内的序列特征位置的图谱,它反映了基因或标记间的实际距离。Bp, kb, Mb基因是首先被利用的标记?最初的遗传图谱是在20世纪初针对果蝇等生物使用基因作为标记构建的。? 一个基因必须以指定一个表型的两种替换形式存在或以等位基因形式存在,才能用于遗传学分析。比如豌豆茎的高与矮,果蝇眼睛颜色的红与白等。用于遗
33、传学作图的遗传标记遗传标记:可以示踪染色体、染色体某一片段、某个基因座在家系中传递的任何一种遗传特征。?形态标记?细胞学标记?生化标记? DNA分子标记所有的标记都必须具有多态性!DN吩子标记:简称分子标记指在 DNAK平,具有相对差异的等位基因的 DNAI;12态性标记是DNRK平上遗传变异的直接反映。RFLP/SSR/SNP 优点:1、不受时间和环境的限制2、遍布整个基因组,数量无限3、不影响性状表达4、 变异丰富,多态性好5、大部分为共显性,能鉴别纯合体和杂合体限制性片段长度多态性(restriction fragment length polymorphism , RFLP 用限制性内
34、切酶酶切基因组 DNA时,在同一种生物的不同个体间出现含同源序 列的酶切片段长度的差异。Southern /CAPS简单重复序列 Simple sequence repeat, SSR, Microsatellite ( 微卫星) 指重复单位相对较小(2-6bp的基序),由于重复单位数目的变化而形成的多态 性。SSR的检测方法:1、PCR斗板PAGEfe泳2、PCR毛细管电泳(引物需要荧光标 记可获得片段的准确长度)C.单核甘酸多态性 (Simple nucleotide polymorphism, SNP基因组中的某些 位点上,有些个体只有一个核甘酸与其它个体不同, 这种分散在基因组中的单个
35、 碱基的差异就称为SNP绝大多数SN%双等位基因; 有的能形成RFLP绝大多数不能。a.通过寡核甘酸杂交分析检测SNP寡核甘酸是在试管中合成的长度小于 50 bp的DNA分子,寡核甘酸只有与待测 DNAS高严谨杂交条件下,分子形成完全的碱基配对时,二者才能杂交;如果有 一个碱基错配,杂交体会非常不稳定,不能形成杂交信号。(1) DNAK片技术:应用面积为2cn2或更小的玻璃或硅质晶片,在上面高密度的 排列着许多寡核甘酸,待测DNAW荧光标记后与芯片杂交,再用荧光显微镜检测, 发出荧光的表明寡核甘酸与待测 DN躲交上了。此方法在一次实验中可以检测许多个 SNP(2)液相杂交技术:在微量滴分子信标
36、定板的孔中进行,每个孔中含有一种不同 的寡核甘酸;寡核甘酸的一端与荧光染料连接,另一端与荧光淬灭复合物连接, 且其两个末端可以形成碱基配对;当淬灭复合物与荧光染料相邻时,无荧光发出; 如果寡核甘酸与待测DNAfg够杂交,则会破坏环形结构,此时淬灭复合物远离荧 光染料,有荧光发出。b.通过耐扩增突变系统检测 SNPAmplification Refractory Mutation System, ARMS将SNPKL点弓I入PCR弓I物3端的最后一个碱基,直接进行PCRT增。在 严谨的PC舔件下,存在SNP的引物对不能扩增出目的条带。4.物理作图遗传图谱的局限性:.遗传图谱的分辨率依赖于所得到的
37、交换数目;.遗传图谱的准确率有限13物理作图的常用方法:1)限制性作图:在DN吩子上定位限制性内切酶酶切位点的相对位置;2)荧光原位杂交(FISH):将分子标记与完整染色体杂交来确定标记的位置;3)序列标签位点(STS作图:通过对批量的基因组片段进行 PC济口(或)杂交 分析,来对短序列进行定位作图。限制性作图(Restriction mapping )A.限制性作图的基本方法双酶解(double digest ) Key :分析重叠片段2)部分酶解+完全酶解:比较分析这两种情况下的片段大小。3)末端标记+部分酶解a)利用放射性的同位素标记DNA勺3端或5端b)部分酶解c)放射自显影多克隆位点
38、(multiple cloning sites, MCS):指多个限制性内切酶的单一切点 簇,由许多限制酶切位点组成。MCSffi往是人工合成的一段外源基因的插入部位 的DNAff列。B.限制性作图的规模受限于限制性片段的大小?如果使用的限制酶在DNA切点相对较少,构建限制性图谱就比较容易。? 限制性作图更适用于小分子。如果DNA子小于50kb ,通常选用6碱基识 别序列的限制性酶来构建限制图谱。?对于大于50 kb的DN的子,可以选用“稀有酶”进行构建。 稀有酶:(1)选用识别序列为7或8碱基的限制性内切酶进行切割。如:SapI (7) ; Sgf I (8)。(2)选用识别序列所含基序在靶
39、DNA分子中稀少的酶。如人类基因组中,5 -CG-3序列就比较稀少,如果选用Not I (5 -GCGGCCGC-)进行消化,平均约10 Mb才有一个切点。可用该技术构建原核生物和低等真核生物(酵母和真菌)等染色体较小的生 物的限制图谱。限制性作图不能用于大型基因组。如果用普通琼脂糖凝胶电泳来分离大片段 DN吩子,电泳分辨率会大大降低。 交变脉冲场凝胶电泳 (PFGE: 1984年,Schwartz和Centor发明;这项技术采 用定时改变电场方向的交变电源,每次电流方向改变后持续1s到5min左右,然 后再改变电流方向,反复循环,所以称之为脉冲式交变电场。?正交变电场凝胶电泳(OFAGE两对
40、电极间的电场可以改变, 每对电极与凝胶 长度方向成45度角;电场的每次改变都迫使 DNA子重新排列,从而提高分辨 率?电场转换凝胶电泳(FIGE)?等高加压均匀电场(CHEF4.2 荧光原位杂交(FISH)A.用荧光探针进行原位杂交原位杂交是以标记的DN6子为探针,检测完整染色体的一种杂交分析方法。?用于原位杂交的探针的标记要同时满足 高灵敏度和高分辨率 两个条件,非放 射性的DN砍光标记技术能满足这一要求。?现已设计出具有不同发光特性的荧光标记物,可以将一组不同的探针与单个14 染色体杂交,并分辨出每种杂交信号,从而检测出各探针的相对位置。?在过去,探针必须是相当长的DNA勺分子,通常至少是
41、40kb的克隆片段;随 着荧光信号放大技术的应用,现在最小可以检测500bp的DNAt段。一种封闭探针重复序列的方法:如果探针中含有一些重复序列,它可能会和染色 体上的多个位点发生非特异性杂交;因此,探针在使用前要和来自被研究组织中 的未标记DNA昆合;用于混合的未标记DNMTO是总的这时探针只与特异序列发 生杂交核DNA,但最好是富含重复序列的 DNAt段。B. FISH应用的局限性? 中期染色体是高度凝聚的,每条染色体都具有可识别的形态。?使用中期染色体的缺点在于,由于它的高度浓缩的性质,只能进行低分辨率作图,两个标记间至少相隔1 Mb才能分辨出来。? 因此,中期染色体FISH主要用于确定
42、新标记在染色体上的大概位置,为更 精细的作图做准备。?操作较繁琐,数据积累速度太慢。更精细作图的两种途径:?机械伸展的染色体:通过离心产生的剪切力可将染色体伸展到正常长度的20倍,这样分辨率可明显提高,能够区分出相隔 200-300 kb的标记。?非中期染色体:相比之下,分裂间期的染色体更为有用,因为此时的染色体包装程度最低,分辨率有可能达到 25kb以下。但染色体形态特征消失,失去了定位探针位置所必需的外部参照位点。 因此,一般在获得粗略图谱后,用该技术 来确定染色体一小段区域内一系列标记间的顺序。4.3 序列标签位点作图 (STS作图)?用STS技术绘制物理图是到目前为止最为有效的方法。?
43、 STS其实只是基因组中任何单拷贝的短 DNAff歹I,长度在100-500bp,但要 求序列已知且在染色体上有唯一的定位。?要得到至少5套包含相关染色体或整个基因组的 DNA片段(染色体上每一 点平均有5个片段相对应),然后用各个DNAt段做模板,用不同STS标签上的 序列做引物进行PCRT增,筛选阳性克隆。?如果某两个STS标签在基因组上靠的很近,它们同时出现在一个 DN秋片段上 的概率就会很大,反之就会很小。因此,可以根据两个STS的分离频率来计算它 们间的图距。?只要有一定数量的STS标签,所有DN从片段在染色体上的位置就能被确定下 来,从而构建由DN秋片段(YAC/BACK隆)重叠群
44、组成的物理图谱。一个DNAff列要成为STS要满足两个条件:1)它的序列必须是已知的,以便于用RC昉法检测该STS在不同DNAt段中存 在与否;2) STS必须在拟研究的染色体或基因组上有 唯一的定位。因此,需要确保STS 不位于重复DNAK域。A.可以通过以下途径获得 STS :1)表达序列标签(EST:通过对cDNM隆测序获得的短序列,代表了表达 的基因的一部分。如果EST来自单一序列DNA,不是基因家族中的某一成员,15可以被用作STS2)简单序列长度多态性(SSLP :如果将被遗传定位的SSLP用彳STS进行 物理定位,会很有价值,因为它们可以在遗传图谱和物理图谱间提供直接联 系;3)
45、随机基因组序列:通过对克隆的基因组 DNA机小片段测序获得。B.用于STS作图的DNNt段群? STS作图必需的第二个要素是覆盖拟研究的染色体或基因组5倍以上的DNA片段群(作图试剂)。?作图试剂可以来自克隆文库和放射杂交体组。a.克隆文库可用于STS分析?基因组计划进入测序阶段的前提是将基因组或分离的染色体断裂成片段,并 将每个片段克隆到高容量载体中,这样产生的一个克隆文库,即DNAt段的集合, 它可用于STS分析。?可以利用流式细胞计数仪来分离单独的染色体。利用流式细胞计数仪分离染色体荧光染色的染色体混合物通过一个小孔,使产生的每一个液滴只含有一条染 色体;荧光探测器检测到含有目标染色体的
46、液滴发出的信号, 并将一个电荷加到 液滴上;当液滴到达偏转电板时,带电荷的液滴偏转进入收集器中。?克隆文库用于STS作图有一个明显的优势,就是单个克隆即为可提供测序的 DNA?来自STS分析的数据既可用作 STS作图,又可用于构建克隆重叠群(clone contig );?如果STS也包括已遗传定位的SSLP,那么DNAff列、物理图谱和遗传图谱 就可以有机结合在一起。b.放射杂交体组可用于STS分析?放射杂交体:利用高剂量的射线将供体细胞染色体打断成若干小片段,冉与 近缘物种的受体细胞融合,形成放射杂交体;?放射杂交作图是基于染色体上的两个 STS相距越近其通过断裂分开的频率越 低的原理,通
47、过PC昉法研究细月fi中供体的STS的分布,利用统计学的手段计算 STS间的断裂分离频率,从而可以推算出STS间的距离和在染色体上的排列顺序。 ?使用PCR方法鉴定STS时,必需保证其只能从供体,而不能从受体基因组中 扩增出相应片段。本章学习要点基因组测序需要借助基因组图谱的原因; 遗传图谱和物理图谱的区别;描述 用于构建遗传图谱的分子标记,以及每种标记是如何检测的;描述用于遗传作图 的群体,以及它们是如何构建的;掌握构建物理图谱的三种方法,特别是限制酶 切图谱的构建方法和STS图谱的构建方法,并评价三种方法的优缺点;描述放射 杂交体是如何产生的?16Chapter 4 Sequencing
48、and Annotation of GenomesA. Genome SequencingDNA测序方法链终止DNAM序法(化学降解法测序、焦磷酸测序)基本依据:聚丙烯酰胺凝胶电泳(PAGE能够把长度只差一个核甘酸的单链 DNA分子区分开。10-1500 bp两种形式的聚丙烯酰胺凝胶电泳:平板胶、毛细管胶 链终止法测序概述?链终止法测序的起始材料是均一的单链 DN的子。?首先由短寡聚核甘酸在每个分子的相同位置上退火,并充当引物合成与模板 互补的新DNA!。?在测序反应体系中加入少量的被不同荧光标记物标记的双脱氧核糖核甘三磷峻(ddNTP)后,合成的互补链可在不同位置 随机终止反应,产生一系列只
49、差 一个核甘酸的DNA子。?通过PAGE电泳可以t出待测DNA子的序列。链终止法测序需要单链DNA真板制备单链DNA的方法:(1)把DNA克隆到质粒载体中,再通过碱或煮沸变性形成单链DNA缺点是质粒DN心被少量的细菌DNM RNA亏染。(2)把DNA克隆到M13噬菌体载体中。在 噬菌体颗粒中,DNA分子以单链形式 存在。缺点是该系统只能用于短片段 DNA大于3kb的片段被克隆到M13载体后 会发生缺失和重排。(3)把DNA克隆到噬菌粒中。噬菌粒是一种质粒克隆载体,除含有自身的复制起点外,还包含来源于 M13噬菌体的起始位点。如果大肠杆菌中既有 噬菌粒又 有噬菌体,噬菌粒上的噬菌体起始位点就会被
50、激活,产生含有噬菌粒单链形式的 噬菌体颗粒,双链质粒DNAft被转变为单链DNA这一系统避免了 M13克隆的不 稳定性,可用于克隆10kb或更长的片段。通过在M13噬菌体载体中克隆获得单链 DNAM13载体有两种形式:双链复制型分子和在噬菌体颗粒中发现的单链型链终止法测序所用的DN咪合酶测序酶必须满足3个标准:(1)高持续合成能力:保证在掺入ddNTP之前,反应不会停止。?(2)可忽略的或没有5 - 3外切核酸酶活性。(3)可忽略的或没有3 - 5外切核酸酶活性。Klenow聚合酶:持续合成能力较低,合成片段长度小于 250bp;测序酶:T7噬菌体所编码的DNA聚合酶I的修饰形式,该酶具备高持
51、续合成 能力,且无外切核酸酶活性。17D引物决定了待测序的模板 DNA区域链终止法测序所用的不同类型引物:通用引物/内部引物E.热循环法测序代替传统方法学热循环法测序类似于进行PCR反应,相对于传统链终止法测序有如下优点:(1)它用双链而不是单链DNA乍为起始材料。(2)只需要很少量的DNA就可以进行测 序,产物以线性方式积累,因此 DNA在测序前不必克隆,可直接对挖带回收纯 化后的PCFT物进行测序。DNA测序的其他方法化学降解法测序:链终止法测序的一个局限 性是:如果模板D N A能形 成链内碱基配对的话,那么它就可能不会提供正确序列。?化学降解法也是通过检查末端核甘酸已知的分子的长度来确
52、定序列的。?这些不同长度的分子是通过能在特定的核甘酸处进行特异切割的化学试剂的 处理而产生的。?利用化学降解法测序,至少需要进行4个单独的测序反应,每种核甘酸对应 一个反应。(测2)化学降解法测序?起始材料是双链 DNA。?每条链的5端连接一个放射性的磷基团对 DNA1行标记?双链中的一条链可能比另一条链含有更多的喋吟核甘酸,因此就稍微重一些, 电泳过程中 就迁移得慢。?从凝胶中纯化出一条链后,分成 4份样品,每份样品都用一种切割试剂进行处 理。有限量:保证每条链上平均只有一个 G残基被甲基化修饰。?!个反应所产生的分子上样到 PAGE板凝胶的一个泳道上,电泳后条带在凝 胶上的位置通过放射自显
53、影来观察。?移动最远的条带代表最小的 DNAt段。(测3)焦磷酸测序:边合成边测序每种核甘酸分别依此加入;如果核甘酸未渗入到正在合成的链中, 就会被反应体 系中的核昔酸酶降解;如果核核酸渗入到正在合成的链中、 释放的焦磷酸盐会引 起化学发光,发出的荧光信号可以被检测到。在 6.4cm2的芯片上可以同时进行 160万个反应,4h内可以获得包含2500万个核甘酸的序列。2.连续DN崎列的组装(鸟枪法、全基因组鸟枪法和克隆重叠群法)通过鸟枪法拼接序列?对于相对较小的原核生物基因组,可以通过鸟枪法直接进行测序。18?测序实验中得到的短序列可通过检查重叠区而直接叠加成主要序列“序列间隙”:可以通过对文库
54、中已经存在的克隆进一步筛选和测序来封闭的间隙。物理间隙:指克隆文库中不存在的序列,可能是因为这些序列在所使用的克隆载 体中不稳定造成的。两种解决策略:a.换一种载体重新构建一个克隆文库,用与重叠群末端相对应的 寡聚核甘酸与该文库进行杂交。b.用成对的寡聚核甘酸为引物进行 PCFT增。A.流感嗜血杆菌序列证实了鸟枪法测序的能力?现在普遍认为,任何小于 5Mb的基因组序列,即使在计划开始前不知道基因 组的任何信息,几个月的时间足够获得它的全部序列。?附此,鸟枪法的优点在于测序速度快,并且能够在遗传图谱和物理图谱不存在的情况下进行工作。用克隆重叠群方法组装序列?克隆重叠群方法被看作是获得真核生物基因
55、组序列的传统方法。?在该方法中,基因组通常经部分酶切而产生较长的 DNA片段,冉把这些片段 克隆到高容量载体,如BAC。再借助基因组图谱的信息,建立BAC克隆重叠群, 然后通过鸟枪法对克隆群进行分别测序再组装。A.可以通过染色体步移来建立克隆重叠群,但该方法费力?最简单的构建克隆重叠群的方法是从基因组文库的一个克隆开始,鉴定出与 第一个克隆中的插入片段重叠的第二个克隆,依此类推。这就是染色体步移法。?该方法的存在问题是,如果用作探针的插入片段含有重复序列,那么它不仅能与重叠的克隆杂交,还能与含有重复序列拷贝的非重叠克隆杂交。?如果用插入片段末端的一个片段作为探针,出现重复序列的机会就回减少。还
56、可对末端序列进行测序来确保不存在重复 DNA。?如果末端片段序列已知,可以通过 PCFW不是杂交来筛选,这样可以加速步 移的速度。B.更快的克隆重叠群组装方法?染色体步移是一个比较慢的过程,几乎不可能用该方法拼接出多于15-20个克隆的重叠群。?一个改进的方法是使用 克隆指纹图谱技术。该技术提供了待克隆DNA片段的 物理结构信息,将这些物理结构信息和其它克隆的相关信息做一些比较分析, 就能鉴定出重叠序列。克隆指纹图谱技术?艮制性图谱:通过用多种限制性内切酶消化克隆,并在琼脂糖凝胶上分离消化 产物而得到。?碓复DNA指纹图谱:通过对利用一类或多类重复序列特异的探针进行 Southern杂交所得到
57、的一系列限制性片段进行分析而获得的。19?重复DNA的PCR或散步重复元件的PCR:运用在重复序列内退火的引物 , 能够扩增出两相邻重复序列之间的单拷贝 DNA。为了鉴定出可能的重叠区,重 复DNA进彳T PCR之后获得的产物大小可以作为与其他克隆相比较的指纹。?STS作图:非常有用,因为它能够产生一个定位于 STS物理图谱上的克隆重 叠群。全基因组鸟枪法测序A.全基因组鸟枪法测序的主要特征?鸟枪法测序中最费时的地方是将单个序列重叠群通过封闭序列间隙和物理问隙而连在一起的阶段。?通过使用两种或两种以上的不同载体中所克隆的片段产生的序列能够有效提 高基因组的整体覆盖面。?解决由于重复序列引起的组
58、装 问题的有效策略是确保其中一个克隆文库中插 入片段的长度大于所研究基因组中最长的重复序列。?序列组装的最初结果是一系列 骨架(scaffold ),每个骨架包括一组被序列 间隙分开的序列重叠群,骨架与骨架间被物理间隙分开。scaffold:可利用STS图谱对骨架进行定位,并检查骨架拼接是否正确。?序列间隙位于成对端点序列之间,通过成对端点序列筛选文库,获得阳性克 隆并测序,可以封闭间隙。?全基因组鸟枪法有可行性,准确性方面仍存在问题。?部分问题是序列产生的随机性,基因组的某些部分被微小片段覆盖许多次而其他部分只被覆盖一两次。B. Understanding Genome Sequences.
59、在基因组序列中 定位基因通过序列筛查定位基因基因不是核甘酸的随机排列,而是具有明显的特征:A.基因的编码区是可读框?编码蛋白质的基因含有可读框(ORF,可读框包含一系列能规定基因编码蛋白质中氨基酸序列的密码子,并开始于起始密码子(通常是 ATG,结束于终止 密码子(TAA, TAG, TGA)。?成功寻找ORF勺关键在于终止密码子在DNAff列中出现的频率。OR中描是一种在细菌基因组中定位基因的有效方法B.单纯的ORFB描对高等真核生物DN徽果不佳?原因之一是真核生物基因组中 基因间的间隔很大,发现假ORF的概率就会增 加。?原因之二是真核生物的 ORF是不连续的,经常被内含子所隔开,而且单个
60、外 显子的长度一般小于100个密码子。对OR中描的基本程序已经作了三项改良:?密码子偏倚(codon bias )被考虑在内。密码子偏倚:指特定生物体的基因中,并不是所有密码子的使用频率都是平等的。20 如亮氨酸可由6种密码子编码,但在人类基因组中,亮氨酸大多由 CTGtg码。?外显子-内含子边界。GU-AO则:核mRNAj剪接点一般都为GU;AG 。?上游调控序列可用来定位基因起始区。上游调控序列也具有显著的序列特征,它们作为识别信号在参与基因表达的 DN阁合蛋白中起重要作用。但调控序列是 易于变化的,对于真核生物尤为明显,因此通过该方法定位基因也存在 很大局限 性。尽管上述三种ORF扫描方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度产品代理合同:某生产商与一家代理商就产品销售达成合作协议3篇
- 2024年度某企业员工股权激励合同3篇
- A组链球菌感染的临床护理
- 2024年度广告代理推广服务合同6篇
- 2024年度仓储物流仓储租赁合同6篇
- 2024年度企业间借贷合同借款金额和利息3篇
- 基于物联网的二零二四年度智能路灯系统设计与施工合同2篇
- 2024年染料类项目资金需求报告代可行性研究报告
- 房江湖2024年度合作开发合同
- 2024年度新能源发电项目监理合同标的详细说明2篇
- 吸收放散实验课件
- 3.1《让小车运动起来》优质课件
- 新形势下,如何做好一人一事思想政治工作
- 《基于核心素养高中物理实验教学实施素质教育的研究》结题总结报告
- 行政人事部工作分析表
- 英语漫谈胶东海洋文化知到章节答案智慧树2023年威海海洋职业学院
- 航空母舰优秀课件
- 2023年芒果TV春季校园招聘笔试参考题库附带答案详解
- 共享中国知到章节答案智慧树2023年上海工程技术大学
- 中国十大传世名画课件
- mbti性格测试题及答案(十篇)
评论
0/150
提交评论