




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE10Chapter1: Genomes,TranscriptomesProteomes1.概述(Genome):指生物的整套染色体所含有的全部DNARNA组是地球上每一物种具有的生物学信息的存储库。(Genomics)基因组所包含的生物信息的利用需要酶及其他参与基因组表达过程中一系列复杂生化反应的蛋白质的协同活性。基因组表达的最初产物是转录组RNA基因组表达的第二个产物是蛋白质组,即细胞中那些决定细胞能够进行生化反应的所有蛋白质组分。这是通过翻译过程来完成的。GenesaremadeofDNA18657证明基因由核酸(DNARNA)3:①肺炎双球菌的转化试验;DNA是遗传物质②噬菌体感染实验;只有DNA是联系亲代和子代的物质③烟草花叶病毒的感染实验。RNA也是遗传物质ThestructureofDNANucleotidesandpolynucleotidesThemodelofdoublehelixDNA晶体X射线衍射图谱 为揭示DNA分子的二级结构提供了重要实验证据WatsonandCrick(1953)提出的DNA" DNA" "A和T以2,GC以3" 螺旋中相邻碱基间相隔0.34nm,每10个碱基对螺旋上升一圈,螺距为3.4nm2.37nm。DNA 碱基间形成的氢键/ 相邻碱基间的疏水堆积力/ 碱基相互作用的范德华力尽管氢键使得双链中的碱基间的配对具有特异性(DNA)定性并无太大贡献。核酸分子的稳定性的根源在于碱基对之间的疏水堆积力。作为芳香族化合物,DNARNADNADNA三种形态的DNA:A-DNA,B-DNA,Z-DNA两类:右手螺旋和左手螺旋RNAandtheTranscriptome RNA RNARNA1. 稳定性差2. 主要以单链形式存在RNA组分(mRNA/rRNA/tRNA)RNA(SnRNA)mRNAmRNARNA(snoRNA):发现于真核细胞核的核仁区,在rRNA过程中起到核心作用(比如在某个核苷酸位点上加上一个甲基。RN(miRNARN(siRNARNA。ProcessingofprecursorRNA末端修饰/ 剪接/剪切/化学修rRNA、tRNAmRNA中都存在;其中,mRNA编辑。ThetranscriptomeRNA4%RNA。(denovo上一代的部分转录组,并维持一生。各蛋白质编码基因的转录过程并不是导致转录组的合成,而是通过替换被降解的mRNA来维持转录组,并通过开闭不同的基因的表达来改变转录组的组成。转录组研究的方法通过序列分析研究转录组RNA-seqmRNAcDNAcDNA行测序,再与基因组序列进行比较分析。这可以借助第二、三代测序技术进行。基因表达系列分析(Serialanalysisofgeneexpression,SAGE)SAGEcDNA12bpmRNA。412=16,777,216bpmRNA1500bp41212bpmRNA。SAGE切下来的片段被收集起来,头尾相连以产生一个串联体,进行测序分析。串联体中的各个标签序列信息被读取并与基因组中的基因序列比对,从而可以分析哪些基因被转录,表达水平如何。通过微阵列或芯片分析来研究转录组mRNAcDNA于和芯片或微阵列杂交。优点:可用于快速评估两个或多个转录组间的差异。cDNA验误差引起的差异。ProteinsandtheProteome基因组表达的第二个产物是蛋白质组,即细胞中那些决定细胞能够进行生化反应的所有蛋白质组分。这些蛋白质是通过翻译那些组成转录组的mRNA分子而合成的。ProteinstructureDNA蛋白质中的单体亚单位称为氨基酸。氨基酸形成的多聚体或多肽在长度上很少超过2000个单位。primarystructure氨基酸通过肽键连接成一条多肽链。secondarystructure键所稳定。α;βtertiarystructure的。R静电相互作用;疏水相互作用;半胱氨酸残基间的二硫键quaternarystructure成一个多亚基蛋白质。不是所有蛋白质都有四级结构;稳定力包括:二硫键(稳定;氢键,疏水作用(松散XB.蛋白质的多样性取决于氨基酸的多样性样的。氨基酸的多样性源于R基团。非极性(疏水)极性(亲水)带负电荷带正电荷Theproteome蛋白质组包括了在特定时间存在于细胞中的所有蛋白质。Thelinkbetweenthetranscriptomeandtheproteome蛋白质组和细胞生化功能之间的联系生物催化作用(酶;结构(细胞骨架由蛋白质决定运动(收缩蛋白;运输(血红蛋白运输血液中的氧;调节细胞进程(信号蛋白、活化调节因子保护细胞个体(抗体;储藏功能(麦醇溶蛋白。蛋白质组研究的方法蛋白谱(表达蛋白质组学)用来研究一个蛋白质组组成的特定技术。蛋白谱基于两项技术:蛋白电泳和质谱双向电泳:等电点等电点:蛋白质的净电荷为零时溶液的PH值。MALDI-TOF(基质辅助激光解吸电离飞行时间质谱) 50此一个蛋白质可以通过胰酶将其消化后进行测定。 / 计算机中含有一个由所研究的物种基因组编码的每一个蛋白质经胰酶消化后肽片段的分子质量来确认最可能的初始蛋白质。蛋白质印迹法(Western杂交)Western杂交是将蛋白质电泳、印迹、免疫测定融为一体的特异性蛋白质的检测方法。其原理是:生物中含有一定量的目标蛋白。先从生物细胞中提取总蛋白或目标蛋白,将蛋白质样品溶解于含有去污剂和还原剂的溶液中,经SDS电泳将蛋白质按分子量大小分离,再把分离的各蛋白质条带原位转移到固相膜(硝酸纤维素膜或尼龙膜)上。然后加入特异性抗体(一抗)白(抗原)与一抗结合后,再加入能与一抗专一性结合的带标记的二抗(()的特异性反应进行检测。根据检测结果,从而可得知被检生物细胞内目的蛋白的表达与否、表达量及分子量等情况。鉴定与某一蛋白质相互作用的蛋白质通过鉴定有相互作用的成对或成组的蛋白质能够获得基因组活性相关的重要数据。构建蛋白质相互作用图谱被视为是连接蛋白质组学与细胞生物化学过程的一个重要步骤。噬菌体展示该技术采用了一种基于λ噬菌体或某种丝状噬菌体的独特的克隆载体。待测基因被插入载体后,它的蛋白质产物能与噬菌体外壳蛋白以融合形式表达。使用噬菌体展示库来寻找与待测蛋白质相互作用的蛋白质的噬菌体。酵母双杂交激活因子(转录因子DNA和转录激活结构域。基因是不表达的。蛋白质相互作用图谱也叫蛋白质相互作用网络,能展现一个蛋白质组中各成员间发生的相互作用。Chapter2StudyingDNA1.概述DNA借助工具酶按预定的方式操作DNADNA并重新将它们连接在一起,形成自然界不存在的组合体。聚合酶链式反应(PCR)DNA/核酸酶、连接酶、末端修饰酶DNARNADNA(依赖模板的酶。A.依赖模板的DNA聚合酶的工作模式5’→3’物。DNAI(Kornberg3’-5’5’-3’外切核酸酶活性Klenow聚合酶DNAI76kDa,保留聚合酶活性和3’-5’Klenow段。小片段的分子质量约34kDa,具有5’-3’外切核酸酶活性。DNA体外标记的方法缺口平移法(Nicktranslation)(DNAIPolyIDNAI3’-OH5’-3’移动。缺口转移是DNA体外放射性标记的重要技术。末端标记法(Klenow片段 )随机引物法(Klenow片段 )核酸酶:外切核酸酶和内切核酸酶DNA可分为三类:IIIIIIIIIIDNA的降解,但切割位置不固定。IIDNA(无修饰酶活性识别位点的专一性和切割位点的专一性,一般在识别序列内切割,不需要DNA细菌中三种不同类型的限制-修饰酶检查限制性消化的结果pH50µL1µgλDNA11U。Southern杂交DNA通过DNA连接酶可以将限制性内切核酸酶消化产生的DNA片段重新连接起来,或者连接到一个新的分子上。T4DNA连接酶:从T4噬菌体感染后的大肠杆菌细胞中提取。粘性末端连接的高效率推动了将钝末端转变成粘性末端方法的发展。一种方法是将称为连接子)(adaptor)到钝末端。3’末尾一个接一个地添加核苷酸。末端修饰酶末端修饰酶:改变DNA分子末端,为连接实验的设计增加可操作空间。DNADNA5’分子上。T4DNA5’DNA末端标记。DNACloning克隆载体及其使用方式质粒,噬菌体,人工染色体等它们都含有复制起始位点。pUC系列(蓝白斑挑白色的)pUC8,2.7kb,除了起始位点外,还携带因(pUC8)lacZ’基因(编码β-半乳糖苷酶的一部分。lacZlacZ’部分。建立在大肠杆菌噬菌体基因组基础上的克隆载体DNAλλ裂解性感染周期/溶源性感染周期*噬菌体基因组大小为48.5 kb,其中有15 kb为随意区域,可以被删除不影响噬菌体感染细菌的能力。据此,目前发明了两种类型的载体:插入型载体DNA某些位点引入一个单一的限制性酶切位点。替代型载体DNADNA*12称为串联体cos。cos位点序列与λ噬菌体的体外包装密切相关。DNA考斯质粒(cosmid、黏粒具有λcos位点的质粒,与λ具有感染性。插入片段可高达44kb酵母人工染色体(YAC)YACDNA一个限制性酶切位点连接起来,酶切位点是为了插入新的DNA,可用来克隆600-1400kbYACDNAc).细菌人工染色体(BAC)是基于天然的大肠杆菌F质粒构建的;能够克隆300kb及更长的片段,并且插入的片段很稳定;LacDNAd).P1λP1λDNAλ125kbe).P1衍生的人工染色体(PAC)P1BAC的特点,具有克隆长达300kbf).FosmidsFλcos倾向。ThePolymeraseChainReaction(PCR)PCR是一种在体外借助于DNA聚合酶实现特定基因或DNA序列扩增的方法。PCRPCRDN(genomicDNA,gDNADNA(complementarycDN。引物:16-30bp,四种碱基随机发布,G+C%=40-60%,引物3’端不能错配。TaqDNA35’外切酶活性。缓冲液Mg2+TaqdNTP(脱氧核糖核苷三磷酸)PCR3010PCR局限性:DNAPCR的基因片段。5kb片段存在麻烦。Taq3’-5’外切酶的功能。PCR(RT-PCRPCR)等。RT-PCRPCR(RT-PCR)RNAcDNART-PCRmRNA5’、3’mRNAcDNA常用的逆转录酶有两种:AMVMMLV。mRNARandomOligo-dt库、cDNA一部法适用于病毒、病原菌检测,操作简单、污染率低PCR(FQ-PCR)实时荧光定量PCR(real-timefluorescentquantitativePCRPCRPCR性到定量的飞跃。PCRPCRPCR的数据处理软件而已。PCRPCR的变化,从而得到一条荧光扩增曲线图。一般而言,荧光扩增曲线可以分成三个阶段:荧光背景信号阶段,荧光信号指数扩增阶段和平台期。PCRDNA拷贝数。线性关系,我们可以选择在这个阶段进行定量分析。PCR概念:CT数扩增阶段任意位置上,但一般荧光域值的缺省设置是3-15个循环的荧光信号的标准偏差(sd)10CT(荧光阈值)CT值(thresholdvalue。CTCT的对数存在线性关系,起始拷贝数越多,CT准品可作出标准曲线。CT贝数。FQ-PCR的化学原理PCR探针类和非探针类两种。探针类是利用与靶序列特异杂交的探针来指示扩增产物的增加;非探针类是利用荧光染料或者特殊设计的引物来指示扩增产物的增加。前者由于增加了探针的识别步骤,特异性更高,但后者则简便易行分子信标SYBRGreenI是一种结合于小沟中的双链DNA结合染料。SYBRGreenIDNA因此设计的程序通用性好,且价格相对较低。TaqMan探针是一种寡核苷酸探针,它的荧光与目标序列的扩增相关。DNA在此发夹结构中,位于分子一端的荧光基团与分子另一端的淬灭基团紧紧靠(FRET分子信标的茎环结构中,环一般为15-305-7个核苷酸长,并相互配对形成茎的结构。荧光基团连接在茎臂的一端,而淬灭剂则连接于另一端。环结构,模板存在时则与模板配对。与模板配对后,分子信标的构象改变使得荧光基团与淬灭剂分开。此时荧光基团被激发,发出自身波长的光子。PCR(inversePCR)PCRDNA片段两侧的未知序列进行扩增和研究的一种简捷方法。ADNAPCRAB和P2已知序列;空白区域为未知序列Chapter3MappingGenomes概述1kbDNA(shotgun。来说是相当困难的,特别是当分析基因组的重复区域时会发生错误。鸟枪法中遇到的问题-1、串联重复DNA,丢失2、基因组范围内的重复,错误拼接置,为测序提供指导。进行:全基因组鸟枪法(whole-genomeshotgun为界标,指引着将用鸟枪法获得的大量短序列拼接成主序列。克隆重叠群法(clonecontigkb片段分别测序后再进行拼接。遗传图谱和物理图谱(遗传重组序列特征位置的线性排列图,反映了基因或标记间的相对距离和顺序。cMDNA基因是首先被利用的标记20才能用于遗传学分析。比如豌豆茎的高与矮,果蝇眼睛颜色的红与白等。用于遗传学作图的遗传标记一种遗传特征。形态标记•细胞学标记•生化标记• DNA分子标所有的标记都必须具有多态性!DNA分子标记:简称分子标记指在DNA水平,具有相对差异的等位基因的DNA多DNA优点:12345、大部分为共显性,能鉴别纯合体和杂合体(restrictionfragmentlength用限制性内切酶酶切基因组DNA时,在同一种生物的不同个体间出现含同源序列的酶切片段长度的差异。Southern/CAPS简单重复序列Simplesequencerepeat,SSR,Microsatellite指重复单位相对较小(2-6bp的基序,由于重复单位数目的变化而形成的多态性。SSR:1、PCR+PAGE2PCR+毛细管电泳(记可获得片段的准确长度)单核苷酸多态性(Simplenucleotidepolymorphism,SNP)SNP。绝大多数SNP是双等位基因;有的能形成RFLP,绝大多数不能。SNP50bpDNA,寡核苷酸只有与待测DNA一个碱基错配,杂交体会非常不稳定,不能形成杂交信号。DNA或更小的玻璃或硅质晶片,在上面高密度的DNADNA此方法在一次实验中可以检测许多个SNP。DNA通过耐扩增突变系统检测SN(AmplificationRefractoryMutationSNPPCR3’PCRPCRSNP物理作图遗传图谱的局限性:遗传图谱的分辨率依赖于所得到的交换数目;遗传图谱的准确率有限物理作图的常用方法:DNA荧光原位杂交(FISH:将分子标记与完整染色体杂交来确定标记的位置;序列标签位点作图:通过对批量的基因组片段进行PCR(或)分析,来对短序列进行定位作图。限制性作图(Restrictionmapping)限制性作图的基本方法双酶解(doubledigest)Key:分析重叠片段部分酶解+完全酶解:比较分析这两种情况下的片段大小。末端标记+部分酶解利用放射性的同位素标记DNA的3’端或5’端b) 部分酶解c) 放射显影多克隆位点(multiplecloningsites,MCS)MCSDNA限制性作图的规模受限于限制性片段的大小DNA限制性作图更适用于小分子。如果DNA50kb,通常选用6别序列的限制性酶来构建限制图谱。50kbDNA稀有酶:78I(7)I(8)。选用识别序列所含基序在靶DNA分子中稀少的酶。如人类基因组中,5’-CG-3’序列就比较稀少,如果选用NotI(5’-GCGGCCGC-3’)10Mb(酵母和真菌物的限制图谱。限制性作图不能用于大型基因组。DNA(PFGE1984SchwartzCentor1s5min45DNA率电场转换凝胶电泳(FIGE)等高加压均匀电场(CHEF)荧光原位杂交(FISH)用荧光探针进行原位杂交原位杂交是以标记的DNA分子为探针,检测完整染色体的一种杂交分析方法。用于原位杂交的探针的标记要同时满足高灵敏度和高分辨率DNA现已设计出具有不同发光特性的荧光标记物,可以将一组不同的探针与单个染色体杂交,并分辨出每种杂交信号,从而检测出各探针的相对位置。DNA40kb500bpDNA一种封闭探针重复序列的方法:如果探针中含有一些重复序列,它可能会和染色DNADNADNADNAFISH中期染色体是高度凝聚的,每条染色体都具有可识别的形态。1MbFISH精细的作图做准备。操作较繁琐,数据积累速度太慢。更精细作图的两种途径:200-300kb非中期染色体:相比之下,分裂间期的染色体更为有用,因为此时的染色体25kb(STS)STSSTSDNA100-500bp求序列已知且在染色体上有唯一的定位。5DNA片段(5DNASTSPCRSTSDNASTS分离频率们间的图距。STSDNADNA(YAC/BAC)重叠群组成的物理图谱。一个DNA序列要成为STS,要满足两个条件:它的序列必须是已知RCRSTSDNA在与否;STS唯一的定位DNASTS:(ESTcDNAESTDNA可以被用作STS;简单序列长度多态性(SSLPSSLPSTS物理定位,会很有价值,因为它们可以在遗传图谱和物理图谱间提供直接联系;随机基因组序列:通过对克隆的基因组DNASTSDNASTS5片段群(作图试剂。作图试剂可以来自克隆文库放射杂交体组。STS基因组计划进入测序阶段的前提是将基因组或分离的染色体断裂成片段,并DNASTS利用流式细胞计数仪分离染色体液滴上;当液滴到达偏转电板时,带电荷的液滴偏转进入收集器中。STSDNA;STSSTSconti;STSSSLPDNA就可以有机结合在一起。STS近缘物种的受体细胞融合,形成放射杂交体;STSPCRSTSSTSSTSPCRSTS扩增出相应片段。本章学习要点STS杂交体是如何产生的?Chapter4SequencingandAnnotationofGenomesA.GenomeSequencingDNADNA)基本依据聚丙烯酰胺凝胶电能够把长度只差一个核苷酸的单链分子区分开 10-1500bp两种形式的聚丙烯酰胺凝胶电泳:平板胶、毛细管胶链终止法测序概述 DNA DNA 在测序反应体系中加入少量的被不同荧光标记物标记的双脱氧核糖核苷三磷酸)DNA PAGEDNADNA制备单链DNA的方法:DNADNADNADNARNADNAM13噬菌体载体中。在噬菌体颗粒中,DNA3kbM13会发生缺失和重排。把DNA克隆到噬菌粒中。噬菌粒是一种质粒克隆载体,除含有自身的复制M13DNADNAM1310kb通过在M13噬菌体载体中克隆获得单链DNAM13载体有两种形式:双链复制型分子和在噬菌体颗粒中发现的单链型。DNA3(1)ddNTP5’-3’外切核酸酶活性。(3)可忽略的或没有3’-5’外切核酸酶活性。Klenow聚合酶:持续合成能力较低,合成片段长度小于250bp;:T7DNAI能力,且无外切核酸酶活性。D引物决定了待测序的模板DNA区域链终止法测序所用的不同类型引物: 通用引物/内部引物E.热循环法测序代替传统方法学PCRDNA(2)DNA就可以进行测序,产物以线性方式积累,因此DNA在测序前不必克隆,可直接对挖带回收纯PCRDNA化学降解法测序:链终止法测序的一个局限性是:如果模板DNA能形成链内碱基配对的话,那么它就可能不会提供正确序列。 化学降解法也是通过检查末端核苷酸已知的分子的长度来确定序列的。 处理而产生的。 4一个反应。(2)化学降解法测序 DNA。5’DNA 4理。有限量:保证每条链上平均只有一个G残基被甲基化修饰。 PAGE胶上的位置通过放射自显影来观察。 DNA(测3)焦磷酸测序:边合成边测序6.4cm2160,4h2500连续DNA()通过鸟枪法拼接序列 对于相对较小的原核生物基因组,可以通过鸟枪法直接进行测序。 测序实验中得到的短序列可通过检查重叠区而直接叠加成主要序列。“序列间隙”:可以通过对文库中已经存在的克隆进一步筛选和测序来封闭的间隙。物理间隙体中不稳定造成的。两种解决策略换一种载体b.PCRA.流感嗜血杆菌序列证实了鸟枪法测序的能力 5Mb组的任何信息,几个月的时间足够获得它的全部序列。 在的情况下进行工作。用克隆重叠群方法组装序列 克隆重叠群方法被看作是获得真核生物基因组序列的传统方法。 DNABACBAC然后通过鸟枪法对克隆群进行分别测序再组装。可以通过染色体步,但该方法费力 最简单的构建克隆重叠群的方法是从基因组文库的一个克隆开始,鉴定出与 仅能与重叠的克隆杂交,还能与含有重复序列拷贝的非重叠克隆杂交。 DNA 如果末端片段序列已知,可以通过PCR移的速度。更快的克隆重叠群组装方法 15-20 一个改进的方法是使用克隆指纹图谱技术DNA物理结构信息,将这些物理结构信息和其它克隆的相关信息做一些比较分析,就能鉴定出重叠序列。克隆指纹图谱技术限制性图谱产物而得到。重复DNA指纹图谱Southern DNAPCRPCRDNADNAPCR之后获得的产物大小可以作为与其他克隆相比较的指纹。 STS作图STS叠群。全基因组鸟枪法测序全基因组鸟枪法测序的主要特征 序列间隙和隙而连在一起的阶段。 通过使用两种或两种以上的不同载体高基因组的整体覆盖面。 解决由于重复序列引起的组装入片段的长度大于所研究基因组中最长的重复序列。 骨架(scaffold间隙分开的序列重叠群,骨架与骨架间被物理间隙分开。scaffold:可利用STS图谱对骨架进行定位,并检查骨架拼接是否正确。 隆并测序,可以封闭间隙。 全基因组鸟枪法有可行性,准确性方面仍存在问题。 而其他部分只被覆盖一两次。Understanding GenomeSequences在基因组序列中定位基因通过序列筛查定位基因基因不是核苷酸的随机排列,而是具有明显的特征:基因的编码区是可读框 编码蛋白质的基因含有可读框(ORF,可读框包含一系列能规定基因编码蛋白质中氨基酸序列的密码子,并开始于起始密码子(通常是ATG密码子TAA,TAG,TGA。 ORF关键在于终止密码子DNAORF细菌基因组中定位基因的有效方法ORFDNA 原因之一是真核生物基因组中基因间的间隔很大ORF加。 ORF100对ORF扫描的基本程序已经作了三项改良: 密码子偏倚(codonbias)被考虑在内。密码子偏倚:指特定生物体的基因中,并不是所有密码子的使用频率都是平等的。如亮氨酸可由6种密码子编码,但在人类基因组中,亮氨酸大多由CTG编码。 外显子-内含子边界。GU-AGmRNAGU….AG 上游调控序DNA很大局限性。ORF。CpG1kbGC40-50%CpGRNA RNAORF,所以不能用前面讲的方法进行定位。 RNA级结构。 tRNA对于其他一些功能RNA可用如下方法进行定位:RNADNA的程序就能鉴别出功能RNA RNA(/内部。 RNA。同源性搜索和比较基因组学为序列筛查提供了一个特殊的方向1DNA相同或相似。 一定程度上可以ORF。 同源性搜索的另一个主要用途是为新基因确定功能。2、比较基因组学:相关种属的基因组序列既具有从它们的共同祖先继承过来的源基因由于它们的序列相似性很高,就很容易被鉴定出来。 ORFORF关基因组中都不存在,那么它很有可能不是一个真正基因。自动标注基因组序列 ORFORFRNA cDNAmRNA基因定位的实验技术 DNAmRNA 转录物通常比基因编码部分要长,因为5’-UTR区。 个基因确实存在于某特定区域中,并且可以定位外显子-内含子边界。杂交实验可以判断某一片段是否含有转录序列 northernDNA northern两个缺点:1、一些单个基因有两个或更多长度不等的转录物,会出现同样的问题。2组织特异性和发育阶段特异性mRNA也有一些基因表达量太低,很难被杂交检测到。性很低。种属间印迹(zooblottinDNADNASoutherncDNADNA片段中进行基因作图 NorthernDNADNA进行测序。 cDNADNA到外显子-内含子边界。cDNA测序作为基因定位方法的成功率取决于两个因素:cDNA(2)cDNAcDNAcDNA含子边界所需要的一些信息。精确定位转录物末端的有效方法 cDNA(RapidamplificationofcDNAend,RACE) 异源双链分析 (Heteroduplexanalysis)准确定位外显子-内含子边界的方法 异源双链分析(Heteroduplexanalysis) 外显子捕获(exontrapping:需要一种特殊类型的包含一个小基因的载还要有起始转录所需要的序列信息(启动子序列。确定单个基因的功能 一旦一个新基因在基因组序列中获得定位,就要探索它的功能问题。 的了解要比想象的贫乏的多。 像定位基因一样,也尝试着用计算机分析和实验研究来确定未知基因的功能。基因功能的计算机分析同源性反映出进化关系 同源基因具有共同的进化祖先,是通过基因间的序列相似性而发现的。 同源基因分为两类:直系同源基因(orthologousgene旁系同源基因(paralogousgene常是可识别的多基因家族的成员,它们的共同祖先可能早于或晚于物种间的分 由于进化过程中发生突变,同源基因间具有不完全相同的核苷酸序列。 由于突变起始于相同的起始序列,因此序列又具有相似性。同源分析可以提供整个基因或基因片段的功能信息 DNA列后再进行同源性搜索,就不太可能得到假结果。 同源性搜索程序是通过将查询序列和数据库序列之间进行比较而开始的。对列同源的可能性。当在氨基酸水平进行比较时,两个序列之间缺少同源性就更明显产生得分的两种方法: 条序列间的相似程度。 运用不同氨基酸之间的化学相关性为比对中的每个位点进行评分,相同或相近的氨基酸分数就高(如亮氨酸-异亮氨酸,天冬氨酸-天冬酰胺基酸分数就低(半胱氨酸-酪氨酸,苯丙氨酸-丝氨酸。Identitie(低一些;Positives(高一些)利用同源性搜索来鉴定基因功能有如下局限性: 如果数据库中描述的基因的功能不正确,就会传递到新序列上。 酶同源。 构域。结构域在决定基因功能方面起到了关键作用。用实验分析阐明基因功能 法来验证和扩展同源性研究的结果。 因的基础上去研究其功能,属于反向遗传学的范畴。通过基因失活进行功能分析 于确定未知基因功能的技术基础。同源重组可以使单个基因失活DNADNADNADNA DNA 基因失活的第二个例子使用相似的方法,但使用小鼠而不是酵母。 生物。 这样才能充分评价基因失活对表型的影响。因此,必须使用一类特殊类型的小鼠细胞:胚胎干细胞ES细胞。 制备基因敲除小鼠的过程如下:将已经用基因工程处理过的ESES突变体和胚胎其它细胞的非突变体混合组成。 鼠。利用插入突变进行基因失活入突变是将外源的已知插入元件随机插入植物基因组中,引起插入位点基因的变化,影响其正常表达,进而引起植株在表型上的变化,产生插入突变体,并以此插入元件为标记来分离和克隆因插入而失活的基因,对该基因进行反向和正向遗传学研究。 目前常用的插入元件有转座子或逆转录转座子、T-DNA(1) DNATy1。人工诱导转座养基上时,启动子被激活,Ty1 (2)T-DNAT-DNA 插入突变体库的主要方法。 T-DNATiDNA因组中并稳定地表达。 T-DNA在植物中一般都以低拷贝插入,多为单拷贝。单拷贝T-DNA后不再移动,便于保存 早期研究认为,T-DNA性。但近年来有研究表明,T-DNA往往偏向于整合在染色体中基因丰富、转录因类型上没有偏向性。 由于插入的T-DNA序列是已知的,因此可以利用质粒挽救法、反向PCR、TAIL-PCRPCR并对比突变的表型研究基因的功能。T-DNA相应的选择标记基因,通过限制性内切酶进行酶切,将酶切片段自连成环状T-DNAPCRDNAT-DNADNAPCR反向PCR的关键是选取合适的限制性内切酶。PCR(TAIL-PC3(SP1,SP320bp)1Tm(AD,14bp)PCR的片段可以直接用做探针和测序模板。PCRT-DNAT-DNA3T-DNA性引物延伸出来的接头长链互补链而产生。一种随机事件,就很难预测它会在哪里定位。 T-DNA 型变化的后代来鉴别出具有相似功能的各类基因。定向的基因沉默方法(1)RNA(RNAiRNA从而阻断靶基因表达,使细胞出现靶基因缺失的表型。为真核细胞植入一段双链RNADicer(RNaseIIInuclease)RNA(siRNA)。恰巧,真核细胞内RNA(RISC),它能够找到siRNA,并把它解旋ssRNA(singlestrandedRNARISCssRNA。RISCssRNARNAmRNARISCmRNA(2)(virus-inducedgenesilencing,VIGS:cDNA 目前已有多种病毒载体在VIGSX毒、甘蓝缩叶病毒等 每种病毒载体都存在一定的宿主范围,诱导沉默效果也不同。 其作用机制为:含有目的基因片段的病毒载体在被侵染的植物组织中大量复RNARNA(RdRP)RNA(dsRNA)。 dsRNADicer21~25RNA(siRNA)。siRNARNA(RISC)mRNA,造成目的基因mRNARNAVIGS的优点: VIGSVIGS 利用包含多基因序列的病毒载体,使几个基因同时发生沉默成为可能。 VIGS守区域的目标序列,可以来沉默特定家族的全部或部分成员。VIGS的局限性: VIGS着固有的局限性: 首先,针对不同的寄主植物需要选择不同类型的病毒载体。 叶片形态。 再次,VIGS不是很明显 VIGS序的植物品种是很难排除的。 最后,VIGS沉默水平也可能发生变化,这使得要清楚地阐明结果就变得更加复杂。用实验分析阐明基因功能基因过表达也可以用来探索功能 通过基因过表达进行功能分析:通过使生物体中被检测基因的活性比正常情况更高时检测表型的改变。 过表达一个基因,必须使用一种特殊类型的载体,载体必须含有高活性启动子,以便使每个拷贝的待测基因能被转变成大量mRNA,蛋白质。基因失活或过表达对表型的影响可能很难辨别 基因失活或过表达实验的关键之处是需要鉴别表型改变。 对于任何生物体,必须检查的表型范围是很广的,很难全面评价。 即使进行最认真的筛选时,许多基因失活引起的表型变化可能也辨别不出。 10%测基因中发现到表型变化。未知基因编码蛋白质活性的详细研究基因失活和过表达是基因组研究人员探索新基因功能的基本技术,但并不是能提供基因活性信息的唯一方法。定点诱变可以用来详细探索基因的功能 定点诱变:为了改变蛋白质的结构和可能的活性,在基因序列中产生精确变的方法。 (1)寡聚核苷酸定点诱变;(2)PCR方法。 基因替换掉。 通常是在突变基因旁设计一个标记基因来寻找发生了同源重组的细胞。 但有可能是标记基因而不是突变基因导致了表型的改变。 为解决这一问题,设计了一种两步基因替换法。报告基因和免疫细胞化学可以用来定位基因的时空表达 基因功能的线索通常可以通过研究基因的时空表达来获得。 ORFORF,而其他调控基因不变来实现。 表达报告基因的细胞会变蓝、发荧光或释放其它可见信号。常用的报告基因:β-半乳糖苷酶、β-葡糖苷酸酶、荧光素酶、绿色荧光蛋白 以获得有关该基因功能的关键资料。 化学做到免疫细胞化学(Immunocytochemistry) 用红色荧光标记物标记的抗体处理细胞。 细胞检测结果表明荧光信号与线粒体内膜相结合。 内膜的主要生化功能。本章学习要点(生物信息学方法ORF更详细信息的方法。Chapter5EukaryoticNuclear核基因组包含于染色体当中DNA不同的真核生物具有不同的染色体数目,但染色体数目似乎与生物体的生物学特征没有关系(4接关系(30。DNADNADNADNADNA间隔是有规律的。DNA核小体核心八聚体、连接组蛋白DNA140-150bp,50-70bpDNA190-220bpDNA“串珠样”结构螺线管模型螺线缎带模型30nm染色质纤维的两种结构模型“串珠样”结构代表的是活细胞的核中并不多见的染色质非包装形式。30nm30nm的。中期染色体的特征DNA两个拷贝在着丝粒处结合在一起;可通过染色技术绘制全套染色体的核型图。着丝粒全着丝粒染色体隐杆线虫就含有全着丝粒染色体。DNA区域。随着对拟南芥着丝粒序列测定之后,人们发现拟南芥着丝粒DNA少量基因7-9genes/100kb。端粒端粒是染色体末端的重要标志。DNA5’-TTAGGG-3’端有一短的延伸序列。真核生物核基因组的遗传特征真核生物基因组中基因位于何处度会有许多变化。在拟南芥中,平均基因密度为25 genes/100 kb,但即使在着丝粒和端以外的区域,基因密度也可在每100kb有1-38个基因间变化。100kb0-64色质区域基因密度较高。在核基因组中基因是如何组织的A.基因只构成了人类基因组中的一部分1250kb特征:(1)4PKP2、SYB1FLJ10143、CD274SYB12PKP28(2)88重复序列(布重复序列:在基因组中很多地方都会出现的重复序列。4长散布核元件LINE,短散布核元件SINE件LTR,DNA。在上述基因组片段中,4(3)74(4)50kb30%的部分由功能未知或不明确的非基因、非重复序列或单拷贝DNA4745bp9.5%。48Mb1.5%44%。C.酵母基因组是相当紧凑的10Mb,10Mb。如真菌的基因组最小,而相对高等的真核生物如脊椎动物和有花植物的基因组就属于最大的。但又不是完全一致的。CC:通常是指一种生物单倍体基因组DNA所以节省了基因组空间。50kb50kb50kb片段具有如下特点:(1)酵母片段包含的基因数目比人的片段多。28/4(2)酵母中不连续的基因数目相对较少(0。在整个酵母基因组中只有30(3) 酵母全基因组范围的重复序列更少(5/883.4%。(人:44%)和其他非编码序列占用的空间也更少。C.其他真核生物中的基因编排可以建立一个假设:越是复杂的真核生物,它们的基因组越不紧凑。为此,我们将人、酵母、果蝇和玉米的基因组进行了比较。基因组中有多少基因,它们的功能又是什么3-420008-10我们现在知道,由于可变剪切的存在,基因的数目并不代表蛋白质的数目。人类基因目录3-42500RNA。对于这些功能已知的基因架和肌肉中结构蛋白的合成等。基因目录揭示了不同生物体的各自特征真核生物基因组中,基因分类的方法:(1)按照基因的功能进行分类。有些基因功能未知,用这种方法进行分类会遗漏部分基因。(2)按照提示基因功能的结构域基因家族具有相同或相似序列的基因家族是许多基因组的共同特征。rRNA基因属于最经典的多基因家族的例子,这些家族是基因扩增产生的。乳动物的珠蛋白基因。假基因和其他进化遗迹能基因。它往往存在于真核生物的多基因家族中。主要存在两种假基因:(1)如珠蛋白假基因。(2)mRNAcDNA组后,由于缺少上游调控序列不能转录而引起的基因失活。除假基因外,基因组还包括截短基因和基因片段等进化
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校茶水间管理制度
- 学校饮水水管理制度
- 学生洗澡室管理制度
- 宁波港门卫管理制度
- 安全生产周管理制度
- 安装加工件管理制度
- 实训室教师管理制度
- 宠物店公司管理制度
- 客房消毒间管理制度
- 室外弱电井管理制度
- 2025年高考英语全国二卷试题含答案
- 2025江苏扬州宝应县“乡村振兴青年人才”招聘67人笔试备考题库及完整答案详解一套
- 抚州市乐安县招聘城市社区工作者笔试真题2024
- 仪器仪表制造职业技能竞赛理论题库
- 网络服务器配置与管理(微课版) 教案 项目02 虚拟化技术和VMware-2
- 税收分析试题及答案
- 2025年西式面点师(中级)面包烘焙实操考试试卷
- 回迁楼房买卖合同协议书
- 新课程理念下语文课堂教学体系重建
- 工程完工后的回访与保修服务承诺
- 国家开放大学2025年《创业基础》形考任务3答案
评论
0/150
提交评论