第二章 基因与基因组.ppt_第1页
第二章 基因与基因组.ppt_第2页
第二章 基因与基因组.ppt_第3页
第二章 基因与基因组.ppt_第4页
第二章 基因与基因组.ppt_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章 基因与基因组,一、基因的概念:,基因(gene) 是一段携带功能产物(多肽,蛋白质,tRNA和rRNA和某些小分子RNA)信息的DNA片段,是控制某种性状的的遗传单位。,估计,人类约有33.5万(或3.4万)个基因,不同生物,基因的数量、结构及组合方式不同,第一节 基因与基因组,在早期,Morgan等把遗传性状与特定的染色体区段联系起来,并提出“一个基因,一个酶”和“一个基因,一条多肽链”的概念。,基因的特点和鉴别方法,编码tRNA和rRNA和某些小分子RNA的基因: 我们较易通过核酸序列加以判断。,蛋白质编码基因: 目前可根据其特点使用五项标准来鉴别 但这些标准使用起来却并不得心应手

2、。,基因的特点和鉴别方法,基因组(genome)是指一个细胞或生物体的一套完整的单倍体遗传物质。,对二倍体高等生物来说,维持配子正常功能最低数目的一套染色体遗传物质,构成一套基因组。,对只有一个染色体的原核生物,基因组就是其整个染色体。,人类基因组24个染色体(22+X+Y)约3.0109bp,1.开放阅读框(open reading frame, ORF) *是始于起始密码子并终于终止密码子的一串密码子。 *从mRNA中找出大的ORF来确定编码蛋白质的基因; *适合于从DNA序列中鉴别原核生物基因和含少量内含子的真核基因。 *但对于一些短少的基因及一些内含子丰富的基因则很难鉴别。,2. 序列

3、特征密码子偏爱和剪接点,*密码子偏爱(codon bias ) 指在不同物种的基因中经常为某种氨基酸编码的只是其中的一个密码子。 当鉴别到一个ORF时,密码子偏爱常常用来确定这个ORF是否是一个基因。,*基因的剪接位点(splice sites) 一般有特定的序列特征,计算机程序利用这种序列特征可预测将近50%的外显子及20%的完整基因。,3. 序列保守性,*一个功能在不同物种内是保守的基因,大都表现出外显子的保守性和内含子的多变性。 *最好是对适当进化距离的物种间序列进行比较。 *但保守性序列也可能是非转录的调控单元。,*寻找基因的表达产物RNA或蛋白质,是鉴定一个基因的有效方法。 *但有些

4、OFR似乎并不转录,因为检测不到它们的RNA或蛋白质产物。,4. 转录产物,除以上鉴定基因的五项标准之外,在实施过程中还有些麻烦的问题,如重叠基因、变通性断裂基因、假基因等。,*使基因失活也是确认基因功能的一个方法。 *但许多编码序列的失活并不导致一个明显的表型,因而很难找到鉴定的标准。,5. 基因失活,二、基因组的概念:,基因组(genome)是指一个细胞或生物体的一套完整的单倍体遗传物质。,对二倍体高等生物来说,维持配子正常功能最低数目的一套染色体遗传物质,构成一套基因组。,原核生物和真核生物基因组又分染色体基因组与染色体外基因组,后者如原核生物的质粒DNA,真核生物的线粒体DNA及叶绿体

5、DNA。,人类基因组24个染色体(22+X+Y)约3.0109bp,1. 基因组大小与C值佯谬,基因组大小在不同生物之间差异很大;如HBV 仅3200 bp,而某些显花植物和两栖类动物可达1011bp。 基因组大小用C值(C value)表示; C值大小基本上反映生物进化程度的差异; 但这种相关性并不很精确; 这种生物体的进化程度与基因组大小之间不完全成比例的现象称为C值佯谬( C value paradox ); C值矛盾主要是由于各种生物基因组的结构特征的差异造成的,低等和高等生物差别明显。,2. 基因总数与N值佯谬,基因总数( N表示)人类为3万多个,仅比大肠杆菌大7倍,比低等动物秀丽线

6、虫大1.6倍,水稻高达5万。 果蝇在进化上比秀丽线虫高等,基因总数只有后者的0.6倍。 基因组中基因数目与生物进化程度或复杂程度的不对称性,称为N值佯谬(N value paradox)。 既然一切生物性状都是由基因决定的,那么生物体的DNA含量(C值)和质量(N值)就应该与生物进化阶梯及复杂性成正相关。 生物体结构与功能的复杂程度不仅取决于一定的基因数量,更重要的是在于基因功能及其相互作用网络的复杂性和精确性。,三、真核生物基因组特点,(一)分子量很大的DNA与蛋白质形成染色体存在于核内。人类染色体约30亿bp,(二)转录与翻译不同步,转录产物为单顺反子,功能相关基因分散排布,无操纵子结构,

7、(三) 基因组存在高比例的非编码顺序(non coding sepuence, NCS), NCS可作进化标尺?,(四) 大量重复序列(repeat sequence)存在。,单拷贝顺序编码蛋白质,基因顺序,重复顺序的功能:,1)编码某些重要的功能性蛋白、rRNA、tRNA等,2)与染色体构象、着丝粒形成有关,3)参与基因的表达调控,重复顺序,1. 倒位(转)重复顺序,指两互补顺序呈反向排列,形成回文结构或发夹状结构,2. 串连重复顺序,由相同的核心顺序(270bp)成串(头尾相接)排列而成的高度重复顺序。约占整个基因组的10%,卫星DNA(satellite DNA)分3类:,大卫星DNA(

8、macrosatellite DNA),即经典的卫星DNA,由数十个核苷酸的重复单位构成,主要存在于异染色区和着丝粒。又分I 、II、III、IV和 、卫星DNA。,小卫星DNA(minisatellite DNA),由612个核酸的重复顺序组成,位于染色体端粒及其附近,长度数十数千bp,微卫星DNA(microsatellite DNA),或称简短串连重复,由26个核苷酸的重复顺序组成,如(CA)n、(GA)n、(TA)n,n为1530具有多态性,卫星长度常小于100bp,大量分布每条染色体。,且卫星两侧的顺序是特异的,故可以PCR检测,可作为遗传连锁分析的标志。,微卫星DNA顺序可能还与癌

9、基因或抑癌基因的表达调控有关,亦可作为散发性肿瘤的研究标志,3. 散在重复顺序,为中度重复顺序,约占染色体组的20%,散在分布于基因组内。,如Alu家簇或称Alu顺序,由300bp短序列构成,其中有一个Alu酶切位点(AG/CT),被切成130bp和10bp二个片段。,Alu顺序分散于整个基因组中,平均5kb就有一个。是人类基因组所特异的,可作为鉴别人类基因的天然标志。,Alu家簇称短的散在重复顺序(长度小于500bp), Kpn家簇则称长的重复顺序(长度大于500bp),散在重复顺序可能是转座子,(五) 基因多为不连续的,被插入序列(IS)所分隔,断裂基因由内含子(intron)(非编码序列

10、)和外显子(exon)(编码序列)交替组成。,这种现象称为断裂基因(split gene),内含子和外显子在编码不同蛋白的时可转换角色,除少数蛋白(a,-intron和组蛋白)外几乎所有基因都有内含子。,内含子功能未知!,GT/AG规则: GT-intron-AG,AAA-AAA,GpppG,3,转录,断裂基因及其转录、转录后修饰,(六 )功能相关基因构成各种基因家族,基因家族的各个基因可以相距很远(甚至在不同染色体上),亦可以串连地成簇排列,但都各自转录。,1)核苷酸序列相同:成簇或成串排列,如rRNA基因家族、tRNA基因家族和组蛋白基因家族,2)核酸序列高度同源:如生长激素基因家族、-珠

11、蛋白基因家族,3)编码产物的功能或功能区同源:基因全长序列相似性较低,但产物具有保守的功能区。如src癌基因家族都有同源的蛋白激酶结构域,基因家族(genefamily)概念:指核苷酸序列或编码产物的结构具有一定同源性的一些基因。,5)假基因():在多基因家簇中,有的成员并不表达基因产物,称,假基因可能与有功能基因同源,可能由于基因突变而失活,假基因普遍存在,可能为进化的痕迹,4)基因超家族( gene superfamily):结构上具有一定的相似性,但功能不一定相似,且进化上的亲缘关系较远。如免疫球蛋白基因超家族、丝氨酸蛋白酶基因超家族等,基因组(genome) 泛指一个有生命体、病毒或细

12、胞器的全部遗传物质;在真核生物,基因组是指一套染色体(单倍体)DNA。,一、基因组学概念及范畴,基因组学(genomics) 发展和应用基因作图、 DNA测序、基因定位等新技术以及计算机程序,分析生命体(包括人类)全部基因组结构及功能。,第二节 基因组学,基因组学的亚领域和研究内容,二、人类基因定位的基本方法,家系分析法发现感兴趣的基因 通过分析统计家系中有关遗传性状的连锁情况和重组率而进行基因定位的方法。,连锁分析法(linkage analysis),摩尔根1910年提出连锁定律,发表了“基因论” :,(1)相引是两个基因位于同一染色体上,相斥则反之 (2)同源染色体在减数分裂时发生交换

13、(3)位置相近的因子相互连锁。,交换值=新组合数/(亲本组合数+新组合数); 交换值从050%; 同一条染色体上二个基因间的距离越远交换值越大; 交换值为0时为完全连锁(二个性状总是同时出现); 二个基因间的遗传学距离(图距)用单位cM表示(厘摩)表示(1%交换值为1 cM ),减数分裂过程中的同源染色体交换,1) 性连锁分析最常用的家系分析法,如果其性状只出现于男性,则基因位于Y染色体; 如果其性状是隔代交叉遗传,亦即外祖父的某些性状不出现于其母亲,却出现在其外孙子身上; 由于男性的X染色体总是传给女儿,一般不直接从父到子遗传,所以这个基因应位于X染色体上。 如果二个性状都表现出隔代遗传,则

14、这二基因都位于X染色体上; 外祖父法确定二个X染色体连锁基因的遗传学距离。如X染色体连锁的色盲基因和蚕豆病基因。,2)染色体标记连锁分析法,当已知染色 体上的某种标记与某个基因间的连锁关系后,亦可通过家系分析法将基因定于染色体上并计算出重组率确定遗传学距离。 如Donahue发现自己家系的1号染色体长臂近着丝粒区变长,是一个可遗传标记;随后又发现这一标记与 Duffy血型具有平行性(连锁关系),从而将Duffy血型基因定位。,3)多态性DNA标记,串连重复序列(VNTR)第二代遗传标记 其核心顺序重复的次数具多态性,现已定位了300余个均匀分布于各个染色体上的VNTR; 由于VNTR的核心顺序

15、两侧的序列是没有个体差异且长度各不相同,因此,以此两侧序列为PCR引物,能获得个体特异的指纹图谱(亦称全基因扫描)。 进行家系全基因扫描时,如发现某些性状总是与某些VNTR相连锁,就可以将该基因定位于某一染色体,精度10cM左右。 VNTR多态性亦符合孟德尔遗传,故指纹分析还可应用于遗传病诊断、法医个体鉴定、亲子鉴定等,2.体细胞杂交初步的基因定位,应用体细胞杂交技术,离体条件下把基因定位到染色体上。 如人/鼠杂交细胞,经传代相对稳定后,一般含整套鼠染色体及丢失部分人染色体(常保留17条不等的人染色体); 这种杂交细胞是进行基因定位和连锁分析的极好材料,通过分析某基因产物是否与人的某个染色体同

16、时存在,即可将基因定位到染色体上; 其后再进行区域定位常利用染色体的结构的异常,如缺失、易位等标记进行连锁分析; 新发展起来的辐射杂交细胞基因定位法人/鼠杂交细胞染色体经射线处理后,只含带着丝粒的部分片段。比较含长、短染色体片段的杂交细胞的基因表达差异,可更精确定位。,3. 核酸杂交技术精确的基因定位,基因原理:以克隆基因的cDNA为探针,与保留在杂交细胞的人染色体DNA顺序进行分子杂交,获得染色体定位; 大致步骤(以人白蛋白基因定位为例): 分别提取人细胞、CHO细胞和各种人/CHO杂交细胞的染色体组DNA;分别用Hind III酶切、电泳、转膜;用人白蛋白cDNA为探针杂交、显带;结果分析

17、-定位于4号染色体,1) 克隆基因定位法,2) 原位杂交法(in situ hybridization),原理:以标记的目的基因特异DNA序列或RNA为探针,直接与细胞中期染色体进行分子杂交,显影后即可确定探针杂交的染色体位置(定位)。 荧光原位杂交(fluorescence in situ hybridization , FISH ) :探针以荧光标记(生物素、地高辛等)的原位杂交 FISH能直接完成基因的染色体定位。,FISH程序示图,端粒序列定位于染色体的每个末端(FISH),3) 原位PCR (in situ PCR),原理:在单细胞或组织切片上,对目的基因用PCR进行原位扩增,(或再

18、进行分子杂交),从而获得基因的染色体定位信息。 间接法:先对基因进行原位扩增,再进行DNA原位杂交,间接示踪; 直接法:将标记的核苷酸直接掺入PCR产物中,直接示踪。 基本步骤:固定细胞,蛋白酶部分消化;原位PCR扩增;直接法直接显影(如放射身显影、荧光、化学显影等),间接法通过标记探针进行杂交显影。当然需要与染色分带技术相结合!,4) 定位克隆技术,原理:对通过疾病表型观察到的致病基因,进行基因定位和进一步分离、克隆该基因的策略。 基本策略:通过家系分析等确定致病基因与多态性标记间的连锁关系或染色体定位;通过染色体步移进行更精确定位,或以标志性序列探针,从克隆重迭群(contigs)筛选出特

19、异的(contig) ;再通过DNA测序等确定目的基因的序列,获得基因克隆。,第三节 人类基因组计划 (Human genome project ,HGP),Dolbecco(1986)首次提出HGP的概念;,1990美国国会批准正式启动HGP;法、英、意、德、日跟进;成为国际人类基因组计划,中国负责1%的序列测定,并于2001年完成完整图,预计2005年完成,后来提前到2003年完成完整图,1999年宣布完成了22号染色体DNA全序列测定,1993美国对HGP进行了修正。,2000年公布了人类基因组工作草图,一、修正后的HGP主要内容,人类基因组作图及序列分析(22+X+Y, 30亿bp);

20、,基因的鉴定与定位(约5万个基因);,基因组研究技术的建立和创新;,模式生物基因组作图及序列分析;,信息系统的建立、储存及相应软件的开发;,相关产业的开发。,HGP的主要成果四张图,被誉为人类“分子水平的解剖图”、人类“生命的元素周期表”,1. 遗传图(genetic map)又称连锁图(linkage map),以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因)的遗传标记为路标,以遗传学距离( cM)为图距的基因图谱。,第三代遗传标记是SNP(restriction fragment length polymorphism,单核苷酸多态性),不再是分析长度,而是直接测序,第二代遗传标

21、记是STR(short tandem repeat,简短串连重复序列 ),6000个标记,96年已全部完成,第一代遗传标记是RFLP(restriction fragment length polymorphism,限制性酶切片段多态性),2. 物理图 (physical map),以一段已知序列的DNA片段(STS,sequence tagged site,序列标记位置)并有染色体定位为路标,以Mb或Kb为图距的基因组图。,首先建立相互重迭的相连片段克隆群(contigs)(每个克隆都含有一个STS),借助YAC已建立总体覆盖率达近100% contigs,测序分析,计算实际距离(Mb或Kb

22、),3. 转录图又称表达序列图或cDNA图,是以部分5 端或3端cDNA序列(即表达标志,EST)为路标,根据表达顺序的位置和距离作图,已注册的EST达300万条,正每天以千多条的速度增加,实际上cDNA图就是人类“基因图”的雏形,另一个优点是:直接编码蛋白质的序列只占整个基因组的的15%,在成人中每一特定组织中只有不到10%的基因表达,即不足1万种mRNA。抓住这15%,就抓紧了大多数基因。并且可通过cDNA全长转录本基因及邻近序列,生物性状(包括疾病),都是由结构或功能蛋白质决定的,而蛋白质又是由mRN编码的。,转录图的另一层意义:,cDNA具有组织(空间)、发育阶段(时间)和病理(病态)

23、特异性。因此,了正常的转录图就可以进而绘制生理、病理、受控条件下的转录图。,可以作为筛选基因的探针,亦可以作为基因诊断的探针,因此,世界各国、各大公司在转录图、EST的构建方面竟争激烈。,免费共享?美国专利?,4.序列图,测定总长约30亿个核苷酸组成的全染色体序列,是HGP最明确、最准确(定质定量)、最艰巨(定时,2005年)的硬任务。,由于测序技术的限制(一次测序在1000个核苷酸左右,还不能直接利用全基因组或YAC、BAC或大片段克隆的contig作模板测序。必须在些大片段基础上构建小的(1kb)的亚文库。,1999年完成22号染色体的全序列测定!,2003年全部完成,准确率达99.99%

24、!,二、我国HGP的发展战略和研究现状,发展战略:根据我国人群资源丰富的特点(56个民族和丰富的病种;山区封闭的民族群和遗传隔离群;多世代多个体的大家族具有典型的遗传性状或遗传疾病),突出基因组多样性研究和重大疾病的疾病基因组研究。,现状:,-1993年自然基金批准了“中华民族若干位点基因结构研究”重大项目,标志中国的HGP正式启动,-1996年“重大疾病相关基因定位、克隆、结构与功能研究”获“863”资助。,-1999年参与HGP大规模测序,承担1%任务,2000年完成工作框架图,2001.8提前2年完成完整图,-已完成南北2个汉族人群、东北地区12个小数民族共733个细胞系的建立,应用多种

25、标志进行基因组多样性的比较性研究。,-克隆了遗传性神经性耳聋基因(湖医大夏家辉),-我国正进行多种疾病相关基因组计划,如肝病、肾病等,已获得数百个疾病相关基因(克隆),总之,有机遇又有差距,2002.4我国科学家在Science上发表水稻(籼稻)工作框架图,三、后基因组计划,21世纪生物学的发展方向功能基因组学 对整个基因组所包含的基因、非基因序列的功能进行大规模分析;认识基因在发育、分化和病理状态下的功能变化及其调节机制。 后基因组时代的主角蛋白质组学 蛋白质组(proteome)是指细胞或组织表达的全部蛋白质。 人类2.4万个基因,几十万种蛋白质; 重点分析生命不同时期、不同组织、不同(疾

26、病)状态蛋白质的变化 蛋白质组学(proteomics):是从整体上采取高通量/大规模手段研究所有蛋白组成及其活动规律.,基因组学的延伸模式生物基因组学 五大模式生物:E.coli、酿酒酵母、黑腹果蝇、秀丽线虫和小鼠,其序列分析被列为HGP的内容; 不同物种间功能基因有相当大保守性,如99%鼠基因与人对应; 最终目的:比较基因组学比较不同物种的全基因组,增强对各基因功能的认识。 从分子水平上升到细胞水平细胞计划 在阐明以基因为核心的生命物质的本质后,以信号传导为主线阐明在细胞内一切生命现象的本质。 1950年代生物学从细胞水平深入到分子水平是一次飞跃,但现在似乎又正返回到细胞水平! 新型学科与

27、产业的发展生物信息学和生物芯片,基因组与蛋白质组知识 库,基因组科学与医学的关系,基因组学研究推动了生物产业发展,人类基因组计划的实施带动了基因组学的发展。基因组学的重要性就在于它是整个生命科学产业的上游部分,掌握了基因的知识产权,就等于控制了基因工程产业的核心。 世界上一些最大的制药集团投巨资进军生命科学工业。CibaGeigy和Sandoz 2.5亿美元、GlaxoWellcome 0.47亿、Smith Kline 1.25亿。 对HGP的预测,将药物开发项目的25建立在HGP基础上。 大型化学工业公司向生命科学工业转轨的规模和力度更大。美国孟山公司于1997年转向生物技术和基因组研究,

28、共投资66亿美元。,四、生物信息学HGP数据的利用,生物信息学(Bioinformatics)是将计算机和信息科学技术运用到生命科学,尤其是分子生物学研究中的重大交叉学科。 它通过对生物学实验数据的获取、加工、存储、检索与分析,进而达到揭示这些数据所蕴含的生物学意义的目的。 它已广泛地渗透到医学的各个研究领域中,成为生物医学发展不可缺少的重要 工具。 人类基因组计划(HGP)和生物医药工业催生其发展的的两个主要力量,1.国内外发展现状,各国投入大量资金,相继成立了生物信息中心。 美国的国家生物技术信息中心(National Center for Biotechnology Informatic

29、s,NCBI) 欧洲生物信息学研究所 (European Bioinformatic Institute,EBI) 日本信息生物学中心(Center for Information Biology,CIB)等。 NCBI、EBI和CIB相互合作,共同维护着GenBank、EMBL、DDBJ三大基因序列数据库,它们每天通过计算机网络互相交换、更新数据。 他们每年召开两个年会讨论合作事宜。 中国国家级生物医学信息学中心筹建运行。,2.主要应用方向功能基因组学,将已知基因序列与功能相联系; 以常规克性为主基因的分离转向以序列和功能分析为基础的基因分离; 从单个致病基因机制的研究转向多个致病基因机制的

30、研究 比较正常/疾病、疾病/治疗、发育/分化各组织来研究功能基因组和蛋白质组; 通过比较不同物种的基因组中各种结构的异同,进行分子进化的研究; 构建生物分子的结构模型进行药物设计药物基因组成学,3.主要任务之一建立和管理各种数据库,Genbank:美国国家生物技术信息中心的数据库()。 EMBL:建立在欧洲分子生物实验室的数据库 (http:/www.embl-heidelberg.de)。 DDBJ:日本的DNA数据库银行(http:/www.nig.ac.jp )。 其他:酵母基因组数据库(SGD)、酵母蛋白质数据库(YPD)、拟南芥数据库(At

31、DB)、医学数据库(OMIM)、线虫数据库(ACEDB),(1)核酸序列数据库三大数据库,(2)蛋白质数据库,SwissPDB (Protein Data Bank,) /pdb/cgi/queryForm.cgi Prosite (expasy.hcuge.ch) Pfam (www.sanger.ac.uk/Pfam),(3) 三维结构数据库,PDB( )等。 与蛋白质结构有关的数据库还有: SCOP( )等。 与基因组有关的数据库: OMIM(/omim/),4. 最重要的任务从数据中提取新知识,生物信息学最重

32、要的任务,是从海量数据中提取新知识。 这首先是从DNA序列中识别编码蛋白质的基因,以及调控基因表达的各种信号。 其次,从基因组编码序列翻译出的蛋白质序列; 数目急剧增加,根本不可能用实验方法一一确定它们的结构和功能。 从已经积累的数据和知识出发,预测蛋白质的结构和功能,成为常规的研究任务。,核酸序列搜索软件,Genbank () Entrez BLAST EMBL (European Molecular Biology Laboratory, www.ebi.ac.uk) SRS : srs.ebi.ac.uk , www.sanger.ac.uk/sr

33、s6/,(1) 序列比较和数据库搜索软件之一,BLAST(Basic Local Alignment Searching Tool) 该工具利用了retrieval system 可以搜索世界上最大的核酸数据库EMBL+Genbank+DDBJ,最大的蛋白质数据库等。 我们可以输入一段DNA、RNA、蛋白序列,一段插入序列、tRNA序列、与HIV相关的序列等,从而分析这段序列的同源性,再根据同源性推论出它所具有的功能。 还可以通过输入一段DNA序列,而知道它所编码的蛋白质的功能,以及它来源与是什么生物。,(2)序列比较和数据库搜索软件之二,FASTA 96年推出的FASTA3实现了高度的并行化

34、,能够在多CPU的计算机上将搜索速度提高数倍,还支持并行虚拟机器技术(Parallel Virtual Machine),增加了并行网络计算机制。 多序列比较软件(Mulitple Alignment)(用户可以同时输入多个序列),第四节 DNA多态性及其意义,DNA多态性:除同卵双生的两个体外,没有两个人的DNA组成是完全相同的,即人类DNA组成具有多态性。 如果比较随机的十个人的常染色体的非编码区,就会发现约200400bp就有一个核苷酸不同,这些可变区域即称为DNA多态性 (DNA polymorphism)位点 DNA多态性标记的价值 为路标,构建DNA标记的遗传连锁图谱; 使遗传图谱

35、从直接可见的表型多样性标记进步到DNA分子本身多态性标记,1. DNA位点的多态性(DNA site polymorphism),这种多态性是由控制某些性状的DNA碱基差异造成的。如人的白细胞抗原(HLA)仅其HLA-DR抗原就有6个位点、60多个等位基因(等位基因多态性)。,DNA位点的多态性导致限制性内切酶切割位点的差异,即限制性片段长度多态性(restriction fragment length polymorphism,RFLP) RFLP是第一代DNA遗传学标记,由此发展成了RFLP技术(酶切、电泳、转膜、探针杂交,探针为基因序列或cDNA),一、DNA多态性的种类,2. 串连重复

36、顺序多态性,串连重复顺序的核心顺序重复的次数差异,即可变数串连重复(variable number tandom repeats,VNTR),VNTR及重复顺序中的插入小片段导致了串连重复顺序多态性。,DNA指纹分析(DNA fingerprint),亦是RFLP技术的特殊型,由于串连重复顺序的核心顺序两侧的序列是没有个体差异的,因此使用限制性内切可切下重复顺序,选用特定的探针(高拷贝的小卫星、微卫星或人工合成的简短重复顺序等),能获得个体特异的指纹图谱。,VNTR和位点多态性亦符合孟德尔遗传规则,故指纹分析可作为遗传病诊断、法医个体鉴定、亲子鉴定,微卫星标记第二代DNA标记,微卫星DNA(microsatellite DNA)或称简短串连重复(short tandem repeat, STR),由26个核苷酸的重复顺序组成,如(CA)n、(GA)n、(TA)n,n为1530具有多态性,卫星长度常小于100bp,大量分布每条染色体。 由于STR的核心顺序两侧的序列是没有个体差异且长度各不相同,因此,以此两侧序列为PCR引物,能获得个体特异的指纹图谱(亦称全基因扫描)。 6000个STR标记作图,96年已全部完成 全基因扫描目前已半自动化,单核苷酸多态性(single nucleotide polymorphism, SNP):指发生在基因组序列中单个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论