版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分子生物学基因与基因组第一页,共六十页,2022年,8月28日教学目的和要求1.掌握基因、基因组、断裂基因、基因家族、内含子、外显子等基本概念。2.掌握原核生物与真核生物基因组的结构特点。3.理解基因组复杂度。第二页,共六十页,2022年,8月28日主要内容第1节基因与基因组第2节
病毒基因组第3节原核生物基因组第4节真核生物基因组第三页,共六十页,2022年,8月28日第1节基因与基因组一、核酸的特性二、基因的概念三、基因的命名四、基因组第四页,共六十页,2022年,8月28日一、核酸的特性紫外吸收减色效应/增色效应核酸定量DNA纯度热变性复性第五页,共六十页,2022年,8月28日UVabsorption紫外吸收
芳香族碱基
DNA和RNA的最大吸收峰为260nm应用:检测,定量,纯度估计第六页,共六十页,2022年,8月28日减色效应/增色效应减色效应:因碱基在疏水环境中的堆积,使碱基对紫外的吸收能力下降。
dsDNA<ssDNA/RNA,<nucleotide
(核苷酸)第七页,共六十页,2022年,8月28日核酸定量消光系数:1mg/mldsDNAhasanA260of20(OD1=50ug/ml) ssDNAandRNA=25(OD1=40ug/ml)DNA(RNA)浓度(ug/ml)=OD260×50ug/ml(40ug/ml)×稀释倍数A260值是所有不同碱基对光吸收的总和。由于减色效应,光吸收值也取决给定分子的二级结构的数量第八页,共六十页,2022年,8月28日DNA纯度
A260/A280:pure
dsDNA--1.8pureRNA--2.0protein--0.5第九页,共六十页,2022年,8月28日第十页,共六十页,2022年,8月28日Tm:变性过程紫外线吸收值增加到中点时的温度称为融解温度。影响因素:G+C含量,pH值,离子强度,尿素,甲酰胺等DNA:Tm=69.3+0.41(G+C)
%第十一页,共六十页,2022年,8月28日第十二页,共六十页,2022年,8月28日6.Renaturation复性:退火处理(慢速冷却)使得互补链互相配对,恢复双链结构为DNA复性
Hybridization(杂交):
不同核酸链之间的互补部分的复性。第十三页,共六十页,2022年,8月28日
基因(gene):原核生物、真核生物以及病毒的DNA和RNA分子中具有遗传效应的核苷酸序列,是遗传的基本单位。
二、基因的概念在细菌中:指编码一个蛋白质或RNA的遗传功能单位;在真核细胞中:指编码一个或多个产物的,或对某一个产物产生有贡献的一个转录单位。第十四页,共六十页,2022年,8月28日1、基因与DNA基因是DNA分子上的功能单位:遗传单位、交换单位、突变单位一个基因=一个顺反子=突变单位+重组单位顺反子:一段核苷酸序列,能编码一条完整多肽链(具有生物学活性)。第十五页,共六十页,2022年,8月28日基因的DNA共性:从细菌到哺乳动物的全部生命有机体的基因都是由DNA构成的。在分子水平上,所有生物DNA基本结构都一致,称为共性。但是,它们的DNA序列上的不同形成了千差万别的生物界。因此,来自两种生命形态的基因(DNA)可以相互融合重组。第十六页,共六十页,2022年,8月28日2、基因与多肽链基因的主要编码产物是多肽链,另外还包括许多编码RNA的基因,如:rRNA基因、tRNA基因以及其它小分子RNA基因等。一种基因一种酶(1941)基因的碱基序列与蛋白质分子中氨基酸的序列之间的对应关系是通过遗传密码实现的。第十七页,共六十页,2022年,8月28日3、基因的结构编码区(codingregions),开放阅读框(openreadingframe,ORF):可以翻译成蛋白质的DNA区域。在细菌中即为一个基因;在真核细胞中,编码区可被内含子隔断。非编码区(internalnoncodingregions),非翻译区(untranslatedregions,UTRs):转录单位中不能翻译成蛋白质的部分。在编码区或操纵子两侧的UTRs为5’和3’UTRs(或称为前导和尾随序列)。第十八页,共六十页,2022年,8月28日操纵子(operator):包含几个基因及其共同调控元件的细菌基因座。基因座(locus):一个基因在染色体、物理图、遗传图上的位置,包括两侧的调控元件。基因座本义指任何标记物的位置,包括基因、调控元件、复制起始区、细胞遗传学中的标记等。第十九页,共六十页,2022年,8月28日NCNCNC5’5’3’3’转录
翻译5’UTR3’UTRUTRUTRgene1gene3gene2原核细胞编码蛋白质基因的典型结构在细菌中,同一转录单位包含多个基因,每一个基因编码一条独立的多肽链。RNADNA翻译翻译protein第二十页,共六十页,2022年,8月28日真核细胞编码蛋白质基因的典型结构在真核生物中,转录单位由单个基因组成。成熟的转录物编码单个多肽链,但不同的剪接方式可产生一系列不同的产物。NC5’3’转录5’UTR3’UTRintronintronexon1exon3exon2前体RNADNA翻译protein编码区域5’3’mRNARNA加工(剪接、转运)7meGAAAAAAAAAAAA第二十一页,共六十页,2022年,8月28日Theprocessingofa45SrRNAprecursormoleculeintothreeseparateribosomalRNAs.NearlyhalfofthenucleotidesequencesintheprimaryRNAtranscriptaredegradedinthenucleus.第二十二页,共六十页,2022年,8月28日外显子(exon):基因中编码的序列,转录单位余下部分通过剪接结合起来并表达的区域,是基因中对应于mRNA序列的区域。内含子(intron):基因中不编码的、打断转录单位的间插序列,必需在RNA水平上去除。第二十三页,共六十页,2022年,8月28日物种命名方式举例E.coli和其它细菌三个斜体小写字母表示一个操纵子,接着斜体大写字母表示不同的基因座。lac-乳糖操纵子:基因座-lacZ、lacY、lacA;表达产物蛋白质-lacZ、lacY、lacA质粒和其它染色体外的成分自然产生的质粒:用三个正字母表示,首字母大写重组质粒:在大写字母前加一个p(大写字母表示构建质粒的研究者或单位)ColEIpSC101(SC:StanleyCohen)酵母用三个大写斜体字母表示基因功能,后面数字表示不同的基因座啤酒酵母基因:GAL4、CDC28脊椎动物以描述基因功能的1-4个小写字母和数字表示其基因功能基因:sey、myc;蛋白质:Sey、Myc人方法同脊椎动物,但需要大写基因:MYC、ENO1;蛋白质:MYC、ENO1三、基因的命名第二十四页,共六十页,2022年,8月28日四、基因组1.基因组的概念
是指一种生物体中的整套遗传信息,一般为一个受精卵或一个体细胞的细胞核中所有DNA分子的总和。一特定生物体的整套(单倍体)遗传物质的总和。基因组的大小用全部DNA的碱基对总数表示。每种真核生物的单倍体基因组中的全部DNA量称为C值(C-Value)。第二十五页,共六十页,2022年,8月28日三、基因组2.基因、核酸片段大小表示法:单链核酸:碱基数nucleotide,nt
双链核酸:碱基对basepair,bp
千碱基对kilobasepair,Kb
兆碱基对megabasepair,Mb1Mb=1000Kb=1000000bp
例如:乙肝病毒基因组DNA有3200bp或3.2Kb。痘病毒基因组DNA有300Kb。第二十六页,共六十页,2022年,8月28日生物界C值大小规律:
病毒细菌真菌动植物
进化程度递增,C值递增
3.基因组大小与C值矛盾随着生物的进化,生物体的结构和功能越来越复杂,其C值就越大。第二十七页,共六十页,2022年,8月28日28
3-2102cm1.2第二十八页,共六十页,2022年,8月28日29
然而另一方面,随着进一步的进化,生物体复杂性和DNA含量之间的关系变模糊了,出现了很多令人不解的现象。一些生物类群基因组大小的变化范围很窄,而另一些类群的变化范围则很宽。突出的例子是两栖动物,C值小的可以低至109bp以下,C值大的可以高达1011bp。而哺乳动物的C值均为109bp的数量级。人们很难相信不同的两栖动物,所需基因的数量会有100倍的差别,而且两栖动物的结构和功能会比哺乳动物更复杂。
3.基因组大小与C值矛盾
第二十九页,共六十页,2022年,8月28日由于人们无法用已知功能来解释基因组的DNA含量,所以产生了C值矛盾(Cvalueparadox,又称C值悖理)。
C值矛盾(Cvalueparadox,C值悖论):生物体的进化程度与基因组大小(C值)之间不完全成比例的现象。3.基因组大小与C值矛盾
第三十页,共六十页,2022年,8月28日病毒是由一个或几个核酸分子组成的基因组,有一层蛋白或脂蛋白保护性外壳,且可在一定宿主细胞中自我复制的感染性因子。第2节病毒基因组第三十一页,共六十页,2022年,8月28日一、病毒基因组的类型双链DNA病毒——乙肝病毒单链DNA病毒——微小病毒双链RNA病毒——动物呼肠孤病毒单链(+或-)RNA病毒——逆转录病毒DNA病毒RNA病毒第三十二页,共六十页,2022年,8月28日遗传物质:DNA或RNA,单倍体(反转录病毒除外);基因组很小,但相差较大;基因重叠;编码效率高、非编码区小;基因往往丛集形成一个功能单位或转录单元;噬菌体的基因是连续的。二、病毒基因组的基本特点重叠基因(overlappinggene):两个基因的核苷酸序列完全重叠或部分重叠的情况,即一段核苷酸片段被两个基因重复使用的现象。第三十三页,共六十页,2022年,8月28日34
①部分重叠
K和C
②两个基因共用少数碱基对
如:A*和CD和J-------ATGA-------
CStartcodon-------TAATG-------
A*
Stopcodon
DStopcodonJ
Startcodon
第三十四页,共六十页,2022年,8月28日一、原核生物基因组的特点拟核(类核)结构;基因组相对较小,由DNA组成,包括染色体DNA和质粒DNA两种DNA分子,均为共价闭环双链。染色体DNA为单拷贝存在多顺反子结构;功能相关的基因常常组织形成操纵子结构,操纵子结构是原核基因组的一个突出的结构特点。除RNA基因外,基本是单拷贝的;利于核糖体的快速组装,短时间内合成大量核糖体。结构基因通常为连续基因,非编码区和重复序列少;存在不同的功能识别区,每个DNA分子(染色体DNA和质粒DNA)只有一个复制起始点。复制起始区、复制终止区等含可转移的序列,如插入序列、转座子等。第3节原核生物基因组第三十五页,共六十页,2022年,8月28日Bacterialchromosome细菌染色体Nucleoid第三十六页,共六十页,2022年,8月28日Negativelysupercoiled(负超螺旋)asawhole核中央由支架蛋白和RNA组成,环状双链DNA绕在支架蛋白的外围,只有一个复制起点,DNA与细胞膜粘在一起,DNA上有结合蛋白。第三十七页,共六十页,2022年,8月28日原核生物基因组第三十八页,共六十页,2022年,8月28日一、真核生物基因组特点:真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,体细胞是双倍体(diploid),即有两份同源的基因组。真核细胞基因转录产物为单顺反子。存在重复序列,重复次数可达百万次以上。基因组中不编码的区域多于编码区域。大部分基因含有内含子,因此,基因是不连续的。基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。第4节真核生物基因组第三十九页,共六十页,2022年,8月28日二、基因组的复杂度GenomicDNAextractionSonicationorshearingtoauniformsize(x100-1000bp)
ThermalDenaturation
Re-annealingMeasure&plottingthere-annealingprocesswillyieldkinetics1.复性动力学曲线第四十页,共六十页,2022年,8月28日Measuringmethods:Spectroscopy/UVabsorptionhydroxyapatite(羟[基]磷灰石)chromotographyD4GenomeComplexityHighlyrepetitiveDNAmoderatelyrepetitiveDNAuniqueDNAHumanE.coli第四十一页,共六十页,2022年,8月28日二、基因组的复杂度1)据基因组重复次数高低:重复序列
UniquesequenceDNA单一序列DNA1~101
moderatelyrepetitiveDNA中度重复序列10~105
HighlyrepetitiveDNA高度重复序列
>106第四十二页,共六十页,2022年,8月28日UniquesequenceDNA
单一序列DNA复性最慢在基因组中有一个或几个拷贝。真核生物的大多数基因在单倍体中都是单拷贝的。如:蛋清蛋白、血红蛋白等)单一序列中储存了巨大的遗传信息,编码各种不同功能的蛋白质。
第四十三页,共六十页,2022年,8月28日moderatelyrepetitiveDNA
中度重复序列中度重复序列是指在基因组中重复十几次至几十万次的部分,其复性速度快于单拷贝序列,但慢于高度重复序列。中度重复序列在基因组中所占比例在不同种属之间差异很大,一般为12~35%,人类基因组中约占12%。第四十四页,共六十页,2022年,8月28日moderatelyrepetitiveDNA
中度重复序列Tandemgeneclusters
(串联基因簇):
通常是其基因产物需求量很高的基因,如rRNA基因、组蛋白基因、免疫球蛋白基因、tRNA基因等,这些结构基因常常以串联形式排列在基因组中,故也属于串联重复序列第四十五页,共六十页,2022年,8月28日各种生物组蛋白基因在基因组中重复频率不同。如海胆中的组蛋白基因重复300~1000次,果蝇的重复约110次,人的组蛋白基因重复30~40次。第四十六页,共六十页,2022年,8月28日第四十七页,共六十页,2022年,8月28日moderatelyrepetitiveDNA
中度重复序列DispersedrepetitiveDNA
(离散重复序列)分散在整个基因组中Shortinterspersedelements(短散布元件)+longinterspersedelements(长散布元件)灵长类所特有的Alu重复序列家族:300bp,300000–500000copiesof80-90%identity(短散布元件)KpnⅠ重复序列家族(长散布元件):重复单位一般为6~7kbFunctionsoftheserepetitiveDNA:largelyunknown第四十八页,共六十页,2022年,8月28日在单倍体人基因组中有5×105个拷贝,约占人基因组的3-6%。每个重复单元的长度为300bp,含一个Alu酶切位点,因而得名。酶切后生成130bp和170bp两个片段,每个Alu片段两侧有6-20bp的同向重复序列,存在于间隔区(space)和内含子中。功能:可能与基因转录、调控、加工有关。
第四十九页,共六十页,2022年,8月28日HighlyrepetitiveDNA
高度重复序列
重复次数>106
,序列较短,大部分集中在异染色质中(中心粒和端粒的附近)真核生物中含10~20%。特点:A、T含量高,序列简单,不转录.
其功能尚不清楚。
如SatelliteDNA
(卫星DNA)第五十页,共六十页,2022年,8月28日HighlyrepetitiveDNA
高度重复序列SatelliteDNA
(卫星DNA,simplesequence,随体DNA):
含有异常的碱基,在密度梯度离心中形成一种区别于其它DNA的卫星条带。卫星DNA的重复单位一般由2~10bp组成,成串排列。卫星DNA占基因组的比例随种属而异,在0.5~31%范围内。
第五十一页,共六十页,2022年,8月28日SatelliteDNAMousegenomeDNA30%GCinsatelliteDNAD4GenomeComplexityCsClcentrifugation第五十二页,共六十页,2022年,8月28日人类基因组中可分离出三类卫星DNA,共占人类基因组的5~6%:大卫星DNA(macrosatelliteDNA):其重复单位为5~171bp,主要分布于染色体的着丝粒区。小卫星DNA(minisatelliteDNA):其重复单位为15~70bp,存在于常染色。微卫星DNA(microsatelliteDNA):
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《简·爱》读书笔记500字10篇
- 2021员工个人工作总结5篇
- 在企业的实习报告模板五篇
- 敬老院志愿活动个人总结五篇
- 庆祝中国人民警察节心得作文
- 电视台实习报告模板集合10篇
- 2024年新型企业食堂租赁及运营合作协议书3篇
- 小学语文教师工作评价
- “两个结合”视域下课程思政融入通识课的路径探索
- 电梯维修工培训资料
- 汉庭酒店经营模式分析
- CRTSIII型板式无砟轨道专项施工施工方法及工艺要求
- 新人教版数学一年级下册第四单元《100以内数的认识》教材解读
- 城市轨道交通接触网概述
- MOOC 外科护理学-中山大学 中国大学慕课答案
- 白山市长白朝鲜族自治县招聘边境村稳边固边公益性岗位人员笔试真题2023
- 特种设备使用管理新版规则
- 中国矿业权评估准则(2011年)
- 人教部编本八年级语文上册第六单元复习课件共26张
- 2024年土地管理法
- 医学统计学:医学统计学课后习题答案
评论
0/150
提交评论