基因组学课件_第1页
基因组学课件_第2页
基因组学课件_第3页
基因组学课件_第4页
基因组学课件_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章基因组.1.1遗传的分子基础1.2基因组序列的复杂性1.3基因与基因家族1.4

基因组.1.1遗传的分子基础1.2基因组序列的复杂性1.2.1C值和C值悖理或C值矛盾(C-valueparadox)C值

一个单倍体基因组中DNA的总量,可以用bp或者pg表示,1pg=978MbC值悖理

生物基因组的大小与生物进化程度没有直接相关性的现象.4低等生物基因组大小与生物复杂性呈正相关,而高等生物中这种关系并不一致,why?

值矛盾C.1.2.2序列复杂性(complexity)顺序复杂性:基因组中不同序列的DNA总长,用bp表示复杂性代表一个物种的基本特征,可以通过DNA复性动力学描述。基因组的复杂性通过计算变性基因组到复性所需要的时间来估计通常以C0t1/2表示特定DNA的序列复杂性。C0t1/2代表单链DNA起始浓度X半数DNA复性所需时间tC0t1/2值越大,表示复性速率越慢,基因组的复杂程度越高.61.2.3基因组的序列组成不重复序列/单拷贝序列(singlecopysequence)(基因组中的缓慢复性组分)一般只有1个或几个拷贝不同生物基因组中单拷贝序列所占的比例是不同的大多数编码蛋白质的基因都属于单拷贝基因随着基因组大小的增加,单拷贝序列的长度也增加两栖类和植物基因组C值的增加并非是单拷贝序列的增加,而是重复序列DNA比例的增加.7中度重复序列(moderatelyrepetitivesequence)(基因组中的居间复性组分)

10-105/genome,100-几千bp/copy

占总DNA的10%-40%,大多不编码蛋白质

哺乳类基因组包含两大类中度重复序列“1)短散在元件2)长散在元件.81)短散在元件(shortinterspersednuclearelements,SINEs)平均长度约为300bp,拷贝数可达10万左右;与平均长度约为1000bp的单拷贝顺序间隔排列;

Alu家族、Hinf家族.2)长散在元件(longinterspersednuclearelements,LINEs)长度约为3500-5000bp,拷贝数约为1万;含有长度不等的间隔序列;人基因组中所有LINES之间的平均距离为2.2kb,拷贝数约10000,如KpnⅠ家族等。.高度重复序列(highlyrepetitiveDNA)(基因组中的快速复性组分)

重复序列在染色体上有两种组织形式:散布重复(interspersedrepeat)和串联重复(tandemrepeat)

高度重复序列都是串联重复DNA,都是由极其相似的重复拷贝首尾相接串联排列而成.11

高度重复序列的分类

可分为:1)卫星DNA(satelliteDNA)2)小卫星DNA(minisatelliteDNA)3)微卫星DNA(microsatelliteDNA).

1)卫星DNA(satelliteDNA)DNA在CsCl密度梯度离心时,由于重复序列GC和AT的比率差异,在DNA主峰旁形成卫星DNA峰卫星DNA重复单位大小为6-100bp,可重复高达106主要位于染色体的着丝粒,不转录,人类基因组卫星DNA.132)小卫星DNA(minisatelliteDNA)重复单位不超过25bp,可形成长达20kb的聚集区通常位于染色体端粒或靠近染色体末端的区域人类端粒含有5'TTAGGG3'端粒DNA在DNA复制中具有重要功能.143)微卫星DNA(microsatelliteDNA)又叫SSR(simplesequencerepeat)/STR(shorttandemrepeat)简单的重复单位组成的小序列重复单位2-6bp,可重复3-100次,

常见(AC)n,(TG)n遗传上可用作分子标记.15不同生物基因组的序列组成.161.3基因与基因家族1.3.1基因编码RNA的基因和编码蛋白质的基因

大多数编码RNA的基因是多拷贝的why?

编码蛋白质的基因一般是单拷贝的编码RNA的基因有6种,包括rRNA基因,rRNA基因,scRNA基因,snRNA基因,snoRNA基因以及miRNA基因.2024/2/8rRNA基因(rDNA)一般成簇排列在端粒区或者着丝粒区附近真核生物的rDNA形成18S-5.8S-28S的基因簇,5SrDNA是分开活跃转录的rRNA基因簇.2024/2/8tRNA基因的基因拷贝数与与tRNA的丰度呈正相关tRNA基因拷贝数与氨基酸出现频率呈线性相关.miRNA基因大多也为多拷贝的.1.3.2编码蛋白质的基因N值悖理生物种属所具有的基因数目与其生物结构的复杂性不成比例的现象被称为N值悖理(N-valueparadox)20000-25000450001950013600why?.2024/2/8真核基因是断裂基因(splitgene)高等生物内含子较多,多数内含子比外显子长,低等生物内含子较少且内含子一般较短不同种属的同一基因外显子比较保守,内含子变异较大;外显子的长度一般小于300bp,内含子长度较大断裂基因使交替剪接(alternativesplicing)成为可能.2024/2/81.3.3异常结构基因1)重叠基因(overlappinggene)是指两个或两个以上的基因共有一段DNA序列

在结构紧凑的病毒基因组,某些高等生物线粒体基因组和核基因组中发现.φX174基因组中的重叠基因.人类核基因组重叠基因人类INK4a/ARF基因座含两个重叠基因:p14/ARF和p16/INK4a.这两个基因分别由两个独立的启动子调控,共享外显子2和3,p14/ARF含外显子1β,p16/INK4a含外显子α..2024/2/82)基因内基因(genes-within-genes)

一个基因的内含子包含其他基因,在核基因组中很普遍.人类NF1基因内含子中的3个独立表达的基因

人类神经成纤维细胞瘤1(neurofubromatosis1)基因编码GTPase的激酶,是致癌基因RAS的负调控因子,长350kb,60个内含子,蛋白质产物2839aa.27号内含子编码3个独立表达的基因..2024/2/83)反义基因(antisensegene)与已知基因编码序列互补的负链编码的基因

人类基因组大约有1600个反义基因...玉米自交不亲合(S)反义基因.2024/2/81.3.4假基因(pseudogene)假基因指来源于功能基因但已失去活性的DNA序列分为三类:

1)重复的假基因(duplicatedpseudogene)

由基因复制产生,但基因突变使失去功能

2)加工的假基因(processedpseudogene)

由RNA反转录为cDNA后再整合到基因组中3)残缺基因(truncatedgene)

缺失了基因片段,常位于基因家族内部,由不等交换及重排产生.2024/2/8.2024/2/8假基因是否有功能?

有些假基因是可以转录的,特别是起源于重复基因的假基因和获得启动子的加工的假基因。转录的假基因产生残缺的蛋白,失去了原有的功能,但可能产生新的功能,例如:

A.产生反义RNA,抑制靶基因功能B.在RNA水平与正常基因的mRNA竞争,起调控作用,如软体动物Lymnaeastagnalis的神经细胞NOS合成酶假基因产物抑制NOS酶的合成。

C.在DNA水平与正常基因竞争转录因子,起抑制作用,如老鼠的Makorin1基因的转录..2024/2/81.3.5基因家族(genefamily)

真核生物基因组中有许多来源相同、结构相似、功能相关的基因,这样的一组基因称为基因家族。例如:组蛋白基因家族、珠蛋白基因家族、免疫

球蛋白基因家族等基因家族是由基因的复制然后趋异产生的,是增加基因组复杂性的途径之一比较基因家族各个成员间的序列差异,可追踪基因的演变轨迹.2024/2/81.4基因组真核生物基因组特征

1)结构松弛,含

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论