




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基因组、基因组学与转录组学,第一节 基因,1958年提出“中心法则”,通过DNA复制,生物体的遗传信息传给子代,通过转录和翻译,遗传信息传给RNA和蛋白质,从而决定生物的表现。 中心法则,The Central Dogma of Molecular Biology,中心法则 (The Central Dogma),转 录,翻 译,逆转录,复 制,DNA,RNA,蛋白质,基因是遗传的基本单位,一个基因一种酶 顺反子理论 操纵子学说 现代基因概念 基因是核酸分子中贮存遗传信息的基本单位,是RNA和蛋白质相关遗传信息的基本存在形式,是指编码RNA和蛋白质多肽链序列信息以及表达这些信息所需的全部核苷酸
2、序列,大部分生物中构成基因的核酸物质是DNA,少数生物(如RNA病毒等)是RNA。,除了某些以RNA为基因组的RNA病毒外,基因通常是指染色体或基因组的一段DNA序列。,基因(gene):编码蛋白质或RNA等具有特定功能产物的、负载遗传信息的基本单位。,基因组(genome):一个细胞或一个生物体内所有遗传信息的总和。,人类基因组包含了细胞核染色体DNA(常染色体和性染色体)及线粒体DNA所携带的所有遗传物质。,利用碱基的不同排列荷载遗传信息。 通过复制将遗传信息稳定、忠实地遗传给子代细胞,在这一过程中为适应环境变化,可能会发生基因突变。 作为基因表达(gene expression)的模板,
3、使其所携带的遗传信息通过各种RNA和蛋白质在细胞内有序合成而表现出来。,基因的功能,单个基因的组成结构及一个完整的生物体内基因的组织排列方式统称为基因组构(gene organization)。,与基因功能相关的结构,编码区序列(coding region sequence ),非编码序列(non-coding sequence),基因表达需要的调控区(regulatory region)序列,包括启动子(promoter)、增强子(enhancer)等。,在细胞内表达为蛋白质或功能RNA的DNA序列,一、真核基因的基本结构,编码蛋白质或RNA的编码序列。,非编码序列,包括编码区两侧的调控序列
4、和编码序列间的间隔序列。,真核基因结构不连续,为断裂基因(split gene)。,真核基因结构,外显子(exon);在基因序列中,出现在成熟mRNA分子上的序列。 内含子(intron):外显子之间、与mRNA剪接过程中被删除部分相对应的间隔序列。,真核生物绝大部分编码蛋白质的基因都有内含子。编码rRNA和一些tRNA的基因也都有内含子。 内含子的数量和大小决定了真核基因的大小。不同种属中,外显子序列通常比较保守,而内含子序列则变异较大。 外显子与内含子接头处有一段高度保守的序列,这一共有序列是真核基因中RNA剪接的识别信号。,基因的5端称之为上游,3端称为下游 基因序列中开始RNA链合成的
5、第一个核苷酸所对应的碱基记为+1,此碱基上游的序列记为负数,下游的序列记为正数。,二、调控序列参与真核基因表达调控,位于基因转录区前后,对基因表达起调控作用的区域,因其是紧邻的DNA序列,又称旁侧序列。,基因的调控区(顺式作用元件),转录起始点,TATA盒,CAAT盒,GC盒,增强子,AATAAA,剪接加尾,转录终止点,修饰点,外显子,翻译起始点,内含子,OCT-1,OCT-1:ATTTGCAT八聚体,+1,结构基因,启动子,上游启动子元件,启动子 上游调控元件 增强子 加尾信号 细胞信号反应元件,顺式作用元件,反式作用因子:顺式作用元件的作用需要通过结合相应的蛋白因子(多为转录因子)方可实现
6、,而这些蛋白质一般由位于另外的染色体或同一染色体远距离部位的基因编码,因而被称为反式作用因子。,1. 启动子提供转录起始信号,启动子是DNA分子上能够介导RNA聚合酶结合并形成转录起始复合体的序列。,多数启动子位于真核细胞基因转录起点的上游,启动子本身通常不被转录。 少数启动子(如编码tRNA基因的启动子)位于转录起始点的下游,这些DNA序列可以被转录。,能够在相对于启动子的任何方向和位置(上游或者下游)上发挥这种增强作用,大部分位于上游。 增强子序列距离所调控基因距离近者几十个碱基对,远的可达几千个碱基对。 通常数个增强子序列形成一簇。 有时增强子序列也可位于内含子之中。 不同的增强子序列结
7、合不同的调节蛋白。,2. 增强子增强邻近基因的转录,增强子是增强真核基因启动子工作效率的顺式作用元件,是真核基因中最重要的调控序列,决定着每一个基因在细胞内的表达水平。,沉默子(silencer)是抑制基因转录的特定DNA序列,当其结合一些反式作用因子时对基因的转录起阻遏作用,使基因沉默。,3. 沉默子是负调节元件,基因组,第二节,基因组:细胞或生物体的一套完整单倍体遗传物质的总和。,一、真核基因组具有独特的结构,基因的编码序列所占比例远小于非编码序列。 高等真核生物基因组含有大量的重复序列, 真核基因组中存在多基因家族和假基因。 大多基因具有可变剪接,80%的可变剪接会使蛋白质的序列发生改变
8、。 基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞的基因组为二倍体。,结构特点:,二、真核基因组中存在大量重复序列,高度重复序列(highly repetitive sequence) 中度重复序列(moderately repetitive sequence) 单拷贝序列(single copy sequence)或低度重复序列,(一)高度重复序列,主要存在于染色体的着丝粒区域,重复单位一般由210 bp组成,成串排列,在人基因组中约占5%6%。,重复频率可达105以上,不编码蛋白质或RNA。,反向重复序列(inverted repeat sequence),卫星D
9、NA(satellite DNA),两个相同顺序的互补拷贝在同一DNA链上反向排列而成,重复单位长度约300 bp,多数散在于基因组中,总长度约占人基因组的20 。,分类:,参与复制水平的调节 存在于DNA复制起点区的附近,是一些蛋白质(包括酶)的结合位点。 参与基因表达的调控 可以转录到核内不均一RNA分子中,有些反向重复序列可以形成发夹结构,有助于稳定RNA分子。 参与染色体配对 如卫星DNA成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关。,功能:,(二)中度重复序列,重复数十至数千次,大多数与单拷贝基因间隔排列。,短分散重复片段,长分散重复片段,平均长度约300 bp
10、500 bp,与长度约为1000 bp的单拷贝序列间隔排列。拷贝数可达数十万。如Alu家族、KpnI家族、Hinf家族。,平均长度为3500 bp5000bp,与长度约为13000bp的单拷贝序列间隔排列。,rRNA基因重复序列属于中度重复序列,各重复单位中的rRNA基因都是相同的。 rRNA基因集中成簇存在,这样的区域称为rDNA区。 人类的rRNA基因位于13、14、15、21和22号染色体的核仁组织区,每个核仁组织区平均含有50个rRNA基因的重复单位。 5SrRNA基因似乎全部位于1号染色体,每个单倍体基因组约有1000个5SrRNA基因。,在单倍体基因组中只出现一次或数次,大多数为蛋
11、白质编码的基因。,(三)单拷贝序列(低度重复序列),三、真核基因组中存在大量的多基因家族与假基因,多基因家族是指由某一祖先基因经过重复和变异所产生的一组在结构上相似、功能相关的基因。,基因家族成簇地分布在某一条染色体上,同时发挥作用,合成某些蛋白质。如组蛋白基因家族。 基因家族的不同成员成簇地分布于不同染色体上,编码一组功能上紧密相关的蛋白质。如球蛋白基因家族。,DNA序列相似,但功能不一定相关的若干个单拷贝基因或若干组基因家族总称。,基因超家族 ( gene superfamily ),基因组中存在的一段与正常基因非常相似但不能表达的DNA序列。以来表示。,假基因(psuedogene),四
12、、线粒体DNA结构有别于染色体DNA,线粒体DNA(mitochondrial DNA,mtDNA)是核外遗传物质,能独立编码线粒体中的一些蛋白质。 mtDNA的结构为环状分子,与原核生物的DNA类似,结构特点也与原核生物相似。,人的线粒体基因组,线粒体基因组编码37个基因,包括13个编码呼吸链多酶体系的一些多肽的基因、22个编码mt-tRNA的基因、2个编码mt-rRNA(16S和12S)的基因。,第三节基因组学 Genomics,基因组(genome) 一个细胞(或病毒)所载的全部遗传信息,它代表了一种生物所具有的全部遗传信息。对真核生物体而言,基因组是指一套完整单倍体DNA(染色体DNA
13、)及线粒体或叶绿体DNA的全部序列,既有编码序列,也有大量存在的非编码序列。,基因组学(genomics) 是阐明整个基因组的结构、结构与功能关系以及基因之间相互作用的科学。,一、基因组学包含结构基因组学、功能基因组学和比较基因组学,基因组学包括3个不同的亚领域 结构基因组学(structural genomics) 功能基因组学(functional genomics) 比较基因组学(comparative genomics),基因组学概念,二、结构基因组学的主要任务是基因组作图和大规模测序,结构基因组学(structural genomics)是通过HGP(human genome pro
14、ject)的实施来完成的。 HGP的内容就是制作高分辨率的人类遗传图和物理图,最终完成人类和其它重要模式生物全部基因组DNA序列测定,因此HGP属于结构基因组学范畴。,(一)遗传作图和物理作图是绘制人类基因组草图的重要策略,1遗传作图就是绘制连锁图,遗传图(genetic map)又称连锁图(linkage map)。遗传作图(genetic mapping)就是确定连锁的遗传标志位点在一条染色体上的排列顺序以及它们之间的相对遗传距离,用厘摩尔根(centi-Morgan,cM)表示,当两个遗传标记之间的重组值为1%时,图距即为1 cM。,(1)限制性片段长度多态性(RFLP),(2) 可变数
15、目串联重复序列(VNTR),(3)单核苷酸多态性(SNP),2物理作图就是描绘杂交图、限制性酶切图及克隆系图,物理作图包括:, 荧光原位杂交图(fluorescent in situ hybridization map,FISH map):将荧光标记的探针与染色体杂交确定分子标记所在的位置; 限制性酶切图(restriction map);将限制性酶切位点标定在DNA分子的相对位置; 克隆相连重叠群图(clone contig map),酵母人工染色体(yeast artificial chromosome,YAC) 细菌人工染色体(bacterial artificial chromosom
16、e,BAC),(二)通过BAC克隆系、鸟枪法等完成大规模DNA测序,1BAC克隆系的构建是大规模DNA测序的基础,BAC是一种装载DNA大片段的克隆载体系统,用于人、动物和植物基因组文库构建。BAC具有插入片段较大(数kb数百 kb)、嵌合率低、遗传稳定性好、易于操作等优点。,2鸟枪法是大规模DNA测序的重要方法,步骤:, 建立高度随机、插入片段大小为1.6 kb到4 kb左右的基因组文库; 高效、大规模的克隆双向测序; 序列组装(sequence assembly):借助软件将所测得的序列进行组装,产生一定数量的相连重叠群; 缺口填补:利用引物延伸或其他方法对BAC克隆中还存在的缺口进行填补
17、。,3高通量测序技术大大加快了基因组DNA测序进度,鸟枪法测序的原理与策略,(三)生物信息学是预测基因组结构和功能的重要手段,三大生物信息中心:,美国国家生物技术信息中心(NCBI,) 欧洲生物信息研究所(EBI,http:/ebi.ac.uk) 日本DNA数据库(DDBJ,http:/www.ddbj.nig.ac.jp),GenBank(/Genbank)是NIH的基因序列数据库,包含所有已知的核苷酸及蛋白质序列、以及与之相关的生物学信息和参考文献,是世界上的权威序列数据库。,三、功能基因组学系统探讨基
18、因的活动规律,功能基因组学的主要研究内容包括基因组的表达、基因组功能注释、基因组表达调控网络及机制的研究等。它从整体水平上研究一种组织或细胞在同一时间或同一条件下所表达基因的种类、数量、功能及在基因组中的定位,或同一细胞在不同状态下基因表达的差异。,(一)通过全基因组扫描鉴定DNA序列中的基因,(二)通过BLAST等程序搜索同源基因,(三)通过实验设计验证基因功能,(四)通过转录组和蛋白质组描述基因表达模式,四、比较基因组学鉴别生物基因组间的相似性与差异性,在基因图谱和测序的基础上,通过与已知生物基因组的比较,鉴别同源基因的相似性和差异性,为预测新基因的功能和阐明物种进化关系提供依据。在医学上,比较基因组学可利用模式生物与人类基因组之间编码序列和结构的同源性,揭示基因功能,阐明疾病发生、发展的分子机制。,五、ENCODE计划,HGP计划完成后,2003年9月,美国启动DNA元件百科全书
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024成都工业职业技术学院辅导员招聘笔试真题
- 法律科技产品测试员考试试卷及答案
- 跨境生鲜供应链经理笔试试题及答案
- 2025年重水堆核电站及配套产品项目发展计划
- 2025年宿州萧县幼儿园教师招聘考试试题【答案】
- 消费的演讲稿
- 2025年闲置物品调剂回收项目发展计划
- 《自动检测与转换技术》第二版的单项选择题的参考答案
- 2025年优良动植物新品种项目合作计划书
- 2025年抗麻风病药项目建议书
- 思想道德与法治智慧树知到期末考试答案章节答案2024年复旦大学
- 2024届新高考物理冲刺复习:“正则动量”解决带电粒子在磁场中的运动问题
- 产品试机报告
- JJF 1184-2024热电偶检定炉温度场测试技术规范
- 苏科版八年级上册数学第1章《全等三角形》单元知识点
- 财务年终总结报告
- 排班系统-排班指南
- 设备润滑培训课件
- 2023年江苏财经职业技术学院单招考试职业适应性测试试题及答案解析
- 《社会网络分析法》课件
- 新视野大学英语(第四版)读写教程1(思政智慧版) 课件 Unit 4 Social media matters Section A
评论
0/150
提交评论