第一章基因组概论_第1页
第一章基因组概论_第2页
第一章基因组概论_第3页
第一章基因组概论_第4页
第一章基因组概论_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章 基因组概论基因组概论第一节第一节 基因组的功能单位基因组的功能单位基因基因n早期的基因概念早期的基因概念nmorgan等把遗传性状与特定的染色体区段联等把遗传性状与特定的染色体区段联系起来,并提出系起来,并提出“一个基因,一个酶一个基因,一个酶”和和“一个基因,一条多肽链一个基因,一条多肽链”的概念。的概念。n分子生物学的基因概念分子生物学的基因概念n基因是一段携带功能产物(多肽,蛋白质,基因是一段携带功能产物(多肽,蛋白质,trna和和rrna和某些小分子和某些小分子rna)信息的)信息的dna片段,是控制某种性状的的遗传单位。片段,是控制某种性状的的遗传单位。一、基因一、基因(ge

2、ne)的概念的概念:基因的特点和鉴别方法基因的特点和鉴别方法 编码编码trna和和rrna和某些小分子和某些小分子rna的基因的基因: 我们较易通过核酸序列加以判断。我们较易通过核酸序列加以判断。 蛋白质编码基因蛋白质编码基因: 目前可根据其特点使用五项标准来鉴别目前可根据其特点使用五项标准来鉴别 但这些标准使用起来却并不得心应手。但这些标准使用起来却并不得心应手。 1.开放阅读框(开放阅读框(open reading frame, orf)*始于起始密码子并终于终止密码子的一串密码子。始于起始密码子并终于终止密码子的一串密码子。*从从mrna中找出大的中找出大的orf来确定编码蛋白质的基因来

3、确定编码蛋白质的基因;*适合于从适合于从dna序列中鉴别原核生物基因和含少量内序列中鉴别原核生物基因和含少量内含子的真核基因。含子的真核基因。*但对于一些短少的基因及一些内含子丰富的基因则但对于一些短少的基因及一些内含子丰富的基因则很难鉴别。很难鉴别。 基因基因基因组基因组dna启动启动子等子等5非编非编码区码区3非编非编码区码区atg 编码区编码区 taaorf2. 序列特征序列特征密码子偏爱和剪接点密码子偏爱和剪接点*密码子偏爱(密码子偏爱(codon bias ) 指在不同物种的基因中经常为某种氨基酸编码的指在不同物种的基因中经常为某种氨基酸编码的只是其中的一个密码子。只是其中的一个密码

4、子。 当鉴别到一个当鉴别到一个orf时,密码子偏爱常常用来确定时,密码子偏爱常常用来确定这个这个orf是否是一个基因。是否是一个基因。*基因的剪接位点(基因的剪接位点(splice sites) 一般有特定的序列特征,计算机程序利用这种序一般有特定的序列特征,计算机程序利用这种序列特征可预测将近列特征可预测将近50%的外显子及的外显子及20%的完整基因。的完整基因。 3. 序列保守性序列保守性*一个功能在不同物种内是保守的基因,大都表现出一个功能在不同物种内是保守的基因,大都表现出外显子的保守性和内含子的多变性。外显子的保守性和内含子的多变性。 *最好是对适当进化距离的物种间序列进行比较。最好

5、是对适当进化距离的物种间序列进行比较。*但保守性序列也可能是非转录的调控单元。但保守性序列也可能是非转录的调控单元。 *寻找基因的表达产物寻找基因的表达产物rna或蛋白质,是鉴定一或蛋白质,是鉴定一个基因的有效方法。个基因的有效方法。*但有些但有些ofr似乎并不转录,因为检测不到它们的似乎并不转录,因为检测不到它们的rna或蛋白质产物。或蛋白质产物。 4. 转录产物转录产物 除以上鉴定基因的五项标准之外,在实施过程中还除以上鉴定基因的五项标准之外,在实施过程中还有些麻烦的问题,如重叠基因、变通性断裂基因、假有些麻烦的问题,如重叠基因、变通性断裂基因、假基因等。基因等。*使基因失活也是确认基因功

6、能的一个方法。使基因失活也是确认基因功能的一个方法。*但许多编码序列的失活并不导致一个明显的表型,但许多编码序列的失活并不导致一个明显的表型,因而很难找到鉴定的标准。因而很难找到鉴定的标准。 5. 基因失活基因失活第二节第二节 基因组基因组基因组(基因组(genome)是指一个细胞或生物体的一套完是指一个细胞或生物体的一套完整的单倍体遗传物质。整的单倍体遗传物质。 对二倍体高等生物来说,维持配子正常功能最低对二倍体高等生物来说,维持配子正常功能最低数目的一套染色体遗传物质,构成一套基因组。数目的一套染色体遗传物质,构成一套基因组。 原核生物和真核生物基因组又分染色体基因组与原核生物和真核生物基

7、因组又分染色体基因组与染色体外基因组,后者如原核生物的质粒染色体外基因组,后者如原核生物的质粒dna,真,真核生物的线粒体核生物的线粒体dna及叶绿体及叶绿体dna。 人类基因组人类基因组24个染色体(个染色体(22+x+y)约)约3.0109bp1. 基因组大小与基因组大小与c值佯谬值佯谬 n基因组大小在不同生物之间差异很大;基因组大小在不同生物之间差异很大;如如hbv 仅仅3200 bp,而某些显花植物和两栖类动物可达,而某些显花植物和两栖类动物可达1011bp。 n基因组大小用基因组大小用c c值(值(c valuec value)表示;)表示;nc值大小基本上反映生物进化程度的差异;值

8、大小基本上反映生物进化程度的差异;n但这种相关性并不很精确;但这种相关性并不很精确;n这种生物体的进化程度与基因组大小之间不完全成这种生物体的进化程度与基因组大小之间不完全成比例的现象称为比例的现象称为c值佯谬(值佯谬( c value paradox );); nc值矛盾主要是由于各种生物基因组的结构特征的差值矛盾主要是由于各种生物基因组的结构特征的差异造成的,低等和高等生物差别明显。异造成的,低等和高等生物差别明显。2. 基因总数与基因总数与n值佯谬值佯谬 n基因总数(基因总数( n表示)表示)n人类为人类为3万多个,仅比大肠杆菌大万多个,仅比大肠杆菌大7倍,比低倍,比低等动物秀丽线虫大等

9、动物秀丽线虫大1.6倍,水稻高达倍,水稻高达5万。万。n果蝇在进化上比秀丽线虫高等,基因总数只果蝇在进化上比秀丽线虫高等,基因总数只有后者的有后者的0.6倍。倍。n基因组中基因数目与生物进化程度或复杂程基因组中基因数目与生物进化程度或复杂程度的不对称性,称为度的不对称性,称为n值佯谬(值佯谬(n value paradox)。)。n既然一切生物性状都是由基因决定的,那么既然一切生物性状都是由基因决定的,那么生物体的生物体的dna含量(含量(c值)和质量(值)和质量(n值)值)就应该与生物进化阶梯及复杂性成正相关。就应该与生物进化阶梯及复杂性成正相关。 n生物体结构与功能的复杂程度不仅取决于一生

10、物体结构与功能的复杂程度不仅取决于一定的基因数量,更重要的是在于基因功能及定的基因数量,更重要的是在于基因功能及其相互作用网络的复杂性和精确性。其相互作用网络的复杂性和精确性。第三节第三节 基因组计划基因组计划 (genome project)n基因组计划是指以获得某物种基因组全序列基因组计划是指以获得某物种基因组全序列为主要目标的科学计划。为主要目标的科学计划。n如人类基因组计划(如人类基因组计划(human genome project,hgp),小鼠基因组计划,家狗),小鼠基因组计划,家狗基因组计划,细菌基因组计划等。基因组计划,细菌基因组计划等。 一、修正后的一、修正后的hgp主要内容

11、主要内容hgp主要任务及内容主要任务及内容主要任务 内容物理图物理图 确定染色体确定染色体dna上诸如限制性内切酶识别上诸如限制性内切酶识别 位点,或序列标志点(位点,或序列标志点(stss)等的位置图)等的位置图遗传图遗传图 确定标志位点在染色体确定标志位点在染色体dna上的线性排列上的线性排列 顺序。标志位点间的图距以遗传学(重组顺序。标志位点间的图距以遗传学(重组 )距离表示、单位为厘摩尔根()距离表示、单位为厘摩尔根(cm)序列图序列图 测定人类测定人类24条染色体的、由条染色体的、由3 310109 9个核苷个核苷 酸组成的全部酸组成的全部dnadna序列,绘制人类基因组序序列,绘制

12、人类基因组序 列图谱列图谱hgp的研究进程的研究进程ndulbecco(1986)首次提出)首次提出hgp的概念,的概念,1990美国国会批准正式启动。美国国会批准正式启动。n 1995年以年以sts为标志的物理图谱问世,其分辨率为标志的物理图谱问世,其分辨率为为200bp、覆盖率高达、覆盖率高达94%;n同年,汇集了人类基因组初步的全物理图,同年,汇集了人类基因组初步的全物理图,3、12、16、22号染色体高密度物理图,以及号染色体高密度物理图,以及30余万个左余万个左右右cdna(est)序列信息;)序列信息;n由于卫星多态性标志的应用,遗传制图已于由于卫星多态性标志的应用,遗传制图已于1

13、994年提前完成,确定的全部标志密度为年提前完成,确定的全部标志密度为0.7cm,含,含5826个转座子,大小为个转座子,大小为4000cm的线性遗传图;的线性遗传图; n1994年人类基因组遗传图谱发表。年人类基因组遗传图谱发表。n人类基因组工作框架已于人类基因组工作框架已于2000年年6月由人类月由人类基因组计划国际合作组完成。基因组计划国际合作组完成。n在此基础上经整理、分类和排列后,人类基在此基础上经整理、分类和排列后,人类基因组图谱及其初步分析结果于因组图谱及其初步分析结果于2001年年2月月12日正式公布。日正式公布。n2004年年10月发表了人类基因组常染色质全月发表了人类基因组

14、常染色质全序列,(人类基因组的常染色质部分中)其序列,(人类基因组的常染色质部分中)其中中99%的序列已被确定,其精度达到每的序列已被确定,其精度达到每10万个碱基中只有一个测量误差。万个碱基中只有一个测量误差。其他基因组计划其他基因组计划n微生物基因组计划和人类基因组计划分别于微生物基因组计划和人类基因组计划分别于1986年和年和1990年启动,年启动,n其后又启动了各种其后又启动了各种模式生物(模式生物(model organisms)基因组计划(如线虫、果蝇、小鼠等),基因组计划(如线虫、果蝇、小鼠等),n致病生物体基因组计划,致病生物体基因组计划,n环境相关基因组计划,环境相关基因组计

15、划,n以及具有重要经济价值的动植物基因组计划等。以及具有重要经济价值的动植物基因组计划等。n到目前为止已经完成了数百种生物体的基因组测到目前为止已经完成了数百种生物体的基因组测序工作。序工作。第四节第四节 基因组学基因组学n基因组学(基因组学(genomics)n指对所有基因进行基因组作图(包括遗传图谱、指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱,核苷酸序列分析,基因物理图谱、转录图谱,核苷酸序列分析,基因定位和基因功能分析的一门科学。定位和基因功能分析的一门科学。n基因组学研究包括两亚领域基因组学研究包括两亚领域n以全基因组测序为目标的以全基因组测序为目标的结构基因组学结构

16、基因组学(structural genomics)n以基因功能鉴定为目标的以基因功能鉴定为目标的功能基因组学功能基因组学(functional genomics)又称为又称为后基因组学后基因组学(postgenome)研究。研究。 后基因组计划后基因组计划n21世纪生物学的发展方向世纪生物学的发展方向功能基因组学功能基因组学n对整个基因组所包含的基因、非基因序列的功对整个基因组所包含的基因、非基因序列的功能进行大规模分析;认识基因在发育、分化和能进行大规模分析;认识基因在发育、分化和病理状态下的功能变化及其调节机制。病理状态下的功能变化及其调节机制。n后基因组时代的主角后基因组时代的主角蛋白质

17、组学蛋白质组学n蛋白质组蛋白质组(proteome)是指细胞或组织表达的全是指细胞或组织表达的全部蛋白质。部蛋白质。n人类人类2.4万个基因,几十万种蛋白质;万个基因,几十万种蛋白质;n重点分析生命不同时期、不同组织、不同(疾重点分析生命不同时期、不同组织、不同(疾病)状态蛋白质的变化病)状态蛋白质的变化n蛋白质组学蛋白质组学(proteomics):是从整体上采取高通是从整体上采取高通量量/大规模手段研究所有蛋白组成及其活动规律大规模手段研究所有蛋白组成及其活动规律.n基因组学的延伸基因组学的延伸模式生物基因组学模式生物基因组学n五大模式生物:五大模式生物:e.coli、酿酒酵母、黑腹果蝇、

18、秀丽线虫、酿酒酵母、黑腹果蝇、秀丽线虫和小鼠,其序列分析被列为和小鼠,其序列分析被列为hgp的内容;的内容;n不同物种间功能基因有相当大保守性,如不同物种间功能基因有相当大保守性,如99%鼠基因与鼠基因与人对应;人对应;n最终目的:比较基因组学最终目的:比较基因组学比较不同物种的全基因组,比较不同物种的全基因组,增强对各基因功能的认识。增强对各基因功能的认识。n从分子水平上升到细胞水平从分子水平上升到细胞水平细胞计划细胞计划n在阐明以基因为核心的生命物质的本质后,以信号传导在阐明以基因为核心的生命物质的本质后,以信号传导为主线阐明在细胞内一切生命现象的本质。为主线阐明在细胞内一切生命现象的本质。n1950年代生物学从细胞水平深入到分子水平是一次飞跃,年代生物学从细胞水平深入到分子水平是一次飞跃,但现在似乎又正返回到细胞水平!但现在似乎又正返回到细胞水平!n新型学科与产业的发展新型学科与产业的发展生物信息学和生物芯片生物信息学和生物芯

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论