Geneandgenomics医学分子生物学_第1页
Geneandgenomics医学分子生物学_第2页
Geneandgenomics医学分子生物学_第3页
Geneandgenomics医学分子生物学_第4页
Geneandgenomics医学分子生物学_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、分子生物学 分子生物学是从分子水平研究生命现象、生命规律和生命本质的学科。 核心内容是从分子水平研究基因和基因的活动,这些活动主要通过核酸和蛋白质的活动来实现。 医学分子生物学主要研究人体生物大分子和大分子体系的结构、功能、相互作用及其与疾病发生、发展的关系。第一讲:基因和基因组第一节: 基因一、基因(Gene)的概念 基因简史: Mendal (1866): 遗传因子Sutten (1903): 染色体Johannson (1909): 基因、基因型、表型Morgan (1910): 基因学说Avery (1944): 证实基因是由DNA组成 基因是含有编码具有生物功能产物(多肽链和RNA)

2、的DNA片段。二、DNA (脱氧核糖核酸) 的结构1.组成碱基包括腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)和胞嘧啶(C)脱氧核糖 (碱基+脱氧核糖=脱氧核苷)磷酸(脱氧核苷+磷酸)3、5磷酸二酯键连接脱氧核糖核苷酸形成一条多核苷酸链2. DNA的双螺旋结构Walson and Crick (1953-4-25) 在英国杂志发表了一文, 开启了生物医学的新时代 (see Nature 1953; 171(4356): 738-739)。DNA B 型结构特点 双股右手螺旋, 方向相反。 碱基在内,脱氧核糖、磷酸在外。 直径2.37nm, 螺距3.4nm, 含10碱基对(base pair, b

3、p)。 碱基堆积力和氢键(Walson-Crick键)是保持螺旋结构稳定性的主要作用力。 碱基可以在多核苷酸链中任意排列。3.DNA的超螺旋结构 三级结构即超螺旋结构(supercoil)。 真核生物染色体(chromosome)呈线性, 三级结构是DNA双链盘绕组蛋白(H2A, H2B, H3, H4)核心的表面, 绕成核小体(nucleosome); 许多核小体连接成串珠状, 再反复盘旋折叠形成染色单体(chromatid)。 DNA体积变小,利于包装; 影响和其它分子作用。4. DNA的理化性质 多元酸 紫外吸收:最大吸收峰在260nm处 变性、复性与杂交三、基因的结构特点和分类1.单拷

4、贝基因与多基因家族断裂基因: 外显子(exon)与内含子(intron)启动子、增强子和终止子多基因家族:核苷酸序列或编码产物结构有同源性,其编码产物具有相似的功能的一组基因。包括:核酸序列相同核酸序列高度同源编码产物的功能或功能区同源基因超家族2. 假基因3.重复序列DNA 高度重复序列DNA: 106 中度重复序列DNA: 10-105 重复序列的多态性第二节 模式生物基因组基因组(genome):细胞或生物体中,一套完整单倍体的遗传物质的总和基因组学(genomics):发展和应用DNA制图、测序技术,及计算机程序分析生命体全部基因组结构及功能的科学。包括:结构基因组学、功能基因组学、比

5、较基因组学三个亚领域SpeciesGenome size(Mb)Number of chromosomesHuman30002n=46Mouse27002n=40Pig 27002n=38Cow 30002n=60Fugu 400Zebrafish 17002n=50Chicken 12002n=78Honey bee180n=16Drosophila1652n=8C.elegans 1002n=12Rise 4302n=24Wheat 17,0002n=6x=42Arabidopsis 1002n=10Tomato 9502n=24Maize25002n=20White Spruce10,0

6、002n=24S. cerevisiae15n=16E. coli4.7n=1H. influenze1.8n=1Mycoplasma genitalium0.58n=1一、 病毒基因组结构与功能的特点1.1.不同病毒基因组大小相差较大2.2.不同病毒基因组可以是不同种类、结构的核酸3.3.病毒基因组有连续的也有不连续的 有些RNA病毒为不连续的片段4.4.编码序列大于90%90%5.5.单倍体基因组 除逆转录病毒外6.6.基因有连续的和间断的7.7.相关基因丛集 转录出多顺反子mRNA8.8.基因重叠9.9.病毒基因组含有不规则结构基因病毒基因组核酸的主要类型病毒基因组核酸的主要类型核酸类型

7、转录方式复制特点病毒种类双链双链DNA类似细胞基因类似细胞基因 通过通过DNA复制过程完成基复制过程完成基因组复制;因组复制; 先转录出一个先转录出一个RNA中间体中间体(前基因组),再通过逆转录(前基因组),再通过逆转录过程完成复制过程完成复制 大部分大部分DNA病毒病毒乙肝病毒(乙肝病毒(HBV)单链正股单链正股DNA类似细胞基因类似细胞基因通过通过DNA复制过程完成基因复制过程完成基因组复制组复制自主微小病毒、自主微小病毒、依赖微小病毒、依赖微小病毒、M13噬菌体等噬菌体等双链双链RNA以负链以负链RNA为模为模板转录出板转录出mRNA通过通过RNA复制过程完成基因复制过程完成基因组复制

8、组复制动物呼肠弧病毒及动物呼肠弧病毒及所有的噬真菌体所有的噬真菌体单链负股单链负股RNA转录酶以负链转录酶以负链RNA为模板转录为模板转录出有帽尾出有帽尾mRNA负链负链RNA为模板,从头合成为模板,从头合成正股正股RNA(无帽尾),再以(无帽尾),再以此链为模板复制出负股此链为模板复制出负股RNA单链正股单链正股RNA通过通过RNA复制过程完成基复制过程完成基因组复制因组复制通过通过DNA中间体,再通过中间体,再通过逆转录过程完成复制逆转录过程完成复制脊髓灰质炎病毒脊髓灰质炎病毒逆转录病毒逆转录病毒乙型肝炎病毒基因组 带有部分单链区的环状双链DNA分子, 长链为负股,长3.2kb;短链为正股

9、,在不同的分子中长度不同 两链5端250b互补成粘末端 以负股DNA为模板转录的RNA有4个ORF,分别称为S、C、P、 X,其中P区域与其它三个ORF重叠乙型肝炎病毒基因组结构和功能乙型肝炎病毒基因组结构和功能 S区:编码病毒的外膜蛋白,由S基因、前S1区(pre-S1)、前S2区段(pre-S2)构成 主要蛋白:即S蛋白(HBsAg) ,226个a.a. ,由S基因编码, 中蛋白:由pre-S2 和S基因编码,281个a.a. 大蛋白:由pre-S1 、pre-S2 和S基因编码乙型肝炎病毒基因组结构和功能乙型肝炎病毒基因组结构和功能 C区段:编码核心抗原(HBcAg),羧基端富Arg水解

10、后转变为分泌性e抗原(HBeAg) P区段:编码DNA聚合酶,是依赖RNA的DNA聚合酶(逆转录酶) X区段:X蛋白功能尚不十分清楚,可能是反式激活因子 二、原核生物基因组结构和功能的特二、原核生物基因组结构和功能的特点点1. 通常仅有一条环状双链DNA分子组成2.只有一个复制起点3.具有操纵子结构4.编码序列一般不重叠5.基因是连续的二二 原核生物基因组结构和功能的特原核生物基因组结构和功能的特点点6.编码区在基因组中所占比例约为50%7.基因组中重复序列很少8.有编码同工酶的基因(isogene)9.存在可移动的DNA序列,包括插入序列和转座子10.具有多种功能的识别区原核生物基因组研究及

11、意义原核生物基因组研究及意义更好的了解病原微生物的治病机理加快致病微生物致病基因的发现提高临床诊断的效率和准确性筛选有效药物及发展疫苗第三节第三节 人类基因组的组织结构特点人类基因组的组织结构特点人类基因组的重复序列人类基因组中的多态性一一 人类基因组的重复序列人类基因组的重复序列 反向重复顺序(inverted repeats)是指两个顺序相同的拷贝在DNA链上呈反向排列。约占5%,常见于调控区 两个反向重复顺序间隔一段间隔顺序 两个反向重复顺序间串联排列形成回文结构一一 人类基因组的重复序列人类基因组的重复序列 串联重复顺序(tandem repeats) 约占10% 编码区串联重复顺序:

12、组蛋白基因 非编码区串联重复顺序:通常存在于间隔DNA和内含子中 大卫星DNA(macrosatellite DNA) 小卫星DNA(miniosatellite DNA) 微卫星DNA (microsatellite DNA)小卫星小卫星DNA 小卫星DNA (minisatellite DNA)一类中等大小的串联重复序列,长0.1-20kb,分布于所有染色体 高度可变的小卫星DNA 呈高度多态性,与细胞的同源重组有关,不能转录 端粒DNA微卫星微卫星DNA 微卫星DNA (microsatellite DNA)一类简单的寡核苷酸串联重复序列,分布于所有染色体,重复2-6bp约10-60次,

13、总长度常小于150bp一人类基因组的重复序列一人类基因组的重复序列 散在重复顺序 多为转座元件,且为反转录转座 SINEs(short interspersed nuclear elements) Alu家族 LINEs(long interspersed nuclear elements) Kpn家族Number of copies and fraction of genome for classes of interspersed repeatNumber of copies(x1,000)Total number of bases(mb)Fraction of the draft gen

14、ome sequence(%)SINEs1,558359.613.14LINEs868558.820.42LTR elements4432278.29DNA elements29477.62.84Unclassified33.80.14Total 1,226.844.83二二 人类基因组中的多态性人类基因组中的多态性 DNA位点多态性(DNA site polymorphism):是由于等位基因间在特定位点上DNA序列的差异造成的 限制性片段长度多态性(restriction fragment length polymorphism, RFLP):即用同一种限制性内切酶消化不同个体的DNA时,

15、会产生各不相同的限制性片段类型二二 人类基因组中的多态性人类基因组中的多态性 串联重复顺序多态性(tandem repeats polymorphism):其重复单位很小,重复次数变化较大,也称可变数目串联重复顺序(variable number of tandem repeats, VNTRs)是一种长度多态性 小卫星DNA多态性 微卫星DNA多态性Polymorphism Polymorphism: strictly, the existence of two or more variants (alleles, phenotypes, sequence variants, chromos

16、ome structure variants) at significant frequencies in population. Looser usages among molecular geneticists include (1) any sequence variant present at a frequency 1% in a population, (2) any nonpathogenic sequence variant, regardless of frequency. Polymorphism Polymorphism marker SNPs (single nucle

17、otide polymorphisms, SNPs) More than 1.4 million single nucleotide polymorphisms (SNPs) in the human genome have been identifed. SSR (Simple sequence repeat, SSR) a sequence consisting largely of a tandem repeat of a specifc k-mer (such as (CA)15). Many SSRs are polymorphic and have been widely used

18、 in genetic mapping.三三 人类基因组计划简介人类基因组计划简介人类基因组作图人类基因组作图 遗传图(genetic map):以具有遗传多态性的遗传标记为“位标”,遗传学距离为“图距”的基因组图 Genetic map A genome map in which polymorphic loci are positioned relative to one another on the basis of the frequency with which they recombine during meiosis. The unit of distance is centim

19、organs (cM), denoting a 1% chance of recombination.人类基因组作图人类基因组作图 物理图(physical map):以一段已知核苷酸序列的DNA片段为“位标”,以DNA实际距离(Mb或kb)作为“图距”的基因组图 转录图(transcription map):以表达序列标签(EST)为位标,又称cDNA图或表达序列图 序列图(sequence map):确定人类基因组的核苷酸顺序第四节 基因组与医学一一 基因鉴定基因鉴定定位克隆(positional cloning)候选克隆:定位候选和功能候选克隆定位克隆定位克隆 定位克隆策略:即建立表型(

20、包括疾病)与基因组中某一部位(或区域)之间的联系,然后根据这一位置信息,应用物理图的物理标记来将经典遗传学信息转变为物理标记所代表的明确的基因组区域,在以相关区域的邻接克隆群来筛选可表达的结构基因,即建立局部的转录图。常见病易感基因的定位克隆 肥胖、肿瘤、心血管疾病、糖尿病等都有遗传因素的涉及 多基因、多因素 遗传异质性 阐明病因及发病机理Examples of disease genes identified by positional cloning Disease MIM no.Map positionGene Approach Duchenne muscular dystrophy31

21、0200Xp21.3DystrophinClone translocation breakpointsClone sequences missing in a patient with a deletionCystic fibrosis2197007q31CFTRLinkage disequilibriumBranchio-oto-renal syndrome1136508q13EYA1Sequencing genomic clones; homology to Drosophila geneTreacher Collins syndrome 1545005q32-33.1TCOF1Trans

22、cript mapping二 药物基因组学 用药个体化 已知基因 加快新药开发单核苷酸多态性(单核苷酸多态性(SNPsSNPs)Single Nucleotide Polymorphisms 1, Introduction 2, Defination and classification 3,Features of SNPs 4, SNP mapping 5, Usage in biomedicine 6, SNPs databaseGenetic VariationGenetic Variation DNA Markers1980 RFLPs ( restriction fragment l

23、ength polymorphisms)1985 VNTRs (variable number tandem repeats , small-satellites) STRs (short tendem repeats, Micro- satellites )1990s SNPs (single-nucleotide polymor- phisms) 限制性片段长度多态性限制性片段长度多态性 RFLPs ( restriction fragment length polymorphisms)短串联重复序列短串联重复序列STRs (short tendem repeats, Microsatel

24、lites )STR广泛存在于人基因组,占约5%,基本单位是1bp-8bp的串联重复,重复次数 n=15-60,已知8000多个,主要形式为: (CA)n , (GA)n , (AA)n , (GG)n , (CAA)n, (CGG)n ,其中以 (CA)n , (GT)n 为多见。1992年,Welssenbanch等以STR为标记的第二代连锁图取代了RFLP连锁图。可变数目可变数目串联重复序列串联重复序列VNTRs (variable number tandem repeats)每个 VNTR 都含有10-15 bp核心序列,VNTR与STR比较类似,但是重复顺序更长;多态性及分布方面不如

25、STR,因而VNTR作为遗传标记只是一种过渡,目前已较少使用,但是,VNTR曾经对STR的基因定位运用起到推动作用。定义:不同个体间,基因组DNA某部位的 单核苷酸的变异。 1996年,Lander报道了用单核苷酸多态性标记(single nucleotid polymorphism SNP)制备第三代遗传连锁图的遗传标记。单核苷酸多态性单核苷酸多态性(single nucleotid polymorphism,SNP)RFLP, Less polymorphysismPIC:0.3not even in genomeSTR1/100kb200kbPIC: 0 .7not even in ge

26、nomeAutomilizationSNP1/1003-300bpDichomityStabilityEven in genomeDNA arrayFrequency of SNP in Human Genome1,The most abundant DNA marker present in the human genome, about 90% of sequences variants in human are SNP. 2 out of thirds are C to T2,A few hundred thousand are currently identified, but 17

27、million of SNPs out of 3 billion are estimated.3, SNPs in coding regions of genes have been termed cSNPs, about 500,000 of cSNPs and an average of about 6 per gene. The Functional Effects of cSNPsAmino acid changeno change of amino acidThe Functional Effects of SNPs Outside ExonsIn Regulatory region

28、Applications of SNPs as Genome MarkersIndividual identificationHuman evolutionBiomedical researchSNPs in Human DiseasesSNPs的作图 有两种不同而又互补的方法可进行全基因组关联分析。 一种是直接检测候选基因编码区中所有常见的功能性变异;另一种是使用分布在编码区和非编码区的高密度SNPS标记,来分析易感人群和对照人群,根据连锁不平衡分析特定的SNPs与表型的关联。无论是致病变异还是群体进化的研究,建立高密度SNPs遗传图是必需的。 SNP作图的一般步骤包括: 获取DNA序列;

29、从DNA序列确定序列标签位点(sequence tagged sites, STSs); 扫描STSs或ESTs确定候选SNPs; 确定SNPs; 将SNPs定位于染色体特定位置。 Monogenic Disorder in Human Diseases SNPs in monogene influence virtuallyhuman disease 1, Susceptibility and resistance to the disorder,2, Gene- environmental factors.e.g. Huntingtons diseasecystic fibrosis SN

30、Ps in Complex Human Diseases many of the diseases involve multiple genes, each contributing a small quantity of the overall disease susceptibility. Oliogenic, multigenic and gene-environmental interaction Association StudyLinkage studySNPs in PharmacogenomicsIndividualization medicineDrug discoveryP

31、olymorphisms of genes involving in Admet (absorbption, distrubution, metabolism, excretion and toxibility).SNPs affecting drug effectsSNPs Genotyping 1, Direct sequencing of DNA2, Specific hybrization3, Single-strand conformation polymorphism analysis4, High-density DNA arrays5, Primer-extention 6, PyrosequencingSNPs Databases http:/www.ncb

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论