医学分子生物学绪论_第1页
医学分子生物学绪论_第2页
医学分子生物学绪论_第3页
医学分子生物学绪论_第4页
医学分子生物学绪论_第5页
已阅读5页,还剩171页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学分子生物学

SchoolofLaboratoryMedicine,WenzhouMedicalUniversityKeyLaboratoryofLaboratoryMedicine,MinistryofEducation,China21分子生物学的基本概念2分子生物学发展简史3分子生物学与医学的关系4分子生物学的主要研究内容绪论主要内容SchoolofLaboratoryMedicine,WenzhouMedicalUniversityKeyLaboratoryofLaboratoryMedicine,MinistryofEducation,China3分子生物学(molecularbiology)是以生物分子为靶标,在细胞内从分子水平研究生命现象本质和生命过程规律的一门交叉学科。所谓生物分子(biomolecule)是具有生物活性的化学分子,包括生物大分子和生物小分子。1.分子生物学的基本概念

生物大分子(Biomacromolecule)主要包括核酸、蛋白质、多糖等。生物小分子(Biomicromolecule)分子量小于500Da,包括游离核苷酸、辅基辅酶、寡糖、寡肽、寡核苷酸、类脂、信号分子以及许多生物大分子的代谢产物等。2.分子生物学发展简史分子生物学的发展大致可分为三个阶段:准备和酝酿阶段现代分子生物学的建立生命本质探索阶段2.1准备和酝酿阶段确定了蛋白质是生命活动的主要物质基础确定了生物遗传的物质基础是DNA(A.D.Hershey和M.Chase)蛋白质结构和功能认识遗传信息传递中心法则的建立1953年Watson和Crick提出DNA双螺旋结构模型2.2现代分子生物学的建立单克隆抗体及基因工程抗体的建立和发展(Kohler和Milstein)

基因表达调控机理细胞信号转导机制研究成为新的前沿领域基因组研究的进展

重组DNA技术的建立和发展(PaulBerg)2.3生命本质探索阶段新技术平台驱动分子生物学的发展SchoolofLaboratoryMedicine,WenzhouMedicalUniversityKeyLaboratoryofLaboratoryMedicine,MinistryofEducation,China9分子生物学的发展依赖于技术与仪器革。

1.20世纪80年代中期发明的体外核酸扩增技术(PCR)第一代PCR定性检测技术第二代PCR-DNA终点定量技术第三代PCR-DNA/RNA实时荧光定量技术2.基因组研究快速推进主要得益于DNA测序技术的发展Sanger法,“人类基因组”计划,用了13年时间才完成草图绘制,而且成本超过数十亿美元。

以高通量、高速和低成本为标志的第二代测序技术第三代测序技术单分子测序技术即将登场。目标是人类基因组测序费用降到1千美元。SchoolofLaboratoryMedicine,WenzhouMedicalUniversityKeyLaboratoryofLaboratoryMedicine,MinistryofEducation,China113分子生物学与医学的关系分子生物学是现代医学的重要基础。分子生物学使医学进入分子水平,是未来的医学的核心内容。分子生物学与精确医学(PrecisionMedicinePM)U.S.PresidentBarackObamaunveileddetailsaboutaboldnewmedicalresearcheffortcalledPrecisionMedicineInitiative(PMI)atbeginingofthisyear,andaskCongressfora215million-U.S.dollarinvestmentinhis2016budgetblueprint.PrecisionMedicineInitiative(PMI)

90年代初,美国主导的国际人类基因组计划(HumanGenomeProject)2003年4月15日,人类基因组序列图绘制成功。人们对基因组测序技术的临床应用寄予厚望。研究者也逐渐认识到基因组知识的局限性;中心法则”直接涉及到的DNA、RNA和蛋白质分子水平来看,基因组核酸序列不过是生命复杂性的“冰山一角”

2011年前后,面对当前生物医学领域亟需解决的生理和病理的复杂性问题,“精确医学”正是在生命科学和医学实践所处的这样一个重要转折点上应运而生。精确医学”,其前提是构建基于生物学大数据的生物医学研究知识网络,以及基于分子生物学的全新疾病分类方法。知识网络:临床诊断和病理分析等表型信息,还具有各种生物分子信息,包括基因组、转录组、蛋白质组、代谢组、脂质组和表观遗传组等。精确医学概念的形成与实施

(PrecisionMedicinePM)SchoolofLaboratoryMedicine,WenzhouMedicalUniversityKeyLaboratoryofLaboratoryMedicine,MinistryofEducation,China144.分子物生学的主要研究内容核酸的分子生物学蛋白质的分子生物学细胞信号转导的分子生物学SchoolofLaboratoryMedicine,WenzhouMedicalUniversityKeyLaboratoryofLaboratoryMedicine,MinistryofEducation,China154.1核酸的分子生物学核酸的分子生物学研究核酸的结构及其功能。研究内容包括核酸/基因组的结构﹑遗传信息的复制﹑转录与翻译﹑核酸存储的信息修复与突变﹑基因表达调控和基因工程技术的发展与应用等。遗传信息传递的中心法则是其理论体系的核心。

SchoolofLaboratoryMedicine,WenzhouMedicalUniversityKeyLaboratoryofLaboratoryMedicine,MinistryofEducation,China164.2蛋白质的分子生物学蛋白质的结构与功能。蛋白质翻译及调控,胞内定位分布机理。蛋白质是了解基因功能最重要的途径。SchoolofLaboratoryMedicine,WenzhouMedicalUniversityKeyLaboratoryofLaboratoryMedicine,MinistryofEducation,China174.3细胞信号转导的分子生物学细胞信号转导的分子生物学主要研究细胞内﹑细胞间信息传递的分子基础。研究的目标是阐明细胞活动的分子机理,明确每一种信号转导与传递的途径及参与该途径的所有分子的作用和调节方式。信号转导机理的研究是当前分子生物学发展最为迅速的领域之一。课程教学参考用书与网上资源网站(页)66/ec-webshow/page/courseVideo.do(生物谷生命科学论坛)分子生物学专业信息网书籍Molecularbiology(GeorgeP,科学出版社)分子生物学(第四版)(朱玉贤,高等教育出版社出版)杂志-MolecularandCellularBiology-MolecularCell -CurrentGenetics-Oncogene-Genes&Development -PNAS -RNA-Embo18ActiveLearningCredoWhenIhear,

Iforget.WhenIhearandsee,Irememberalittle.WhenIhear,see,andaskquestions

ordiscusswithsomeoneelse,Ibegintounderstand.WhenIhear,see,discuss,anddo,Iacquireknowledgeandskill.WhenIteachanother,Imaster.BernardWSilverman

第一章基因、基因组和基因组学

Gene,Genome&Genomics1基因的结构与功能基因(gene):携带有遗传信息的DNA或RNA序列,也称为遗传因子。基因是合成有功能的蛋白质或RNA所必需的全部DNA,包括编码蛋白质或RNA的核酸序列,也包括为保证转录所必需的调控序列。1.1基因的分类结构基因(structuralgenes)调节基因(regulatorygenes)核糖体RNA基因(ribosomalRNAgenes)与转运RNA基因(transferRNAgenes)1.结构基因(structuralgenes)可被转录形成mRNA,并转译成多肽链,构成各种结构蛋白质,催化各种生化反应的酶和激素等。DNA转录翻译mRNA蛋白质2.调节基因(regulatorygenes)某些可调节控制结构基因表达的基因。其突变可影响一个或多个结构基因的功能,或导致一个或多个蛋白质(或酶)量的改变。microRNAs,siRNAs,piRNAs…rRNA基因与tRNA基因(ribosomalRNAgenes&transferRNAgenes)只转录产生相应的RNA而不翻译成多肽链种类IIIIII分布核仁核基质核基质产物rRNAmRNA,microRNA5SrRNA,tRNA,siRNA真核生物的RNA聚合酶(

3种):RNA聚合酶I,II,III.开放阅读框架(openreadingframe,ORF):在DNA链上,由蛋白质合成的起始密码开始,到终止密码为止的一个连续编码序列。1.2基因的结构断裂基因(splitgene)PromoterExonintronFlanking234561234123561hnRNA的选择性剪接5

3

3

5

模板链编码链编码链模板链转录方向转录方向5

3

NC1.3基因的功能传递遗传信息,控制个体性状表现。基因组(genome):一个细胞内的全部遗传信息,包括染色体基因组和染色体外基因组。基因组中的DNA包括编码序列和非编码序列。部分病毒基因组--RNA。2基因组的结构与功能C值(C-value):一种生物体单倍体基因组DNA的总量,用以衡量基因组的大小。通常,进化程度越高的生物其基因组越大,但从总体上说,生物基因组的大小同生物在进化上所处地位的高低无关。存在C-valueparadox(C值悖理)。生物复杂性越高,其基因的密度越低。C-valueparadoxequalgenomesizetoadXenopusandhumanbeinghavegenomesofessentiallythesamesize.Butweassumethathumanismorecomplexintermsofgeneticdevelopment!表2-1不同生物体基因组中基因的比较物种基因组大小/Mb大致的基因数目基因密度/(个/Mb)原核生物肺炎链球菌2.223001060

大肠杆菌4.64400950

根瘤农杆菌5.75400960真核生物

真菌

酿酒酵母125800480

粟酒裂殖酵母124900410

原生生物

四膜虫220>20000>90

无脊椎动物

美丽线虫9719000200

果蝇1801370080

东亚飞蝗5000不确定不确定

脊椎动物

人类2900270009.3

小鼠25002900012

植物

拟南芥12525500200

水稻430>45000>100

玉米2200>45000>20

郁金香120000不确定不确定2.1病毒基因组的结构与功能PropertyParametersNucleicacid

DNA

RNA

BothDNAandRNA(atdifferentstagesinthelifecycle)Shape

Linear

Circular

SegmentedStrandedness

Single-stranded

Double-stranded

Double-strandedwithregionsofsingle-strandedness病毒基因组的多样性病毒基因组的大小与细菌或真核细胞相比,病毒的基因组很小。不同的病毒之间基因组大小相差很大。乙肝病毒DNA:3kb,编码4种蛋白质;痘病毒的基因组:300kb,编码几百种蛋白质。病毒基因组的大小通常与其对宿主的依赖程度有关,基因组越大,依赖性越小。RNA

病毒基因组编码序列具有节段性有些病毒的基因组RNA由不连续的几条核酸链组成(如流感病毒,轮状病毒等)。分段基因组的病毒一般感染效率较低;分段基因组容易发生重组,故病毒容易变异。目前未发现DNA病毒有此状况。病毒基因存在基因重叠基因重叠:同一段DNA片段能够参与编码两种甚至两种以上的蛋白质分子。这种现象在其它的生物细胞中仅见于线粒体和质粒DNA。此结构意义在于使较小的基因组能够携带较多的遗传信息。重叠基因是1977年Sanger在研究ΦX174时发现的ΦX174是一种单链DNA病毒,宿主为大肠杆菌。感染大肠杆菌后可合成11个蛋白质分子,总分子量约25万,相当于6078个核苷酸所容纳的信息量。而ΦX174病毒DNA本身却只有5375个核苷酸,最多只能编码总分子量为20万的蛋白质分子。基因重叠的方式(1)一个基因完全在另一个基因里面。(2)几个基因部分重叠。(3)两个基因之间只有一个碱基重叠。噬菌体ΦX174的重叠基因

重叠基因的DNA序列可能大部分相同,但由于翻译时的读码框架不同、或起始部位不同而产生不同的蛋白质。

有些真核病毒的部分序列,对某一个基因来说是内含子,而对另一个基因而言却是外显子。病毒基因组的大部分序列具有编码功能病毒基因组的大部分是用来编码蛋白质的,只有非常小的一部份没有编码翻译功能。ΦX174基因组中不编码的序列只占217/5375乳头瘤病毒基因组约8.0Kb,其中不编码的部分约为1.0kb。少数真核生物病毒的基因组也存在内含子结构。病毒基因组的转录单元是多顺反子多顺反子mRNA

(polycistroniemRNA)

:病毒基因组DNA序列中功能上相关的蛋白质的基因或rRNA的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。它们可被一起转录成含有多个mRNA的分子。噬菌体ΦX174ΦX174基因组中的D-E-J-F-G-H基因转录在同一个mRNA中,然后再翻译成各种蛋白质,其中J、F、G及H编码外壳蛋白,D蛋白与病毒的装配有关,E蛋白负责细菌的裂解,它们在功能上是相关的。病毒基因组都是单倍体

除了逆转录病毒以外,一切病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。逆转录病毒带有逆转录酶,能使RNA反向转录生成DNA,因此其基因组可拥有两个拷贝。噬菌体基因具有连续性噬菌体的基因是连续的,而真核细胞病毒的基因是不连续的,具有内含子。2.2原核生物基因组的结构与功能原核生物基因组通常比较简单,其基因组大小在106bp~107bp之间,所包含的基因数目几百个到数千个之间。原核生物基因组通常由一条环状的双链DNA分子组成,在细胞中与蛋白质结合成染色体的形式,在细胞内形成一个致密的区域,称为

类核(nucleoid).大肠杆菌的类核结构模型大肠杆菌染色体基因组的结构和功能大肠杆菌基因组序列中的基因密度非常高,编码区所占的比例较大。大肠杆菌中总共有4288个基因,平均编码长度为950bp,基因之间的间隔区长度为118bp,而且这些结构基因没有内含子。大肠杆菌DNA分子中的重复序列很少,但在大肠杆菌基因组中不同部位可以有称为转座子的50kb的重复片段。转座因子原核生物转座因子主要有二类:插入序列(insertionsequence,IS)复合型转座子(compositetransposon,Tn)

只有当

IS

转座到某一基因中使该基因失活或插入位点旁边的染色体发生畸变等效应时才会被发现。IS:2000bp以内,两端都有正向重复序列(directrepeats,DR)和反向重复序列(invertedrepeats,IR),中间1kb左右的编码序列,仅编码和转座有关的转座酶。Tn:2000~20000bp之间,两端由一对IS元件组成,带有与转座作用有关的基因以及其他基因。根据转座的的机制和结果,可将转座分为:复制型转座(replicativetransposition)保守型转座(conservativetransposition)复制型保守型大肠杆菌染色体外基因组的结构和功能质粒(plasmid):一类染色体外具有自主复制能力的环状双链DNA分子,属染色体外基因组。大肠杆菌质粒是双链环状结构的DNA分子。可以有共价闭合环状DNA(covalentlyclosedcircularDNA,cccDNA)、缺口的环状DNA、线性DNA三种结构状态。质粒对宿主细胞的生存一般不是必需的,但质粒带有某些特殊的不同于宿主细胞的遗传信息,其存在赋予宿主细胞一些遗传性状。

细菌质粒所控制的一些性状抗性抗生素抗性氨基糖甙类、β-内酰胺类、大环内酯类及磺胺类等重金属抗性汞离子及有机汞制剂、镍、钴、银、铬、铅、锑及铋等阳离子抗性砷酸盐、亚砷酸盐、铬酸盐及硼酸盐等其它抗性紫外线,X射线,细菌素,质粒控制的修饰系统等代谢能力简单糖类的代谢乳糖、蔗糖及绵籽糖等卤化物的代谢2,4-二氯甲苯复杂碳化合物的代谢甲苯、萘、樟脑、苯胺、烟碱及烷烃等蛋白质代谢明胶及酪蛋白等其他代谢色素生成,产硫化氢,胞外DNA酶等致病性侵袭力菌毛、夹膜、黏附因子及血浆凝固酶等毒素大肠杆菌肠毒素、破伤风杆菌神经毒素、炭疽杆菌外毒素及鼠疫菌素等结合转移性伞毛的合成,表面排斥,致育性抑制,对信息素的反应和抑制等质粒能自主复制,是能独立复制的复制子(autonomousreplicon)严紧控制(stringentcontrol)型质粒:其复制常与宿主的繁殖偶联,拷贝数较少,每个细胞中只有1个到十几个拷贝。松弛控制(relaxedcontrol)型质粒:其复制与宿主不偶联,每个细胞中有几十到几百个拷贝。质粒的稳定性与不相容性

质粒的不相容性(incompatibility):两种不同质粒因利用同一复制和维持机制,在复制和随后向子代细胞分配的过程中会发生竞争,从而不能在同一宿主细胞内稳定存在,其中一种质粒将被丢失。

携带不同复制和维持机制的质粒属于不同的不相容群,它们可以共存于同一细胞中。影响质粒稳定性的因素:①宿主细胞分裂时质粒能否均衡地分配到子代细胞。②质粒分子自身结构的稳定性。

2.3真核生物基因组的结构与功能真核生物的遗传物质绝大部分存在于细胞核染色体,少部分存在于线粒体或叶绿体中细胞核基因组和细胞器基因组。真核生物染色体基因组特点人类基因组中仅含有25000~30000个基因,远低于预期。在人类基因组中只有很少一部份(约2-3%)DNA序列用以编码蛋白质和结构RNA。人类基因组中存在大量基因间隔区序列,主要由重复DNA构成。在基因内部含大量内含子。单拷贝序列:占40%-80%,结构基因基本上属于单拷贝序列。中度重复序列:重复次数10~105,占10-40%。如rRNA、tRNA、组蛋白以及免疫球蛋白的基因等,另有部分可能与基因的调控有关。高度重复序列:拷贝数大于106

,占10-60%。如反向重复序列

(invertedrepeats)

和卫星DNA

(satelliteDNA)。转录(RNApolI)45SrRNA前体18SrRNA28SrRNArDNA内含子内含子28S5.8S18S剪接5.8SrRNA5SrRNArRNA反向重复序列常见于基因的调控区,可能与复制、转录的调控有关。重复序列的多态性DNA多态性:DNA

序列发生变异从而导致的个体间核苷酸序列的差异。

主要包括

单核苷酸多态性(singlenucleotidepolymorphism,SNP)和

串联重复序列多态性(tandemrepeatspolymorphism)。SNP--由基因组DNA上的单个碱基的变异引起的DNA序列多态性。

据估计,人类基因组中每1kp就存在一个SNP位点,共有约300万个之多,是人群中个体差异最具代表性的DNA多态性。

相当一部分SNP还直接或间接与个体的表型差异、对疾病的易感性或抵抗能力、对药物的反应性等相关。

大多数SNP位点十分稳定,人类85%的SNP是共有的。高度重复序列中的无间隔反向重复序列很容易形成限制性内切酶识别位点,也很容易因为突变产生或是失去一个酶切位点,可以造成

限制性片段长度多态性(restrictionfragmentlengthpolymorphism,RFLP).Restricitonmap改变的酶切位点图谱与检测真核基因组存在多基因家族与假基因多基因家族(multigenefamily):由某一祖先基因经过重复和变异所产生的一组基因。假基因(pseudogene):与某些有功能的基因结构相似,但不能表达有功能的基因产物的某些基因。

多基因家族大致可分为两类:一个基因家族的不同成员成簇地分布在不同染色体上,但核酸序列高度同源,编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内,这种分布方式与DNA复制时需要大量的组蛋白有关。

假基因的产生有两种方式:由突变引起的基因序列变化而失去功能,这样产生的假基因带有内含子,称为常规假基因(conventionalpseudogene)。mRNA经过反转录为cDNA,再插入基因组,由于插入位点不合适或序列发生变化而导致失去功能。这种类型的假基因不含内含子,称为已加工的假基因(processedpseudogenes)。真核生物细胞器基因组真核生物有两类细胞器能携带遗传物质:线粒体和叶绿体。这些遗传物质独立于细胞核基因组外,能够自行复制和表达,又称为染色体外基因组。线粒体基因组编码其自身蛋白质合成体系的某些成员,如rRNA和tRNA等,以及呼吸链中的某些成员,如ATP酶、NADH还原酶、细胞色素氧化酶复合体中的某些组分。其它成员由细胞核基因组编码。

高等动物线粒体基因组具有独特的特点:

①母系遗传。子代线粒体基因组来自母亲,父系的线粒体基因组在精卵结合时一般不能进入卵细胞。

②线粒体DNA损伤后不易修复,突变率较高,可能与衰老及某些疾病有关。

③遗传密码与通用遗传密码存在差别,如UGA(终止密码子)编码Trp,AGA/AGG(Arg)为终止密码子等。2.3基因组学基因组学(Genomics):对生命有机体全基因组进行序列分析和功能研究的学科。人类基因组计划(TheHumanGenomeProject,HGP),1998-2003.结构基因组学:目的是在生物体的整体水平上测定出全部蛋白质分子、蛋白质-蛋白质、蛋白质与其他生物分子复合体的三维结构。基因定位克隆:利用微卫星和SNP全基因组扫描来搜索与疾病性状紧密相关的位点,从而确定疾病相关基因的位置并进一步获得克隆。功能基因组学:根据已有基因的功能推测基因组中具有相似结构的基因的功能,通过实验手段验证。有效的方法有定点突变、基因敲除(knock-out)和RNA干扰及过量表达技术等。蛋白质组学

Proteomics医学分子生物学∙第三章SchoolofLaboratoryMedicine,WenzhouMedicalUniversityKeyLaboratoryofLaboratoryMedicine,MinistryofEducation,China84

主要内容3.1概述3.2蛋白质组学的研究内容和技术3.3蛋白质组学的研究意义及应用蛋白质组(proteome):PROTEins+genOME,意思是Proteinsexpressedbyagenome(基因组表达的所有蛋白质)1994年由澳大利亚科学家Wilkins提出,是一个动态的概念,指的是不同细胞在不同时相表达不同的蛋白质

蛋白质组(原核生物和真核生物)3.1概述对应于基因组的所有蛋白质构成的整体,不是局限于一个或几个蛋白质同一基因组在不同细胞、不同组织中的表达情况各不相同在空间和时间上动态变化着的整体整体性、动态性和系统性各国政府支持,国际著名研究和商业机构加盟:1996年澳大利亚建立了世界上第一个蛋白质组研究中心(AustraliaProteomeAnalysisFacility,APAF)美国国立癌症研究院(NCI)投资1000万美元建立肺、直肠、乳腺、卵巢肿瘤的蛋白质组数据库。NCI和FDA(美国食品药品管理局)共同投资数百万美元建立癌症不同阶段的蛋白质组数据库。英国建立三个蛋白质组研究中心对已完成或即将完成全基因组测序的生物体进行蛋白质组研究。1997年召开了第一次国际“蛋白质组学”会议1998年在美国旧金山召开了第二届国际蛋白质组学会议1999年1月在英国伦敦举行了应用蛋白质组会议2001年4月在美国成立了国际人类蛋白质组研究组织(HPO)。我国也于1998年启动了蛋白质组学研究,在中科院上海生物化学研究所举办了两次全国性的蛋白质组学研讨会2003成立了中国人类蛋白质组组织(CHHUPO),并分别于2003年9月、2004年8月以及2005年8月召开了中国蛋白质组学首届、第二届及第三届学术大会,2004年10月在中国北京召开了第三届国际蛋白质组学会议。蛋白质组学(proteomics):指应用各种技术手段来研究蛋白质组的一门新兴科学,其目的是从整体的角度分析细胞内动态变化的蛋白质组成成份、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,揭示蛋白质功能与细胞生命活动规律。细胞器蛋白质组学:通过纯化细胞器或用质谱仪鉴定蛋白质复合物组成来确定蛋白质在亚细胞结构中的位置。表达蛋白组学:把细胞、组织中的所有蛋白质建立成定量表达图谱或扫描EST图。蛋白质组学包括:SchoolofLaboratoryMedicine,WenzhouMedicalUniversityKeyLaboratoryofLaboratoryMedicine,MinistryofEducation,China903.2蛋白质组学的研究内容和技术蛋白质组学研究的基本流程蛋白质组学的研究内容蛋白质组学的研究技术Westernblot、免疫组化验证蛋白质并确定其定位根据氨基酸序列合成寡核苷酸探针,克隆基因蛋白质功能研究,包括蛋白质生物活性、抗体制备、蛋白质相互作用等方面蛋白质样品电泳前蛋白质样品的处理双向电泳分离Westernblot检测选择目标蛋白斑点,胶内酶切质谱分析(MALDI/TOF或ESI/MS/MS)获得肽质量指纹谱或肽序列标签数据库检索鉴定蛋白质电转印到膜上

图像分析样品处理蛋白质分离蛋白质鉴定

蛋白质组学研究流程图3.2.2蛋白质组学的研究内容1蛋白质组表达模式(组成)的研究蛋白质组成分鉴定、数据库构建、新型蛋白质的发现、同源蛋白质比较、蛋白质加工和修饰分析。2蛋白质组功能模式(作用)的研究基因产物识别、基因功能鉴定、基因调控机制分析。重要生命活动的分子机制(如细胞周期、分化与发育、环境反应与调节等)。医药靶分子的寻找和分析(包括新药靶分子、肿瘤分子标记、人体病理介导分子等)。3.2.3蛋白质组研究技术一、双向凝胶电泳技术二、液相色谱技术三、生物质谱技术与蛋白质鉴定四、蛋白质相互作用的研究技术

一、双向凝胶电泳技术

(一)2-DE的概念2-DE是指第一向的固相pH梯度(immobilizedpHgradient,IPG)等电聚焦电泳与第二向SDS组成的分离系统,也称双向聚丙烯酰胺凝胶电泳,简称2-DE。等电聚焦电泳是基于蛋白质等电点(pI)的差异进行分离,SDS则是根据蛋白质分子量(Mw)的不同进行分离。第一向等电聚焦酸pH梯度低分子量高分子量第二向SDS图

双向凝胶电泳示意图IPG胶条碱1、第一向电泳―IPG等电聚焦电泳

1)等电聚焦电泳的基本原理等电聚焦(IEF)是60年代发展起来的一种蛋白质分析分离手段,如图7-3所示,在电场中电泳基质形成一个从正极到负极不断增大的pH梯度,由于蛋白质为两性电解质,带负电荷的蛋白质分子向正极移动,带正电荷的蛋白质分子向负极移动,当蛋白质分子运动到各自的pI处时,所带净电荷变为零,于是停止迁移而留在该位置上。这种不同的蛋白质分别聚集在各自的pI处,形成一条狭窄稳定的区带而彼此分开的现象称为等电点聚焦。+-1098765432pHpI=8.0蛋白质pI=4.0蛋白质图

等电聚焦的“聚焦效应”+–pH3pH7.5pH10+–pH3pH7.5pH10+–pH3pH7.5pH10+–pH3pH7.5pH10第一向:等电聚焦

2)IPG等电聚焦电泳1975年Gasparic和Bjellqvist合成出了用于IPG制备的单体化合物Immobiline,它是一些具有弱酸或弱碱性质的丙烯酰胺衍生物,结构式如图7-4:CH2=CH-C-N-ROH=(R代表羧基或第三氨基)图Immobiline分子式将Immobiline掺入聚丙烯酰胺凝胶聚合单体中,当凝胶聚合时,Immobiline通过-CH=CH-双键共价镶嵌到聚丙烯酰胺凝胶结构中。利用一系列弱酸和弱碱性的Immobiline进行滴定,在滴定终点附近形成pH梯度并且参与丙烯酰胺凝胶聚合,从而将pH梯度固定化。这种pH梯度是由固定在凝胶基质上的羧基和氨基形成的缓冲对来维持,不容易变动,因此称为固相pH梯度(IPG)。2、第二向电泳―SDS-PAGE1)SDS的原理在PAGE系统中加入SDS和还原剂后所组成的电泳系统。SDS是一种阴离子去垢剂,疏水端能插入蛋白质分子内,破坏蛋白质分子内的氢键及疏水作用,改变蛋白质分子的三级和四级结构;还原剂则断裂蛋白质分子内的二硫键,使蛋白质分子去折叠,结构变得舒展。蛋白质分子与SDS充分结合后,形成带负电荷的蛋白质-SDS复合物,所带负电荷大大超过蛋白质分子原有的电荷量,消除了不同分子间原有电荷的差异。蛋白质-SDS复合物在聚丙烯酰胺凝胶电泳系统中的迁移率不再与电荷相关,而主要取决于椭圆棒的长轴长度,即蛋白质的分子量大小。102+–pH3pH7.5pH10chargesize第二向:SDS电泳

Proteinsmigratethroughthegelatarateproportionaltotheirsize.Smallestproteinstravelthefurthestdistance2)SDS测定蛋白质分子量进行SDS时,蛋白质的迁移率与分子量有如下关系:lgM=K-Rf(M为蛋白质分子量,Rf为蛋白质的相对迁移率,K为常数)。将蛋白质标准(含有5~6种已知分子量的蛋白质)和待测蛋白在同一块胶上电泳,以标准蛋白质分子量的对数(lgM)与Rf作图,得到一条直线,为蛋白质分子量标准曲线。计算待测蛋白的Rf,从标准曲线上查到其分子量。104SchoolofLaboratoryMedicine,WenzhouMedicalUniversityKeyLaboratoryofLaboratoryMedicine,MinistryofEducation,China105双向电泳的流程样品制备第一向等电聚焦第二向SDS凝胶上蛋白的检测蛋白的软件的检测(二)凝胶上蛋白质的检测蛋白质样品经2-DE分离后,凝胶上的蛋白质斑点须用一定的方法使其显现出来,让仪器或人眼检测到。1、考马斯亮蓝染色考马斯亮蓝染色是最常用的蛋白质染色方法。考马斯亮蓝R-250化学名为三苯基甲烷,R代表红蓝色。考马斯亮蓝R-250与蛋白质的碱性基团可逆结合,染色线性范围可达1~55μg,灵敏度为30~100ng蛋白质。考马斯亮蓝染色的最大优点是染色重复性好,操作简便,不影响后续的质谱鉴定,灵敏度比常用的氨基黑高100倍,但低于银染色和荧光染色,不能满足对低丰度蛋白质的检测要求,样品用量大。2、银染色原理在酸性硝酸银溶液中蛋白质与银离子发生作用,然后在碱性pH条件下,银离子被甲醛还原成银颗粒沉淀在蛋白质上而呈显棕黑色。银染色灵敏度很高,是考马斯亮蓝染色法的100倍,但操作繁琐,重复性不如考马斯亮蓝染色,对糖蛋白、钙结合蛋白的染色效果差。考染和银染的比较3、荧光染料染色荧光染料染色法是利用结合于蛋白质的荧光染料发出的荧光来检测蛋白质。用于蛋白质染色的荧光染料很多,有的共价结合于蛋白质上,有的和蛋白质形成非共价结合。目前商品化的荧光染料有SYPRORuby,其染色方法操作简便,灵敏度高达1~10ng,染色线性范围宽,对糖蛋白、脂蛋白染色效果好,不影响后续的质谱鉴定,是一种较理想的蛋白质染色方法,但价格较昂贵。

(三)双向凝胶电泳图谱的计算机分析细胞或组织样本经2-DE分离后,得到一张含有成百上千个蛋白质斑点的凝胶电泳图谱。凝胶图谱分析包括确定蛋白质斑点的位置、大小、染色深浅、pI和分子量;图谱间的比较、差异蛋白质斑点的确定;图谱质量的优化、数据的储存管理、数据库分析等内容。借助先进的计算机技术和生物信息学工具,能客观、有效地从电泳图谱中提取到有价值的信息。1、数字化双向凝胶电泳图谱的获取获取数字化的双向凝胶电泳图谱是进行计算机分析的前提。图像扫描仪、数码照像系统、激光密度仪等可将凝胶(或转印膜)上的蛋白质斑点图像转化成数字化的图像文件,空间分辨率和密度分辨率是衡量图像数字化设备的两个主要参数。

2、图像加工凝胶电泳图谱上除了密布深染色的蛋白质斑点外,往往还带有一定程度的背景染色,降低了图像的质量并干扰低丰度蛋白质斑点的检测。因此要对数字化电泳图谱作增强对比度、背景消减等处理,以消除背景染色。同时,还需对图像的大小及方向进行调整,利于图谱间的比较。

3、蛋白质斑点的检测图像分析软件自动进行蛋白质斑点的识别,通过适当的参数设置,可消除图谱中的条纹,使蛋白斑点尽可能呈点状分布,变得更加清晰。自动检测完成后,仍有一些低丰度蛋白点未被识别出,还有一些是“假点”,另有一些点因距离过近被识别成一个点,需要手工进行添加、删除和分割。整个检测完成后,分析系统会给出关于每个蛋白质斑点的编号、量值、峰值和位置等方面的信息。

4、凝胶匹配(斑点匹配)凝胶匹配是指通过比较两块(或多块)凝胶图谱,将图谱上对应的蛋白质斑点(代表同一种蛋白质)标识出来,称为匹配斑点;只在一块胶上出现的蛋白质斑点也标识出来,称为未匹配斑点,代表可能的差异表达蛋白质。

5、数据分析分析软件根据凝胶匹配的结果,对蛋白斑点进行分析,找出不同凝胶图谱间存在质变和量变的蛋白质斑点。新开发的分析软件还能对凝胶上的蛋白斑点添加注释、评语及其它相关信息等。

6、双向凝胶图谱数据库双向凝胶图谱分析产生成千上万的数据信息,必须有一个好的存储、调用和查询机制来进行管理。现行的双向凝胶电泳图像分析软件具有数据库支持功能,形成图像-数据库间查询链接。一个蛋白质在图谱中标示出来,即可在数据库中查到其相应的描述信息,如该蛋白质的名称、分子量、等电点等;反之,如果蛋白质的名称及其它信息已知,也可在图谱上显示斑点位置。随着互联网技术的发展,还可通过因特网进行实验室间凝胶图谱的比较。(四)2-DE的分辨率、重复性及局限性2-DE系统有很高的分辨率。商品化的IPG胶条以及标准化的实验操作使得2-DE具有很高的重复性,可在不同实验室间进行图谱的比较,给蛋白质组数据的共享带来了极大的方便。目前没有一种分离技术在分辨率上能与双向凝胶电泳相媲美。2-DE存在的不足和缺陷:首先,2-DE的分辨率仍不能满足蛋白质组学研究的需要,人类基因组有3~5万个基因,可能表达的蛋白质达数十万种,这对2-DE技术的分离能力提出了严峻挑战;其次,2-DE对极酸、极碱性和疏水性膜蛋白的分离效果不尽人意,对具有重要功能的低丰度蛋白质的检测也是个很大的难题;最后,2-DE操作过程的自动化是一个亟待解决的难点,自动化的操作平台可减少人为误差,提高实验结果的重复性,带来高通量的分析速度,满足大规模蛋白质组学研究的需要。(五)双向凝胶电泳分离前的样品处理

1、分部提取法用不同的蛋白质提取液分部抽提细胞或组织裂解液,先用水溶液抽提,离心后的上清液中含大部分水溶性蛋白;再用对膜蛋白具有中等溶解度的提取液抽提沉淀,离心后上清液中含中等疏水性的蛋白质,包括膜表面蛋白和膜相关蛋白;最后用强溶解力的提取液抽提沉淀,得到疏水性强的蛋白质。

2、亚细胞成分的分离亚细胞成分的分离是指分离细胞中的各种细胞器和亚细胞结构,如细胞核、线粒体、细胞骨架、核基质、核仁等,用于蛋白质组研究。这是近来蛋白质组学研究中兴起的一个分支—亚细胞蛋白质组学,它不但可提高蛋白质的检出效率,还能获得许多关于亚细胞结构和功能方面的重要信息。3、激光捕获显微切割技术(LCM)

1996年基因公司发明了一种称为激光捕获显微切割(LCM)的新技术,能从临床病理切片标本中切下病变细胞,获得纯净的细胞群。SchoolofLaboratoryMedicine,WenzhouMedicalUniversityKeyLaboratoryofLaboratoryMedicine,MinistryofEducation,China124二、液相色谱技术离子交换色谱:静电结合反相色谱:疏水作用亲和色谱:专一亲和力凝胶色谱:分子大小色谱技术色谱法又称色谱分析、色谱分析法、层析法,是一种制备分离和分析方法。利用不同物质在不同相态的选择性分配,以流动相对固定相中的混合物进行洗脱,混合物中不同的物质会以不同的速度沿固定相移动,最终达到分离的效果。离子交换色谱以离子交换树脂作为固定相,选择合适的溶剂作为流动相,使溶质按照其离子交换亲合力的不同而得到分离的方法。在以离子交换剂为固定相,液体为流动相的系统中进行的。离子交换色谱基本原理离子交换剂是由基质、电荷基团(或功能基团)和反离子构成的,基质与电荷基因以共价键连接,电荷基因与反离子以离子键结合。离子交换剂与水溶液中离子或离子化合物的反应主要以离子交换方式进行,假设以RA+代表阳离子交换剂,其中A+为反离子,A+能够与溶液中的阳离子B+发生可逆的交换反应,反应式为:RA++B+

→RB++A+

离子交换色谱离子交换剂对溶液中不同离子具有不同的结合力,这种结合力的大小是由离子交换剂的选择性决定的。强酸性(阳性)离子交换剂对H+的结合力比对Na+的小;强碱性(阴性)离子交换剂对OH-的结合力比对Cl-的小得多;弱酸性离子交换剂对H+的结合力远比对Na+的大;弱碱性离子交换剂对OH-的结合力比对Cl-的大。反相液相色谱反相液相色谱分离多肽和蛋白质是基于蛋白质的疏水性,因此通常采用非极性的烷基固定相作为填料,其表面化学性质和流动相的选择应最大限度地满足疏水的要求。通常在流动相中加入离子对试剂(三氟乙酸)来增大蛋白质和多肽的疏水性。亲和色谱(Affinitychromatography)利用生物分子间所具有的专一而又可逆的亲和力而使生物分子分离纯化的层析技术。亲和层析示意图亲和色谱(Affinitychromatography)常用专一而又可逆的亲和力的生物分子具有是成对互配的主要的有:酶和底物、酶与竞争性抑制剂、酶和辅酶、抗原与抗体、DNA和RNA、激素和其受体、DNA与结合蛋白等。

注意在成对互配的生物分子中,可把任何一方作为固定相,而对样品溶液中的另一方分子进行亲和层析,达到分离纯化目的。凝胶过滤色层分离法基本原理当含有各种组分的样品流经凝胶层析柱时,大分子物质由于分子直径大,不易进入凝胶颗粒的微孔,沿凝胶颗粒的间隙以较快的速度流过凝胶柱。而小分子物质能够进入凝胶颗粒的微孔中,向下移动的速度较慢,从而使样品中各组分按相对分子质量从大到小的顺序先后流出层析柱,而达到分离的目的。分子筛凝胶色谱原理三、生物质谱技术与蛋白质鉴定(一)质谱的基本原理质谱分析法(MS)是指在一定条件下,将样品分子电离成离子,然后通过测定这些离子的质荷比(m/z)和强度来进行定性和定量的一种分析方法。质谱分析法的过程为:将样品气化并电离成带电离子,然后通过一定方法将不同m/z的离子分开,并测定其强度,绘出质谱图,对质谱图进行分析可得到关于样品分子结构和定量方面的信息。有机分子受到电子轰击后,会断裂形成不同的多种离子,以离子的为横座标,离子强度为纵坐标作图,得到的质谱图称为标准质谱图,也叫棒图。10080604020020401008060分子离子峰基峰相对强度(%)质荷比(m/z)质谱棒图

完整的现代质谱仪由进样系统、离子源、质量分析器、离子检测器、数据处理及控制系统五部分组成,此外还有一个保持质谱仪高真空度的真空系统。离子源和质量分析器是质谱仪最重要的两个部件,也是不同质谱仪的主要差别所在。电喷雾质谱(ESI)和基质辅助激光解吸电离飞行时间质谱(MALDI)为离子源的质谱技术已广泛应用于生物大分子研究,是蛋白质组学研究中不可或缺的分析工具,因此被称为生物质谱(BMS)。

进样系统离子源质量分析器检测器数据采集及分析真空系统

(二)生物质谱电喷雾质谱技术和基质辅助激光解吸附质谱技术是诞生于80年代末期的两项电离技术。这两项技术的出现使传统的主要用于小分子物质研究的质谱技术发生了革命性的变革。具有高灵敏度和高质量检测范围,使得在pmol的水平上准确地分析分子量高达几万到几十万的生物大分子成为可能,并得到迅速的发展。被称做是“软”电离技术,因为在离子化过程中不会破坏分子结构,能实现分子量大于10,000质量单位的生物大分子的质量分析。1、离子源离子源的作用是使样品分子电离成离子,并把离子加速后引入质量分析器。1)MALDI离子源在MALDI离子源中,样品分子需要一些小分子有机物的辅助才能离子化,这些小分子物质称为基质(matrix)。将样品与过量基质形成的混合溶液加于样品靶上,待溶剂挥发后样品分子与基质形成共结晶,激光照射样品,基质吸收激光能量后,均匀地传递给样品分子,使样品分子气化并离子化。

2)ESI离子源由ESI离子源和相应的质量检测器构成的质谱仪称为ESI-MS。ESI是当今质谱中最软的电离技术,其原理是,样品溶液通过毛细管导入离子源,毛细管终端加有高电压,样品溶液在强电场和雾化气的作用下形成带电荷的雾滴,随着溶剂的蒸发,带电雾滴不断变小,电荷密度不断加大,当到达某一临界点时产生离子发射,生成气态样品离子,然后进入质量分析器测定m/z。 N2雾化气4000V样品溶液大气压真空TOF质量分析器电喷雾过程2、质量分析器质量分析器的作用是把从离子源出来、具有不同m/z的离子分开,按先后顺序到达检测器。质量分析器是质谱仪的主体结构,生物质谱中使用的质量分析器主要有四极杆质量分析器、飞行时间质量分析器、离子阱质量分析器等类型。。四极杆质量分析器示意图电极杆(加有直流电压和射频电压)被检离子其它离子到检测器离子源3、生物质谱仪

1)基质辅助激光解吸电离飞行时间质谱(MALDI-TOF-MS)由MALDI离子源和TOF质量分析器构成的质谱仪称为MALDI-TOF-MS。在MALDI离子源产生的样品离子先通过一个加速电场获得动能,经过一个真空无场管的飞行到达检测器,m/z小的离子较早到达检测器,根据离子在无场管中的飞行时间,计算出m/z。MALDI产生的是单正电荷离子,一个质谱峰代表一种分子离子,从质谱峰的位置可直接读出待测物的分子量。2)ESI-MS由ESI离子源和相应的质量检测器构成的质谱仪称为ESI-MS。ESI离子源最常与四极杆质量分析器联用。3)串联质谱串联质谱由离子源、多个质量分析器及碰撞室组成,对样品离子及其碎片进行连续分析,提供关于离子结构方面的信息。下图为串联质谱示意图。离子源四极杆质量过滤器碰撞室四极杆质量分析器离子检测器串联质谱示意图4)质谱仪的主要性能指标分辨率(R)分辨率是指质谱仪将不同值的离子分辨开的能力。灵敏度灵敏度指质谱仪可检测到的最小样品量,由于仪器本身具有噪音信号,如果样品量低于一定限度,则样品信号与噪音信号相混淆,难以区别。质量测定范围指质谱仪能够测定的样品质量范围,是研究生物大分子的重要的性能指标之一,现代生物质谱仪检测的蛋白质分子量可达几十万道尔顿。(三)蛋白质的鉴定蛋白质样本经2-DE分离后,需对蛋白斑点进行鉴定,以确定其身份。利用获得的蛋白质斑点的各种属性参数,在蛋白质数据库中进行检索,寻找与这些参数相符合的蛋白质。如果在数据库中搜寻不到,可能为新蛋白质,需用其它方法进一步鉴定和研究。蛋白质组学研究需要有高通量的蛋白质鉴定方法,MS技术能快速、准确地获得多种蛋白质属性参数,结合生物信息学工具,可迅速进行蛋白质的鉴定。因此,MS已成为蛋白质组学研究中不可或缺的有力工具。下面介绍两种应用MS技术进行蛋白质鉴定的方法。1、肽质量指纹图谱法基本过程为:蛋白质混合物样品经过2-DE分离后,从胶上切下需要鉴定的蛋白质斑点,用胰蛋白酶进行水解,胰蛋白酶在特定位点切割蛋白质,形成长短不一的多肽混合物,用MALDI-TOF质谱仪对多肽混合物进行质量分析,得到肽片段质谱图,一个质谱峰代表一种肽片段离子。由于各种蛋白质的一级结构不同,胰酶水解后产生的肽片段数目及质量均不相同,具有特征性,因此将得到的肽片段质谱图称为PMF。下图为卵白蛋白PMF:2、肽序列标签鉴定法

蛋白质由20种氨基酸组成,在蛋白质上随意选取一个四肽序列,根据概率论计算,另一个蛋白质上出现相同四肽序列的概率为1/204,即1/160,000,因此从理论上说,只要测定一个蛋白质中5~6个氨基酸残基的序列,就足以作为鉴别蛋白质的特异性标签,称为肽序列标签。MALDI-TOF(四)蛋白质组数据库蛋白组序列数据库是蛋白质组研究数据存储、管理的主要形式是实现已知蛋白质的分析鉴定与未知蛋白的发现前提,也是总结蛋白质结构、性质与功能的规律,实现模拟与预测的基础蛋白质组数据库是蛋白质组研究水平的标志和基础

瑞士的SWISS-PROT数据库拥有目前世界上最大、种类最多的蛋白质组数据蛋白质组数据库是蛋白质组研究水平的标志和基础瑞士的SWISS-PROT数据库拥有目前世界上最大、种类最多的蛋白质组数据dbEST数据库

由美国国家生物技术信息中心(NCBI)和欧洲生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论