第6章 基因组学_第1页
第6章 基因组学_第2页
第6章 基因组学_第3页
第6章 基因组学_第4页
第6章 基因组学_第5页
已阅读5页,还剩193页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二部分

化学生物学的概念和技术

第6章基因组学和蛋白质组学基因组作图、测序基因组序列的解读后基因组时代的研究热点1.基因组学蛋白质组学的内容蛋白质组学技术蛋白质组学的应用2.蛋白质组学分子生物学研究目标研究基因和蛋白质的功能通过代谢网络将他们联系起来

分离鉴定

基因蛋白质分子生物学中心法则大规模的研究大量的数据计算机技术处理数据Textinhere转录组蛋白质组基因组现代中心法则转录组学基因组学蛋白质组学6.1基因组学Genomics基因:物质的遗传基础,DNA分子上具有遗传信息。基因组:细胞中全部基因的总和。前基因组时代的“钓鱼”和后基因组时代的“捞鱼”

结构功能进化基因组学

基因组学:基因组学(genomics)是指研究并解析生物体整个基因组的所有遗传信息的学科。基因组计划(GenomeProject)是指对人类以及其它生物体全基因组的测序工作(sequencing)。人类基因组计划(HumanGenomeProject,HGP):90年代提出并已基本完成,同40年代原子弹爆炸,60年代人类登月一起被认为是二十世纪科技发展史上的三大创举。人类基因组计划20世纪80年代提出,由美、英、日、中、德、法等国参加2001年完成的针对人体23对染色体全部DNA的30亿个碱基对序列进行排序对大约25000基因进行染色体定位构建人类基因组遗传图谱和物理图谱的国际合作研究计划。HistoryoftheHumanGenomeProject1990OfficialstartofHGPwith3billion$anda15yearhorizon.1999SangerCentrepublisheschromosome222001DraftGenomepublished:Celera&Public2003Completion(almost)ofHumanGenomeCelera:CraigVenterIntl.Cons:FrancisCollins2000年是基因组之年,完成了人类基因组的工作框架图,完成了一系列模式生物和微生物的基因组序列分析。为什么选择人类的基因组进行研究?人类基因组的23对染色体目的人类是在“进化”历程上最高级的生物,有助于认识自身、掌握生老病死规律;了解生命的起源、了解生命体生长发育的规律、认识种属之间和个体之间存在差异的起因、认识疾病产生的机制以及长寿与衰老等生命现象、为疾病的诊治提供科学依据。对人类的重要意义(1)对人类疾病基因研究的贡献

人类疾病相关的基因是人类基因组中结构和功能完整性至关重要的信息。单基因遗传病和复杂疾病单基因病指由一对等位基因控制的疾病或病理性状。常染色体显性遗传病

常染色体隐性遗传病

致病基因在常染色体上,基因性状是隐性的,即只有纯合子时才显示病状。此种遗传病父母双方均为致病基因携带者,故多见于近亲婚配者的子女。短指症白化病

单基因遗传病的致病基因研究

我国有丰富的疾病资源,特别是一些我国特有的单基因遗传病家系,可提供良好的基础发现新的致病基因.短指症

贵州和湖南3个四代同堂的大家族,有43人同样一双畸形的手,比正常人手指短了几乎一节,中间指节或消失、或融合在其他指节中,脚趾同样如此。乳腺癌女性最常见的恶性肿瘤之一;发病率占全身各种恶性肿瘤的7-10%;发病常与遗传有关,以及40—60岁之间、绝经期前后的妇女发病率较高;仅约1-2%的乳腺患者是男性。腺癌有明显的家族遗传倾向5%~10%的乳腺癌是家族性的如有一位近亲患乳腺癌,则患病的危险性增加1.5~3倍;如有两位近亲患乳腺癌,则患病率将增加7倍。发病的年龄越轻,亲属中患乳腺癌的危险越大。基因诊断

采用“定位克隆”和“定位候选克隆”的全新思路,发现了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因。为疾病的基因诊断和基因治疗奠定了基础。定位克隆从染色体上已知位置出发,克隆或鉴定遗传疾病相关的未知功能基因的技术。大量收集病人家系入手,从家系中分析所要克隆的致病基因的遗传分离方式,找出与该基因紧密连锁的遗传标志,确定标志在染色体上的位置,从定位的染色体区段内分离和克隆所要的基因,再进一步研究该基因的功能。多基因疾病指某种疾病的发生受两对以上等位基因的控制。遗传

影响因素环境例子:心血管疾病、糖尿病、神经精神类疾病

(2)对医学的贡献

基因诊断、基因治疗疗、基于基因组信息的疾病预防、疾病易感基因的识别、风险人群生活方式、环境因子的干预等。(3)对细胞、胚胎、组织工程的推动

胚胎干细胞、克隆技术、器官再造。

干细胞

尚未分化发育的,能生成各种器官组织的全能细胞。主要来源于胚胎,分为全能干细胞和组织干细胞。

日本东京理科大学研究人员从老鼠胚胎内提取两种干细胞,其中包含牙齿生长所需的完整遗传信息。在实验室里培育5天后,干细胞成长为微小的牙蕾。随后,牙蕾被植入老鼠的下颌骨。5周后,新牙萌出。7周后,新牙完全长成。

日本科学家利用胚胎干细胞再造牙齿

(4)对制药工业的贡献

筛选药物的靶点;与组合化学和天然化合物分离技术结合,建立高通量的筛选平台;基因蛋白产物的高级结构分析、预测、药物模拟。药物基因组学研究与个体化治疗在临床上对同样一种疾病使用同一种药物,不同的个体对药物的敏感性和毒性反应有很大的区别。这种区别主要由基因决定的,特别是药物靶点基因、药物代谢基因等的单核苷酸多态性,影响了药物作用的强弱和药物代谢的不同。疾病诊断药物1药物2药物3疾病诊断药物1药物2药物3药物敏感性测定目前的疾病治疗将来的疾病治疗6.1.1基因组作图和测序

遗传图谱VS物理图谱

遗传图谱是指基因或DNA标志在染色体上的相对位置(或距离),通常以基因或DNA片段在染色体交换过程中的分离频率(cM)来表示。cM值越大,两者之间遗传距离越远。

物理图谱是指以已知序列的DNA片段在染色体上的实际位置,位点之间的距离(图距)以碱基对(bp,kb,Mb)作为测量单位的基因组图。6000多个遗传标记已经能够把人的基因组分成6000多个区域,可以找到某一致病的或表现型的基因与某一标记邻近的证据,把这一基因定位于这一已知区域,再对基因进行分离和研究。对于疾病而言,找基因和分析基因是个关键。

1.遗传图谱意义DNA分子标记

限制性片段长度多态性RFLP

DNA序列上的微小变化,甚至1个核苷酸的变化,也能引起限制性内切酶切点的丢失或产生,导致酶切片段长度的变化。RFLPWTMut简单长度多态性SSLP

利用了存在于人类基因组中的大量重复序列,不同样品的同一位点该序列的重复次数不同,表现出多态性。

SSLP复杂性疾病的相关基因研究和疾病易感性分析

在复杂性疾病的中,由于基因的变异加环境和生活习惯等因素的共同影响,使得每个人对不同的疾病的易感性不同。基因变异的一个重要的指标是单核苷酸多态性。

单核苷酸多态性(SNP)

不同个体间在基因水平上的单核苷酸变异,平均每1000对硷基出现一个SNP,2个无关个体间有300万SNPs.

最广泛的遗传标记,分散于基因组中的单个碱基的差异,包括单个碱基的缺失和插入,常见的是单个核苷酸的替换,即单核苷酸的多态性。人类基因组发现了超过1000万个SNP位点,平均每300bp中就有一个SNP!SNPmarkerSNP研究为了解疾病的发病机理,疾病的诊断及疾病易感性研究提供基础。位于外显子区并改变氨基酸序列的SNP以及位于基因表达调控区的SNP可能具有重要临床意义和功能意义生物信息学可提供SNP的数据库和功能预测可能具有重要功能意义的SNP位于外显子区并改变氨基酸序列的SNP位于基因表达调控区如启动子、增强子、转录因子结合区、加尾信号的SNP位于外显子和内含子交界区域的SNP2.物理图谱

采用分子生物学的方法将基因或DNA分子标记在基因组中构建位置图。方法限制性作图荧光原位杂交序列标签位点1)限制性酶切图谱将限制性内切酶位点标记在DNA分子中一种酶切两种酶混合切第二种酶切比较确定相对位置RE1RE2RE1

+RE22)荧光原位杂交(FISH)的基本原理

用已知的标记单链核酸为探针,按碱基互补的原则,与样品染色体中未知的单链核酸进行异性结合,形成可被检测的杂交双链核酸。24色mFISH核型分析技术使用5种荧光染料按比例标记探针,杂交后形成24条染色体各自呈现特异的荧光色彩以供核型分析;为研究人员提供了更丰富详尽的细胞遗传学信息,包括确定标记染色体的来源、检测微小的染色体易位和检测复杂的染色体易位;为肿瘤细胞染色体分析提供了全新、高效的方法。FISH基因定位

两种或两种以上的探针能同时与中期染色体杂交,根据两种颜色杂交位点的相互位置,就能直接确定次序。荧光原位杂交特点具有快速;检测信号强;杂交特异性高;可以多重染色等3)序列标签位点(sequencetaggedsites,STS)

一段较短的、基因组中仅出现一次的DNA片段。

通过2个STS的距离进行定位。

3.链终止法测序

利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。每一次序测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP)。限制:只能测几百个碱基。

Illumina/SolexaGeneticAnalyzer2000Mb/runAppliedBiosystemsABI3730XL1Mb/dayRoche/454GenomeSequencerFLX100Mb/runAppliedBiosystemsSOLiD3000Mb/runSangersequencing13maybe800bplong424.鸟枪法序列测定技术(shotgunsequencing)

将目的DNA随机地处理成大小不同的片段,再将这些片段的序列连接起来的测序方法。随机挑选带有基因组DNA的质粒进行末端序列测定,然后用计算机程序进行序列拼接。霰弹法

先将整个基因组打乱,切成随机碎片,然后测定每个小片段序列,最终利用计算机对这些切片进行排序和组装,并确定它们在基因组中的正确位置。

BAC的构建pBAC108L来自细菌的一个小型F质粒,其中oriS和repE控制了质粒的复制起始,parB和parA控制了拷贝数。100-150KbpinsertionDNAtargetsampleSHEAR&SIZEe.g.,10Kbp±8%std.dev.EndReads/MatePairsCLONE&ENDSEQUENCE590bp10,000bpMate-PairShotgunDNASequencing细胞DNA超声波破碎电泳分离插入表达载体提质粒测序AssemblyoftheIndividualSequencesEventuallyallsequencingreads

mergetoasingleconsensussequence(alargecontig)foreachchromosome.缺点

随着所测基因组总量增大,所需测序的片段大量增加;高等真核生物(如人类)基因组中有大量重复序列,导致判断失误。鸟枪法测序技术不能鉴别高等真核生物基因组中的重复序列

5.新一代测序技术微阵列分析优点无需电泳大规模微型化6.1.2基因组序列的解读知道序列之后

分析序列

非编码DNA(垃圾DNA):是指不能编码蛋白质的DNA序列。

估计人类基因组大约有2~3万个非编码DNA,所以基因包含的DNA序列只占人类基因组总DNA序列的2%左右,有98%的信息是看似无用的“垃圾”。(1)基因的定位非编码DNA的功能

调节基因的活动,转录因子能特异识别基因附近的非编码“垃圾”DNA,通过与它们相互作用参与基因的抑制与激活;假基因,与基因很像,但却不能产生功能性蛋白,可能“牺牲”自己将不利因素引开,而保护真基因免受干扰;合成调节性RNA发挥功能。非编码DNA的存在阻碍基因的定位

筛选出编码DNA?ORF扫描开放阅读框(Openreadingframe,ORF

由编码蛋白质的一系列密码子组成,以从起始密码子ATG开始到终止密码子TAA、TAG、TGA结束。

ATGCGTAAAGGAGAAGAA

MRKGEECVKEKN

A*RRR

计算机扫描找出ATG开始,终止密码子结束的ORF来定位基因。对原核生物有效,高等生物使用困难。cDNA测序

cDNA:与RNA链互补的单链DNA,以其RNA为模板,在适当引物的存在下合成。mRNA反转录cDNA(2)基因功能的确定传统遗传学方法现代同源性分析进化树基因同源性分析基因敲除将细胞基因组中某基因去除或使基因失去活性的方法,是建立在基因同源重组技术基础上。

基因突变辐射化学诱变剂随机突变逆转率病毒可用于动植物细胞的插入;农杆菌介导的T-DNA转化和转座子植物的插入;噬菌体可用于细菌基因敲除表型改变RNA干扰基因敲除(3)比较基因组学对同一物种不同个体以及不同物种的基因组进行比较,分析基因的大小、数量,基因排列顺序,编码序列与非编码序列的特征以及物种进化关系等的学科。小麦基因组是人类基因组的5倍;水稻基因组已测序完成;比较水稻和小麦的基因组比对,分离小麦的基因。可以揭示生命的起源、进化等重大生物学问题,具有潜在的实用价值。通过细菌和人类的基因组比较研究,有可能筛选出只在细菌中存在的基因,成为新的抗菌素的药靶。通过在其他生物定位人类疾病基因的同源基因。(4)功能基因组学(后基因组学)利用结构基因组所提供的信息和产物,发展和应用新的实验手段;通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质得研究转向多个基因或蛋白质同时进行系统的研究。1.DNA芯片2.用标记的DNA与芯片杂交3.检测信号大多数固氮岛内的基因(包括nif

基因)在固氮条件下表达上调,表明固氮岛内新的固氮基因的存在。nif

基因固氮条件与非固氮条件下固氮基因的表达差异比较应用领域:基因表达分析;克隆选择及文库筛选(如cDNA文库)基因突变检测及遗传病和肿瘤的诊断6.1.3后基因组时代的研究热点(1)个人基因组

可为癌症、糖尿病或某些成瘾患者量身绘制个性化基因测序蓝图,提供更加高效的个体医疗。在发病前进行干预防止疾病的发生;根据个人的基因特点用药。

1000美元测序个人基因组

2004年,1000万美元现在,5000美元未来,1000美元。(2)基因组的复制和转录基因组序列基因组信息传递方式蛋白质功能复制转录转录组学

在整体水平上研究细胞中基因转录的情况及转录调控规律的学科,从RNA水平研究基因表达的情况。研究对象:一个活细胞所能转录出来的所有mRNA。

应用

可以提供什么条件下什么基因表达的信息,并据此推断相应未知基因的功能,揭示特定调节基因的作用机制。比对正常人群和患者的转录组差异,筛选出与疾病相关的具有诊断意义的特异性表达差异,可以用于自闭症的诊断。(3)蛋白质的合成和加工蛋白质合成过程:翻译的装置的组装和过程的调控。翻译后修饰蛋白质降解:完成功能后降解,防止沉积影响细胞的正常活动。(4)基因组表观遗传学表观遗传学:核苷酸序列不发生变化,但基因发生了可遗传的变化现象。

胚胎不同的细胞(基因型相同)(表型不同)分化(5)基因组的进化蛋白质、核算大分子如何形成?原基因组protogenome

假说最早,原始的基因是RNA,可自我复制,还可指令一些简单的生化反应。

RNADNA反转录新基因产生方式

通过基因组加倍生长基因重组外源基因水平转移比较基因组学了解基因组的进化规律老山发现西汉王陵墓

提取DNA鉴定,女主人是中原人

A1501菌中特定的基因组成及两端的保守基因提示,该区域在假单胞菌中可能为一个插入或者基因重组的热点。

6.2

蛋白质组学

蛋白质组(Proteome)一词最早由澳大利亚学者Wilkins等于1994年提出。定义:指的一个细胞或生物体所有蛋白质的总和。

蛋白质组学(proteomics)是对蛋白质组的大规模和系统性的分析,在蛋白质水平上定量、动态、整体性地研究生物体。

蛋白质的分离、鉴定;蛋白质功能分析;蛋白质相互作用。6.2.1蛋白质学的内容蛋白质组学的重要性整体水平上研究生命现象,为提取宏观的生态学规律提供信息;基因灭活的方法研究基因和蛋白质功能的方法在一些情况下不能提供准确信息;细胞内蛋白质数目过多,不同位置具有不同功能,蛋白质组学方法可以研究蛋白质在特定时间、位置的功能;为靶点药物的设计提供新的思路。蛋白质组具有多样性和可变性的特点(1)蛋白质的种类和数量在同一机体的不同细胞中是各不相同的。(2)同一细胞,在不同时期、不同条件下,蛋白质组也是在不断改变的。(3)在病理或治疗过程中,细胞蛋白质的组成及其变化与正常生理过程的也不同。蛋白质组学的研究内容

蛋白质的序列和高级结构(结构蛋白质组学)

X-射线单晶衍射分析核磁共振波谱分析结构测定方法

基因序列蛋白质序列蛋白质结构蛋白质功能(2)

表达蛋白质组学Yourtextinhere鉴定

研究细胞或组织内蛋白质的表达模式及修饰情况。分离定量分析表达蛋白质组学对蛋白质组表达模式的研究

检测细胞、组织中的蛋白质,建立蛋白质定量表达图谱;在整个蛋白质组水平上提供了研究细胞通路、疾病、药物相互作用和一些生物刺激引起的功能紊乱的可能性;对寻找疾病诊断标志、筛选药物靶点、毒理学研究等具有重要作用。关键技术双相电泳多维液相色谱质谱快速、高通量(3)功能蛋白质组学

澳大利亚,美国,欧洲和日本等己纷纷成立了有关的研究机构和公司;美国各大学和大制药厂,均迅速启动了蛋白质组学研究。重大疾病相关生理病理过程的功能蛋白质组学肝肿瘤细胞相关的功能蛋白质组谱和关键蛋白的结构与功能;线粒体相关的功能蛋白质组谱和关键蛋白的结构与功能的研究红细胞膜相关的功能蛋白质组谱和关键蛋白的结构与功能的研究;

研究方法同源性分析蛋白质结构相似性分析(4)细胞图谱蛋白质组学

确定蛋白质在亚细胞结构中的位置,通过纯化细胞器或用质谱仪鉴定蛋白复合物组成等。研究蛋白质在细胞内的行为、运输及蛋白质相互作用网络关系,它对确定蛋白质功能和疾病诊疗的靶位极有价值。

(5)相互作用蛋白质组学

蛋白质之间和核酸之间和其它小分子ProteinInteractions二恶英对细胞色素P450酶基因转录的影响蛋白质网络为什么要用网络?网络能更清楚的表示大量元素间的复杂关系。网络这种形式可以更好的解释结构和功能间相互影响的关系。进一步的研究可以理解复杂网络中疾病的机理。互相作用研究的意义阐明蛋白质在细胞中的代谢途径;研究蛋白质自身的功能;研究疾病的产生和发展。6.2.2蛋白质组学中用的技术、方法蛋白质分离技术(1)双向电泳等电聚焦(IEF)SDS等电聚焦第1步分离pH3pH10等点聚焦pH梯度建立的方法:1.使用合成的两性电解质,上样前加电场2.使用固相pH梯度胶,胶中固定好两性电解质第2步分离蛋白质按分子量分离pH3pH10SDS-PAGE

聚丙烯酰胺凝胶电泳是网状结构,具有分子筛效应。蛋白在其中依三种因素分开:蛋白大小,形状和电荷。解聚后的氨基酸侧链和SDS结合成蛋白-SDS胶束,所带的负电荷大大超过了蛋白原有的蛋白量,这样就消除了不同分子间的电荷差异和结构差异。蛋白质亚基的电泳迁移率主要取决于亚基分子量的大小,电荷因素可以忽视。2D-Gel

(2)液相色谱(层析法)谱法两相固定相:固定不动的

流动相:不断流过固定相

利用待分离的各种物质在两相中的亲和能力的不同来进行分离的。分离原理分类

按两相的状态分

气相色谱法(GC)和液相色谱法(LC)。

按分离机制分亲和色谱离子交换色谱反相色谱尺寸排阻色谱缺点不能像双向电泳直观看到蛋白质点;不能推算其等电点和分子量。色谱:优势在于分离,但其难以得到物质的结构信息,主要依靠与标准物对比来判断未知物,对无紫外吸收化合物的检测还要通过其它途径进行分析。

质谱:能够提供物质的结构信息,用样量少,但其分析的样品需纯化,具有一定的纯度之后才可以直接进行分析。液质联用(HLPC-MS)①分析范围广,MS几乎可以检测所有的化合物;②分离能力强,在色谱上没有完全分离开,通过MS的特征离子质量色谱图来进行定性定量;定性分析结果可靠,给出每一个组分的分子量和丰富的结构信息;④检测限低,MS具备高灵敏度;⑤分析时间快;⑥自动化程度高。2.

蛋白质鉴定技术(1)抗体鉴定

亲和色谱抗体芯片免疫共沉淀

抗体获得不容易每种抗原均需要抗体灵敏度和特异性问题缺点(2)降解测序法

Edman降解法异硫氰酸苯酯PITC缩短一个氨基酸限制:每次测30-40个氨基酸。解决方法:蛋白内切酶处理成小段。

(2)质谱在蛋白质鉴定中的应用

质谱法是一种按照离子的质核比(m/z)大小对离子进行分离和测定的方法。 质核比:离子质量与它所带电荷的比值。

(1)准确测定物质的分子量(2)根据碎片特征进行化合物的结构分析分析时,首先将分子离子化,然后利用离子在电场或磁场中运动的性质,把离子按质核比大小排列成谱,此即为质谱。质谱法的主要作用种类基质辅助激光解吸电离-飞行时间(MALDI-TOF)电喷雾离子化质谱(ESI)检测器电喷雾质谱组分分子被一束加速电子碰撞撞击使分子电离形成正离子离子也可因撞击强烈而形成碎片离子荷电离子被加速电压加速,产生一定的速度v与质量、电荷及加速电压有关肽质量指纹图谱(PeptideMassFingerprinting,PMF)

蛋白质被识别特异酶切位点的蛋白酶水解后得到的肽片段的质量图谱。

每种蛋白的氨基酸序列不同,当蛋白水解后产生的肽片段序列也各不相同,因此其肽质量指纹图也具有特征性。电脑数据搜索3.

蛋白质定量技术细胞不同的发育阶段或疾病发展不同阶

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论