版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、哈尔滨医科大学博士学位论文文 献 综 述遗传性疾病(hereditary disease)简称遗传病,即遗传物质改变所导致的疾病。遗传的物质基础是DNA,作为遗传信息的载体,DNA分子中核苷酸的组成或序列变化可能使基因表达产物蛋白质的序列或结构发生改变,进而导致蛋白质功能异常。多数变异对机体的功能或健康无影响,并使机体对环境变化产生更大的适应能力,这种无害的突变称为多态性(polymorphism)。但某些突变会影响机体的功能,并以一定的方式传递给后代,从而导致遗传性疾病的发生。另外基因组的不稳定性同样也可能导致遗传病。遗传性疾病的研究是医学遗传学的主要内容,也是人类遗传学的重要突破口。遗传性
2、疾病的研究通常采用基因定位的方法寻找致病基因,并通过研究基因突变与疾病发生的相关性,来进行遗传病的诊断、筛查及相应的治疗。白内障(cataract)是一种发病率高、严重危害人类生存质量的疾病,对其研究历史已达一个世纪之久。在先天性白内障(congenital cataract)的分子遗传学研究中,主要以家系研究为基础,通过连锁分析方法确定致病基因在染色体上的位置,并采用定位候选克隆策略,选取可能的候选基因进行突变分析,以期对疾病的发病机理有更加深入和透彻的认识。下面仅就遗传性疾病、基因定位策略及其相关的遗传学算法(主要为简单疾病研究中的连锁分析)及遗传性先天性白内障的研究进展做综合论述。一 遗
3、传性疾病从环境与机体统一的观点看,人的健康决定于人的遗传结构与其周围生活环境相互作用的平衡,遗传物质或环境因素的改变均可导致这种平衡的破坏而产生疾病,因此可以说,任何疾病的发生都是遗传因素与环境因素相互作用的结果。据此可将疾病大致分为以下三类: 遗传因素起主导作用的疾病; 环境因素起主要作用的疾病; 遗传因素与环境因素都很重要,遗传因素提供了产生疾病的必要的遗传背景,环境因素促使疾病表现出相应的症状和体征。 遗传性疾病的特点遗传性疾病通常具有先天性、终生性和家族性的特点。突变若发生在配子形成(gametogenesis)期,则双亲并没有这类缺陷,而这个患病个体成为起始突变者,若患病个体存活下去
4、并能够延续后代,他(她)就可能成为后代子孙患病的祖先,此现象称建立者效应(founder effect)。但有些基因突变或染色体畸变具有致死性或明显降低生殖力,以致这种缺陷不能传递到后代。遗传性疾病常表现为先天性(如遗传性先天性白内障)且终生患病,但先天性疾病(congenital disease)并不都是遗传病。在胎儿发育过程中,由于环境因素或母体条件的影响,可出现非遗传性先天性疾病。而有些遗传性疾病表现为晚发,尤其是那些由遗传和环境条件共同支配表现型的遗传性疾病,某些致病基因的作用仅在个体达到一定发育阶段后才表现出来,遗传性疾病通常表现为家族性,主要是因为同一家系中的成员可能共同具有某一致
5、病基因。但同一家系的成员长期处于相似的生活条件和环境中,使得那些受环境因素影响较大的非遗传性疾病有时也具有家族性。同时一些遗传性疾病(隐性遗传病)仅在基因型为纯合状态下才表现出来,发病概率小,因而相似于散发性疾病。遗传性疾病的发病中存在着异质性现象,临床上完全相同或极为相似的症候群可以由两种或更多的基因突变所导致,如家族性脑海绵状血管瘤(Cerebral cavernous malformation, CCM,OMIM#116860)等。总体说来,遗传性疾病具有以下几个特征: 垂直传递(vertical transmission)遗传病不同于水平传递的传染病,而是具有上代传递给下代的特点。但不
6、是每个遗传病的家系中都能观察到这一现象。因为有的患者是首次突变产生的病例,即为患病家系中患者的“始祖”;有些遗传病特别是染色体异常的患者,由于活不到生育年龄或不育,以致在家系中观察不到垂直传递的现象。 遗传物质的突变或染色体畸变。 不是任何细胞的遗传物质改变都可以传给下一代,只有生殖细胞或受精卵的遗传物质发生改变才可以传给下一代。肿瘤是一种体细胞遗传病,这种病变一般不能传给下一代。 患者在亲代和子代中以一定数量出现,即患者与正常家庭成员之间有一定的比例关系。 在有亲缘关系的个体之间的婚配(近亲婚配)所生育的子代中遗传病发病率高于一般群体,且该病不延伸至无亲缘关系的个体。 单卵双生比异卵双生患病
7、的机会大得多。 遗传性病的分类依遗传物质改变的不同,目前普遍将遗传性疾病分为五类:单基因疾病或称简单疾病(monogenic or simple disorder)、多基因疾病或称复杂疾病(polygenic or complex disorder)、染色体病(chromosomal disease)、线粒体遗传病(mitochondrial disease)和体细胞遗传病(癌症)。1 单基因疾病单基因疾病(monogenic disease)是指受一对主基因异常的影响而发生的疾病,它的遗传符合孟德尔定律,也称孟德尔式遗传的疾病(Mendelian disease)。目前,人类单基因遗传的性状
8、有6,000多种。依传递方式不同,又可分为常染色体显性遗传病、常染色体隐性遗传病、X连锁(显性和隐性) 遗传病和Y连锁遗传病。 常染色体显性(autosomal dominant, AD)遗传病常染色体显性遗传病是指如果其致病基因位于常染色体上,以显性的方式遗传,即杂合时即可发病。如并指I型、软骨发育不全和成骨不全症I型。常染色体显性遗传病系谱图有以下特征: 除新突变外每一患者的双亲中必有一患者; 患者的子女或同胞中患者与非患者的机会各为一半; 性状的传递与性别无关,即男性与女性患者都可以将遗传性状传递给儿子或女儿,且患病机会均等; 患者的正常子女所生育的后代全部正常; 如该病不损害患者的生存
9、和生育,该性状便呈垂直传递。常染色体显性的遗传方式包括完全显性(complete dominance)、不完全显性(incomplete dominance)或半显性(semidominance)、共显性(codominance)、从性显性(sex-influenced dominance)、延迟显性(delayed dominance)和不规则显性(irregular dominance)。目前已知人类大约有3,000余种遗传性状(包括遗传病)是按常染色体显性遗传方式传递的。 常染色体隐性(autosomal recessive, AR)遗传病如果一种疾病其致病基因位于常染色体上,传递方式是
10、隐性的,即杂合时并不发病,而是由携带者携带着致病基因向后代传递,直至隐性纯合时才发病,以这种方式遗传的疾病就称为常染色体隐性遗传病。这类异常已被认识到1,730种,如白化病。常染色体隐性遗传病的系谱有如下特点: 患者双亲无病而肯定是携带者; 患者同胞中1/4将会患病而且男女患病机会均等; 患者子女一般并不发病,所以看不到连续传递,常为散发的病例; 在近亲婚配的情况下,子女中发病风险增高。在致病基因频率低的常染色体隐性遗传病中,发病往往由近亲婚配后所导致。 X连锁遗传病有些简单遗传病的致病基因位于X染色体上,在上下代之间随着X染色体传递,称为X连锁遗传(X-linkage inheritance
11、)。这类异常已被认识412种。包括X连锁显性(X-1inkage dominant, XD)和X连锁隐性 (X-1inkage recessive, XR) 遗传。X连锁遗传中基因传递的方式不同于常染色体遗传,其存在着交叉遗传 (criss-cross inheritance) 的现象。也即是男性的X连锁基因只能是从母系传来,并只传递给他的女儿。 X连锁显性遗传病若是疾病的致病基因位于X染色体上,杂合时即可发病,称为X连锁显性遗传病,如遗传性肾病。X连锁显性遗传病系谱特征如下:A. 家系中女性患者多于男性患者;B. 患者双亲一方患病;如果双亲都无病,则该患者为起始突变者;C. 由于交叉遗传,男
12、性患者的女儿全将发病儿子则正常的;女性患者的子女各有1/2发病;D. 连续传递即常可见连续几代中都有发病患者。 X连锁隐性遗传病若某种遗传病的致病基因位于X染色体上,杂合时并不发病、直至纯合时发病,称为X连锁隐性遗传病,如假肥大型肌营养不良和甲型血友病。在这类遗传病中,男性只有一条X染色体,称为半合子(hemizygote),因为Y染色体上无等位基因,所以男性也会表现出相应的疾病。X连锁隐性遗传病系谱特征如下: A. 家系中男性患者远多于女性患者,在一些致病基因频率低的疾病中,很少看到女性患者;B. 双亲无病时,儿子有l/2风险患病;女儿则无患病风险;C. 由于交叉遗传,患者的兄弟、姨表兄弟、
13、舅父、外甥存在患病风险;D. 因为一些XR病有致死效应,所以很少看到有男性中连续传递,多见经女性携带者传递。 Y连锁遗传病某些疾病的致病基因位于Y染色体上,随Y染色体而传递,从男性传给男性,称为Y连锁遗传(Y-linkage inheritance)或全男性遗传(holandric inheritance),这类异常已被认识19种,如无精子因子。2 多基因疾病除了单基因遗传病外,临床上还可见到另外一些在人群中发病率较高(1%)、常表现为家族性聚集倾向的性状或疾病。常见性状如身高、智商等,常见疾病如糖尿病、特发性高血压、唇裂、腭裂和精神分裂症等。这些遗传性状或遗传病不决定于一对主基因,其遗传基础
14、是多对基因,这些基因对该遗传性状或遗传病形成的作用是微小的,且效应大小不一,经积累、叠加或互补后可以形成明显的表型,称为微效基因(minor gene)、加性基因(additive gene)或修饰基因(modifier gene)。近些年研究表明,多基因疾病的遗传基础中除微效基因外,也有一些主基因的参与,并受环境因素的影响,所以这类疾病称为多基因遗传(ploygenic inheritance)病或称多因子遗传(multifactorial inheritance)病,又称复杂疾病(complex disorder)。遗传基础和环境因素共同作用决定人体是否易于患病称易感性(susceptib
15、ility),在群体多基因遗传病中呈正态分布,当达到一个限度即阈值(threshold)后个体即表现发病。多基因病的遗传常见如下特点: 发病有家族性聚集倾向,患者亲属发病率高于群体发病率,但绘成系谱后不符合任何一种单基因遗传方式,同胞中发病率远低于1/2或1/4,即不符合AD、AR、XD或XR; 患者双亲、同胞、子女的亲缘系数相同,均为1/2,有相同的发病风险。这与AR病不同,AR病患者双亲和子女般并不发病,而肯定是携带者,患者同胞的发病风险为1/4; 随着亲属级别的降低,患者亲属的发病风险迅速降低,群体发病率愈低的病种中,这种特征愈明显,这与AD病中亲属级别每降低一级,发病风险降低1/2的情
16、况也是不同的; 近亲婚配时,子女的发病风险也增高,但不如AR病那样显著; 发病率有种族(或民族)差异,这表明不同种族(或民族)的基因库是不同的。3 线粒体遗传病在有性生殖中,受精方式的约束决定了线粒体病的母系遗传现象。曾有一些学者提出某些疾病可能属细胞质遗传,直到1987年Wallace等通过对线粒体DNA突变和Leber病的关系进行研究后,才明确提出线粒体DNA突变可引起人类的疾病。短短的十几年,这一领域的发展十分迅速。现已发现人类100余种疾病与线粒体DNA突变有关,如线粒体心肌病、帕金森等。4 染色体病染色体病是先天性染色体数目异常或结构畸变而引起的疾病。数目异常包括整倍体(如三倍体、四
17、倍体)和非整倍体(如亚二倍体,超二倍体)数目异常,结构畸变包括缺失、重复、倒位、易位等断裂、连接和环状染色体等。染色体的行为对基因组稳定性有着十分重要的作用,因此当出现数目和结构异常时常引起多种疾病或综合征,对机体危害极为严重,甚至可能致死。临床上常见的染色体遗传病有Klinefelter综合征、Turner综合征、Downs综合征等。5 体细胞遗传病体细胞中遗传物质改变导致的疾病称为体细胞遗传病。体细胞中遗传物质的改变,一般不向后代传递。在各种肿瘤的发病中都涉及到了特定组织中染色体和癌基因或抑癌基因的变化,所以是体细胞遗传病。 遗传性疾病的研究方法遗传性疾病研究最主要的方法是以家系研究为基础
18、的连锁分析(linkage analysis)和以群体研究为基础的连锁不平衡分析(linkage disequilibrium analysis,又称等位基因关联分析,allelic association),两者都是利用分布于人类基因组内高度多态的遗传标记(genetic marker)来寻找致病基因所在的染色体区域。遗传图谱(genetic map)又称连锁图谱(linkage map)或遗传连锁图谱(genetic linkage map),是指人类基因组内基因以及专一的多态性遗传标记相对位置的图谱。多态性遗传标记是建立遗传图谱的要素,也正是由于遗传标记的发展,使得遗传图谱的研究经历了从
19、经典的基因连锁图谱到现代的DNA标记连锁图谱的过程。在经典遗传学中,重组体在群体中出现的机率(即重组率)可以反映同一条染色体上两个座位间的相对距离和位置关系。因此经典的遗传图谱主要研究多样性基因所构成的连锁群(linkage group)以及连锁群中各基因的线性关系,它可以显示一个连锁群内等位基因的顺序,但不能告诉人们某个基因的具体位置,更不能克隆这一基因。经典的遗传图谱只是停留在遗传学的表象阶段,其实际利用价值不大。现代遗传图谱概念最早由Botstein提出,其精髓在于将单纯的表型研究深入到DNA分子的本质上去,即表型多样性对应于DNA分子的多样性。1 遗传标记及其相关参数 遗传标记目前为止
20、遗传标记共经历了三代的发展,伴随着遗传标记的发展,人类也开始逐步了解基因组的结构与功能。 第一代遗传标记第一代标记是一类经典的遗传标记。最初主要是利用蛋白质或免疫学的标记,如ABO血型位点标记、HLA位点标记等。但是由于已知的多态的蛋白质很少,等位基因的数目有限且无法获得足够的信息量和检测技术的繁琐等因素,限制了人类基因组的遗传分析工作,这促使人们设法从DNA上寻找标记。70年代中后期建立起来的限制性片段长度多态性(Restriction Fragment Length Polymorphism, RFLP)是第一代多态性DNA标记。这类标记在整个基因组中确定的位点数目可达105以上。RFLP
21、主要研究对象是各种形式的序列水平上的DNA限制性多态性,包括单碱基改变、插入或缺失突变、长度重复多态性等引起酶切位点的获得或丢失,经限制性内切酶特异性切割后,由于DNA一个“点”上变异所造成的“能切”与“不能切”的两种状况可产生不同长度的片段(即等位片段,allele),再通过凝胶电泳来显示这一长度的多态性,并从片段多态性的信息与疾病表型间的关系进行连锁分析,找到致病基因。这一方法最成功应用是在发病率较高、病情严重的Huntington舞蹈症基因的定位。虽然RFLP遍布于整个基因组,但有其局限性,即由于酶切只能产生23个片段,可提供的信息量有限,有时还需要用放射性同位素标记的DNA片段为探针检
22、测RFLP,因而又存在着工作环境和费用等问题。 第二代遗传标记第二代遗传标记即大量可变数量串联重复(variable number tandem repeat, VNTR),比第一代标记物有很大的优越性,包括微卫星(microsatellite)和小卫星(minisatellite)等。微卫星标记系统也称简短串联重复(short tandem repeat, STR),于1989年被发现和建立,重复单位为2-6个核苷酸,其最突出的优点是:在基因组中分布较广,数目多;由于CA等简短重复不受进化上的选择,以至于在同一位点中数目变化很大,具有高度多态性,提供的信息量相对很大;符合孟德尔遗传规律。这样
23、就可以为连锁分析提供足够多的遗传信息,又加之利用PCR及电泳进行检测的手段相对容易,可以实现操作自动化,使得这一系统成为目前在基因定位的研究中应用最多的标记系统,并用做大规模基因组扫描方法的基础。微卫星系统使人类基因组的遗传制图与连锁分析发生了革命性的变化,在一定程度上推动了许多复杂的多基因遗传病的研究。1996年初,法国Gnthon实验室与美国国立卫生研究院几个中心合作,建立了有5,264个以STR为主体的遗传标记,两个标记之间的平均距离为0.7cM,即两个位点之间有0.7的几率进行遗传重组(1)。 第三代遗传标记随着基因组研究的发展,1996年美国麻省理工学院(MIT)的人类基因组研究中心
24、负责人Lander ES又提出了一类新的称作SNP(Single Nucleotide Polymorphism, SNP)的遗传标记系统(2),即单核苷酸多态性标记,也称第三代遗传标记系统。人类群体中有很大的遗传多样性,而在大多数基因位点上都会有若干个等位型(alleles);对每一个核苷酸来说,其突变率大约为10-9左右,这就意味着每一个核苷酸在任何一代人群中大约每1109个个体就会发生一次变异。由这种方式产生的单碱基变异就形成许多双等位型标记(biallelic maker),这种标记平均约每1,000个碱基对就会有一个,在人类基因组中可达3106个。因此34个相邻的这种标记构成的单倍型
25、(haplotype)就可以有816种,相当于一个微卫星标记形成的多态性,目前已知约有60,000个SNP位于基因外显子区域,即85%的基因外显子相距5kb就有1个已发现的SNP。这种标记的开发和应用摒弃了遗传标记分析技术的“瓶颈”凝胶电泳,同时数目多、覆盖密度大,为DNA芯片或微阵列技术应用于遗传作图提供了基础,因此在基因定位研究中就有着其它标记不可比拟的优越性(3)。 多态性标记的相关参数能够成为DNA标记的多态性位点必须具有足够的信息度(informativeness)。衡量信息度的参数主要有多态信息含量(polymorphic information content, PIC)和杂合度
26、(heterozygosity)。标记的多态信息含量是家系中推断得到的信息提供者的期望分数,理论上PIC应在01之间,PIC等于0时意味这一标记位点的等位片段只有一个,等于1时表示其等位片段无限多,一般认为PIC大于0.7的标记是高信息度的。杂合度是指随机选择的某个个体在某一标记位点上同时有两个杂合的等位片段的可能性。PIC一般要比杂合度低,因此可以作为某些特殊交配条件下杂合度的校正量。标记系统的信息度对于遗传病的基因定位是非常关键的,往往直接影响多态性标记连锁图谱的构建。目前典型的基因组扫描使用微卫星标记密度在10cM左右,杂合度大多在0.65-0.8之间,如Genthon的遗传图谱的终分辨
27、率为0.7。一般说来,在相同PIC值要求下,SNP图谱的密度应为微卫星图谱的2.25-2.5倍。这样,在相同的信息提取效果下,使用10cM间隔的微卫星图谱即300个左右的微卫星标记进行的初期连锁分析,与4cM分辨率的约750个SNP图谱差不多,但显然后者对基因定位的范围更窄。提高某个位点信息度和杂合度的方法是确定该位点相邻近区域的其他多态性位点,一定范围内多态性位点连锁相所构成的单倍型就可以做为一个整体的标记位点去看待。2 基因定位与克隆建立起表型与基因型之间的关系是遗传学的基本目标,人类遗传学主要分析引起个体间表型差异的遗传机制,医学遗传学则主要研究导致疾病发生的遗传机制。然而,寻找决定表型
28、或疾病性状的基因是非常困难的,因为无法象对待其它生物一样对人体进行实验干预。虽然孟德尔的遗传规律很早就已经用于植物以及动物的育种工作,但在1980年提出使用遗传多态性标记来进行全基因组连锁分析之前,人们甚至是对于简单的孟德尔遗传病也没有一个可以普遍使用寻找致病基因的方法。人类基因组计划开展后,人们对自身基因组有了进一步的了解,随着遗传图谱、物理图谱、序列图谱和基因图谱的发展和完善,以及与此相应发展起来的技术和算法为人们提供了研究表型和基因型的纽带,使人们认识到越来越多的疾病的直接病因及其发病机制。基因定位(gene mapping)就是利用不同的方法将基因确定到染色体的实际位置上。在基因定位的
29、历史上,1911年Wilson人类将红绿色盲基因首次定位到X染色体上,开创了基因定位的先河。基于技术及方法的局限性,1968年前利用家系连锁分析定位的基因都局限于X染色体, 1968 年Donahue利用系谱分析将Duffy血型基因定位于1号染色体上,这是人类首次将基因定位于常染色体上。1970年代以来,各种生物技术迅速兴起,特别是体细胞杂交、重组DNA、分子杂交和PCR等技术的出现和应用,使得基因定位的方法愈益先进。随着人类基因组计划的正式启动,基因定位更是迅猛发展,其成果是导致克隆了越来越多的致病基因,提高了对疾病产生的病因学认识,并开拓了先进的基因诊断和基因治疗技术。基因定位有体细胞杂交
30、(somatic cell hybridization)、杂种细胞克隆嵌板(panel of clonal hybrids)、原位杂交(in situ hybridization, ISH)、荧光原位杂交(Fluorescence in situ hybridization, FISH)、放射杂种(radiation gybrid)、同线同源定位、连锁分析(linkage analysis)等方法。无论是哪种方法,都是试图建立基因和疾病表型之间的某种可能联系。其中连锁分析既是最传统又是与现代生物技术结合有新发展的重要基因定位方法。人类的各种遗传病有6,000多种,许多遗传病导致的表型与正常表型
31、相比形成了遗传病的多样性。利用表型多样性与多态性的DNA标记间的连锁分析,我们就可以将该致病基因定位于染色体的某一位置乃至某个标记附近,再通过各种其他手段,就有可能克隆到该基因,从而为揭示遗传病的致病机理及进一步遗传咨询和治疗奠定基础。目前用于克隆的方法主要有4种: 定位克隆(positional cloning)定位克隆是伴随着人类基因组计划而发展起来的基因克隆的新策略,是通过疾病表型来观察致病基因与多态性标记之间的连锁关系,而将基因定位并进一步分离和克隆的策略。其起点是定位,即建立表型(包括疾病)与基因组中的某一区域之间的联系,然后应用“物理图谱”的物理标记来将经典遗传学标记转变为“物理标
32、记所代表的明确的基因组区域,再以相关区域的“邻接克隆群”来筛选可表达的结构基因,即建立该区域的转录图,然后比较患者与正常人这些结构基因的区别以确定与疾病相关的改变,最后确定疾病相关基因。定位克隆抓住了“表型”与“基因”之间的实质性联系,而摒弃了在这两者间发生的多途径、多因子参与、漫长而复杂的生理生化过程。 功能克隆(functional cloning)人类的性状(包括疾病)都与蛋白质功能有关。功能克隆便是从蛋白质功能着手的基因分离策略,是利用基因的产物蛋白质或RNA推知相应基因的序列。功能克隆技术成熟、方法直接、费用较低,且不依赖于基因组信息。在许多研究中,由于对疾病症状的生理生化及有关蛋白
33、质了解甚少,因此功能克隆较为适用。其缺点是得不到每一基因的具体功能,也不易与人类遗传性疾病取得从表型到遗传型的一致性。镰状细胞贫血病的基因鉴定就是功能克隆的典型例子。 候选克隆(candidate cloning)候选克隆策略是随着人类基因组计划的进展,已定位克隆的基因越来越多的情况下派生出来的一种新的捷径。它是根据与遗传疾病可能相关的生理特征,去进一步确定与这些生理特征相关的候选基因,再在这些候选基因上寻找与疾病表型可能相关的数据,以此确定致病基因的方法。候选克隆策略主要是对一些多基因或表型复杂的疾病较为适用,但其风险较大,而且受到许多尚未克隆的可能相关候选基因的限制。 定位候选克隆(pos
34、itional candidate cloning)定位候选克隆是定位克隆与其他几种克隆手段的交叉和结合,是基于家系基础上的遗传性疾病研究最常用的方法,也是目前最有前途和发展前景的克隆策略。它是通过遗传图谱与连锁分析先将致病基因定位于染色体的某一适当狭窄的区域,再对该区域中分布的基因位点一一进行筛选和确认从而找到与遗传病相关的基因。其基本步骤如下: 搜集有价值的遗传病家系并进行详细的资料整理。对遗传病家系要进行认真细致的资料整理工作,并采集家系成员外周血进行DNA提取。一个较大、多世代个体、亲缘关系肯定的大家系,能在一定程度上排除座位异质性;而详尽确凿的临床诊断不但能确定疾病的类型,还能排除家
35、系的临床异质性,这些都为后续研究提供了良好的工作基础; 应用连锁分析的方法对疾病的遗传位点进行定位。选择足够数量和适当密度的多态性遗传标记对家系中成员的DNA进行基因扫描,可分初步扫描和精细扫描两步进行,力求将致病基因精细定位至染色体适当狭窄区域; 用多个遗传标记的基因分型组成家系成员的单倍型,根据单倍型重组情况尽可能缩小连锁区域; 在已确定的染色体区域内,利用人类基因组数据库中已有的数据,寻找与疾病的生理、生化及功能相关的候选基因; 对候选基因进行突变分析,寻找能够引起蛋白质产物序列或结构改变、并引起功能障碍的病理性突变或其他改变,如单碱基改变、插入、缺失突变等,并确认与疾病发生相关的突变;
36、 对致病基因的突变进行功能研究,进一步确认其在疾病发病中的作用。从二十世纪八十年代晚期定位候选策略取得成功后,已经成功确定了几百个遗传病的基因,最成功的例子是囊性纤维化(CF)基因的定位与克隆。囊性纤维化是一种严重的常染色体隐性遗传病,以前关于该基因的mRNA和蛋白质结构无任何资料。人们利用定位克隆策略将该基因定位于7q,并借助DNA标记进行遗传分析将这一区域进一步缩小,通过“染色体步移”和“染色体跳跃”技术找到了致病基因,并将由基因结构推测得到的氨基酸序列和已知功能的蛋白质序列相比较获得了有关基因功能的信息。这就为研究突变引起的基因功能改变开辟了广阔的领域,并使人们进一步认识到基因突变与疾病
37、严重程度和病程变异之间的相互关系Vogel-Motulsky,1999。目前,由于人类基因组计划的不断完善,人类染色体上的大部分基因序列已知。随着分子方法在生物学和医学诸多领域的广泛应用,不借助于任何已知的单基因性状或疾病,而直接分析正常基因的方法越来越普遍。3 连锁分析 连锁(linkage)是一种遗传现象,指当同一染色体上某些位点由于相距很近,在减数分裂过程中发生交换的机率较小,因此具有较大的机会连在一起从亲代传到子代。连锁分析(linkage analysis)既是最早、较传统的,又是与现代生物技术相结合有新发展的重要基因定位方法。随着对多种疾病研究的深入,人们逐渐认识到以连锁图谱为工具
38、进行基因定位,进而采用基因克隆策略可以获得从表型到基因型的直接联系,具有不可比拟的优点。利用连锁的原理研究致病基因与遗传标记的关系,也就是根据基因座位的重组率来计算两座位之间的遗传距离。由于基因在染色体上呈直线排列,不同基因相互连锁成连锁群(linkage group),因此可以通过被定位的基因与同一染色体上另一基因或遗传标记相连锁的特点进行基因定位。 连锁分析的原理生殖细胞中一对同源染色体上存在的两个相邻基因座位,在减数分裂时可以发生交换,距离越远发生交换的机会越多,越有可能出现基因重组。重组率与成熟分离过程中遗传物质的交换密切相关,染色体上位点之间的距离越远,发生重组的可能性就越大;距离越
39、近,则重组的可能性就越小。确定位点之间遗传距离通常借助统计学方法来进行。经典方法是计算位点间的重组分数(recombination fraction)或称重组率(recombination rate),通常用q 表示,即两个配对的基因间所有组合事件中发生重组的比率或发生交换的配子数占总配子数量的百分比率。1910年摩尔根提出同一染色体上两个位点间在100次减数分裂中发生1次重组的机会时,即q 等于1时定义两位点间的相对距离为1厘摩(centimorgan, cM),这一相对距离称为遗传距离(genetic distance)。严格地说,重组率并不等同于遗传距离,仅仅在表示同一染色体上两座位之间
40、关系时,重组率才等于遗传距离。重组率q 介于0-50%,如果等于50%就意味着完全随机组合而失去意义,也就是两个不连锁(位于不同染色体上或位于同一染色体上但相距甚远)基因的重组率,其遗传效应类似于位于不同染色体上的座位的“自由组合”。在遗传图谱上相距较远的两个基因座之间,由于二次重组的存在,重组值会变小,但不会超过50%。同一染色体上座位之间的遗传学距离是可以累加的,人类基因组的遗传大小为3,600cM。 连锁分析的研究方法连锁分析通常采用家系分析的方法,通过研究遗传标记与致病基因位点在家系中的共分离现象来研究二者连锁与否,从而确定致病基因位点。传统的连锁分析方法包括经典的优势对数分数法和多点
41、连锁定位法等,一般要提供诸如外显率、拟表型率及遗传模式等参数。为了克服传统连锁分析方法需要一定参数的缺点,在等位基因共享的基础上发展起来许多非参数连锁分析法,常用有受累同胞对(affected sib-pair, ASP)和受累家系成员(affected pedigree member, APM)法。其理论基础是来源于同一祖先的致病基因由受累的亲属共占(identical by descent, IBD)的几率要大于随机分配的几率。等位基因共占的分析方法较连锁分析方法检测样本和DNA标记所需更多,仅是对家系要求降低,不需要完整的家系资料,兄弟、叔侄等配对资料也适用,因此可以作为传统连锁分析方法
42、的补充。 优势对数分析法(logarithm of odds score, likelihood of odds score, Lods)连锁分析中最常用和公认有效的是Morton 于1955年首次提出后经改进的Lod值法。它是指在给定q值的前提下,两个遗传位点连锁的概率相对于不连锁的概率比值的常用对数值,常用Z表示,q即发生交换的配子占总配子的数量比。公式为:Z(q)=log10 L(q)/L(1/2) ( 0q0.5)若Z(q)-2则可以排除连锁;-2Z(q)1或Z(q)1,提示连锁;Z(q)2,支持连锁;Z(q)3,表明在给定q值的条件下连锁的可能性比不连锁的可能性等于或大于一千倍,提示
43、连锁有极显著意义,可定义为连锁;对于X连锁来说,LOD值或Z(q)2时,即可定义为连锁。重组率的判断为:q0.10为紧密连锁(遗传距离小于10cM;0.10q0.45表示两位点不在同一条染色体上。Lod值法是一种参数方法,进行分析时要给出疾病的遗传模式、疾病的基因频率、外显率、拟表型率等,这些参数须通过于临床、流行病学资料来获取。应用Lod值法对分析的家系有一些要求,双亲或单亲(即其中一个亲代)必须是双杂合子(即所分析的两个性状均处于杂合状态的个体)。这样,人们便能通过两杂合性状在其子代中的连锁和互换情况进行Lod值估算。Lod值法是一种序贯概率比检验法,其优点是:可用于分析较易获得的二代小家
44、系资料,可以将不同的家系的资料合并处理;可用于双重杂合子的连锁相及亲代基因型未知的情况;所需样本量较小,一旦根据计算结果能作结论即可停止调查;估计基因重组率结果可靠。 多点连锁定位法(multpoint linkage mapping)多点连锁定位法可将一致病基因定位于遗传标记的框架内。在分析两个以上基因座数据时,多点连锁分析是有用的。分析多基因座可建立一套基因座染色体的次序,为此应用三点杂交(three-point cross)法,比在一系列的两点交换分析估计A、B和C三个基因之间的重组值更为有效。这类多点定位作图的优点有助于克服标记的有限信息。在一家系中某些减数分裂可对标记A提供信息,而另
45、一些对A无信息,但对邻近的标记B可提供信息,只有同时用标记A、B进行疾病基因连锁分析才能提供信息。现在已有提供很高信息的微卫星标记,这样就可以构建一个有次序的多点标记框架来确定某一致病基因的位置。 受累同胞对分析法(affected sib-pair, ASP)该法由Penrose于1935年提出。应用ASP法检出连锁关系,并不依赖于遗传模式,而是依赖于受累的患病同胞对是否共享等位基因。ASP法适用于分析具有2个或以上患病同胞和他们父母组成的小家系,主要对患病同胞中共有的遗传标记和易感主基因相连锁的单倍型进行分析,如果两个位点不连锁,就会符合孟德尔的独立分配定律,此时1/4的受累同胞对共享父源
46、和母源遗传标记的0个等位基因,1/2的受累同胞对共享等位基因中的1个等位基因,1/4的受累同胞对共享2个等位基因。如果遗传标记与致病基因连锁的,受累同胞对共享等位基因就会偏离这一比例。共有1个或者2个等位基因患病同胞对的比例会升高,共有0个等位基因的患病同胞对的比例则会降低。ASP法已经有许多统计分析方法比较成熟,如Suarez法、Green法、IBS法等, I型糖尿病和类风湿性关节炎就采用该方法进行分析的。对于发病晚而难于获得几个世代遗传标记和发病状态的数据者,Lod值法就无能为力,而ASP法仍可获得明确结果。即使在疾病存在异质性时,ASP法仍具有较强的检验连锁能力。 受累家系成员法(aff
47、ected pedigree member, APM)受累家系成员连锁分析作为IBD的一种,是ASP法的一个推广,是通过任何两个有血缘关系受累亲属标记位点的分布来检验DNA标记与致病基因的分离是否独立,从而推断两者是否连锁的一种统计方法。从理论上讲APM法不如ASP法,但仍具有以下优点:数据来源较广、标记表型的检测工作量小,数据处理简捷;不需准确设定疾病的遗传模型,适用于不符合孟德尔遗传方式的复杂疾病的连锁定位分析;可用于较难获得多代标记基因型与发病状态数据的迟发性遗传病及发病后易易死的疾病。该方法已成功地运用于乳腺癌、Alzheimer等疾病的基因定位分析。APM法的缺点是不能提供致病基因位
48、点与连锁标记位点之间的距离;需提供各标记等位基因的群体基因频率数据;基因频率的准确性对检验效能有很强影响;另外,标记位点的多态性程度也会影响APM的计算。 连锁分析的软件进行连锁分析主要借助于各种各样的计算机软件,常用的有LINKAGE软件包、GENEHUNTER以及用于构建连锁图的MULTIMAP、CRI-MAP和MAPMARKER等。LINKAGE软件包是比较经典的连锁分析软件,适合于大家系的连锁分析,其中每个个体只用少量遗传标记即可进行分析。GENEHUNTER由于计算机运行速率的限制,一般只适用于不超过20人的小家系,每个个体须用大量遗传标记进行分析,除了可用于单基因疾病的连锁分析外,
49、GENEHUNTER还可以进行非参数分析。 连锁分析的应用及其发展连锁分析技术出现之前,人们只能通过表型对遗传病的进行深入研究。因此“经典”的遗传学分析不得不遵循这样一条途径:以表型为起点,由器官、组织、细胞、亚细胞结构逐层深入,直到获取基因及其突变的有关信息。生化遗传学的发展使人们可以从基因产物的水平(如酶缺陷)通过遗传密码将氨基酸的改变与DNA的变异联系起来。但是这种方法的局限性在于,对某种疾病研究的初期不可能对病因有很深入的认识,而生化指标并不能准确无误地指向某一缺陷,因此很难将疾病的表型与特定的遗传缺陷联系起来。简单疾病的致病基因定位最成功的方法是连锁分析,它采用家系样品,寻找家系内遗
50、传标记与疾病在传递中的分离情况。由于物理位置接近的位点比相距更远的位点在减数分裂重组中更难分离开,因此与疾病状态共分离的遗传标记事实上提示了致病基因在染色体上的大致位置。连锁分析的优点在于不依赖于对疾病病理和生理生化异常的了解。对于很多单基因疾病,只要提供足够的家系及流行病学资料、适当可提供多态性信息的DNA标记、有效的统计方法和分析软件,便可以利用连锁分析方法将致病基因进行定位,从而为定位克隆策略提供了基础。另一方面,连锁分析也可以应用于疾病诊断,即使致病基因尚未被克隆,也可通过遗传标记进行连锁分析,将致病基因定位于染色体特定区域并以此来进行位置候选基因克隆。连锁分析对致病基因进行定位,应选
51、择足够数量的覆盖整个人类基因组的多态性遗传标记。通常我们选择ABI公司提供的经优化的、成套的微卫星标记,对家系中成员的样本进行全基因组的初步扫描,经连锁分析提示与疾病发生相关的染色体区域,进一步利用法国Gnthon实验室提供的高密度遗传标记对致病基因进行精细定位。对多个遗传标记的基因分型排列每个家系成员的单倍型,根据单倍型的重组情况确定致病基因在染色体上的精细区域,尽可能缩小连锁区域。通过单倍型在减数分裂过程中的重组现象可以把与疾病表型连锁的单倍型区域缩小到较小的范围。在定位区域内部或者附近利用人类基因组数据库中已有的数据寻找与疾病的生理生化功能相关的候选基因选择可疑基因作为候选基因,然后对其
52、进行DNA序列分析,查找突变并对其进行功能研究。传统的连锁分析在单基因遗传病的基因定位中做出了很大的贡献,但仍存在着一定的局限:首先,连锁分析的分辨率常是以厘摩(cM)为单位,在人类基因组中这意味着几百甚至上千个基因;其次,即使家系分析定位到了基因水平,找到的突变也很可能只是在特定家系中呈孟德尔方式传递,而对群体范围的复杂疾病表型并没多大帮助。另外复杂疾病外显率很低,这意味着需要大量的可用信息才能检测到关联,而符合统计效力的大家系几乎不可能找到。在简单疾病基因定位的最后阶段,人们也常使用连锁不平衡分析,因为它利用群体来进行研究,有效地利用了过去历史上许多世代发生的重组事件的影响,因此能进行基因
53、的精细定位。由于连锁分析和连锁不平衡分析各自的优缺,在复杂疾病的研究中人们常采用结合这两种方法的“两步法遗传分析”来定位基因。这种方法先使用家系样品和较为疏散的遗传标记,通过连锁分析定位大的候选区域;再使用家系样品或基于群体的样品对连锁提示的区域进行高密度遗传标记的连锁不平衡分析来精细定位,现在已经有很多这方面的成功范例。随着人们对遗传性疾病的研究深入,连锁分析的算法及软件有了诸多改进,并且在复杂性疾病的基因定位中也起到了一定作用。二 遗传性先天性白内障 图1 眼球水平切面图 晶状体的生理构造眼是视觉器官,包括眼球、视路和眼附属器。眼球由眼球壁和内容物组成,如图1。眼球壁由外向内依次为纤维膜(
54、包括角膜和巩膜)、血管膜(包括虹膜、睫状体和脉络膜)和视网膜。眼内容物包括房水、晶状体和玻璃体,通常与角膜一起统称为眼的屈光装置,透明且具有一定的屈光指数,以保证光线通过。图2 晶体剖面图晶状体(lens)也称晶体,是眼屈光装置的重要组成部分,具有独特的屈光通透和折射功能,在视力调节中起重要作用。当看近物时,睫状肌收缩,睫状体向前方移动,睫状小带放松,晶状体借弹性而变厚,屈光增强;反之,在看远物时,睫状肌舒张使睫状小带拉紧,晶状体变薄。晶状体还可滤去部分紫外线,对视网膜有保护作用。晶体发生病变时容易混浊产生白内障,从而引起视觉障碍。晶状体为具有弹性的双凸透明体,本身无血管和神经,其营养由房水和
55、玻璃体供给。晶状体形似双凸透镜(如表2),分为前后两面,前面的曲度较小,中心点为前极;后面的曲度较大,中心点为后极;两面相接的边缘为赤道。前后极间的直线叫晶体轴,轴的长度即晶体厚度为45mm,晶体直径为9-10mm。晶体的组织结构为: 包围整个晶体的囊; 位于前囊下的上皮细胞; 晶体细胞(晶体纤维); 晶体悬韧带。 晶体囊 (lens capsule)晶体囊是一层富有弹性和韧性的均质性透明薄膜,包绕着晶体上皮及晶体细胞,是晶体上皮细胞的分泌产物。晶体囊为上皮细胞的基底膜,囊与上皮紧密相连,两者之间没有任何间隙。上皮细胞代谢旺盛区(生发区)即赤道部的前囊及赤道部囊最厚;后囊为胚胎上皮细胞的产物,
56、出生以后后囊下已无上皮细胞,不再增厚,所以后囊最薄。 晶体上皮 (lens epithelium)晶体上皮位于前囊及赤道部囊下,新生晶体细胞表面为单层上皮细胞,后囊下没有上皮(胚胎发育过程中后部上皮已形成原始晶体细胞)。晶体上皮分为中央部(前极部)、赤道部及介于两者之间的中间部,中央部为静止区,中间及赤道部为生发区,其中赤道部上皮细胞不断增生形成新的晶体细胞,三区的上皮细胞结构相似。上皮细胞的细胞质内含有粗面内质网、游离核糖体,较小的线粒体,高尔基体、微管与微丝。上皮细胞逐渐向赤道部移行,细胞核呈圆形及椭圆形,并逐渐伸长,核膜界限清楚。 晶体细胞(lens celles)细胞为单层立方上皮,长
57、约8-10mm的六棱柱体,构成晶状体的实质,是晶体代谢、合成及运转过程的中心。赤道部细胞逐渐变长、脱核,排列规则,传统上称为晶体纤维(lens fibers)。晶体纤维的增加在赤道部终生不停,新生的纤维柔软位于晶体外围构成晶体皮质;旧的纤维被推向中心部脱水硬化形成晶体核。成人晶体按其形成的年龄不同而分为许多区,形成几个密度不同的核,如图3。 图3 成年人晶体分区A:胚胎核; B:胎儿核; C:婴儿核; D:成年核;E:皮质;F:晶体上皮细胞;G:囊膜 胚胎核:位于晶体最中央的透明区,由胎生1-3个月产生的原始晶状体纤维组成。 胎儿核:位于胚胎核之外,由胎生3-8个月形成的晶体纤维构成。 婴儿核
58、:自出生前数周到青春期形成的晶体纤维组成,位于胎儿核之外的薄层。 成人核:由青春期之后形成的晶体纤维组成。 皮质:位于前后囊下、上皮下最新形成的晶体纤维总称皮质。成人眼晶体约有2,100-2,300个晶体细胞。表层的细胞比深层长,最年轻的细胞位于囊下。晶体细胞有规则地排列成行,纵贯整个皮质,终止于囊下不同深度的前皮质缝与后皮质缝即Y字缝。电镜显示:在赤道部形成的新的晶体细胞具有细胞核及见于上皮细胞内的细胞器。随着新细胞的形成,老的晶体细胞向皮质内移位,细胞器逐渐减少以至消失,细胞核逐渐消失。深部皮质的晶体细胞仅有细胞膜,细胞质内含有均匀一致的细胞颗粒,偶尔可见残留的细胞核。随年龄增长,晶体核不断增大变硬,同时由于新纤维不断形成,晶体皮质亦增大。晶状体的弹性逐渐减弱乃至消失,使晶状体变扁,调节聚焦的能力减弱,形成老花眼,当晶状体混
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度二婚离婚财产分配合同
- 2024年度瓷砖铺贴工程保险合同
- 2024年度个人健康IC卡数据管理与隐私保护合同
- 04版软件开发与定制合同(含需求分析、系统设计、编码及测试)3篇
- 2024年度影视剧本创作合同:关于现代都市题材电视剧的剧本编写
- 2024中国电信湖北无线网优中心招聘4人易考易错模拟试题(共500题)试卷后附参考答案
- 2024中国电信卫星研究院招聘17人易考易错模拟试题(共500题)试卷后附参考答案
- 2024中国建筑国际集团校园招聘245人易考易错模拟试题(共500题)试卷后附参考答案
- 2024中国华电集团限公司校招+社招易考易错模拟试题(共500题)试卷后附参考答案
- 2024东海打捞局招聘34人易考易错模拟试题(共500题)试卷后附参考答案
- 【课件】Unit4Readingforwriting课件高中英语人教版(2019)必修第二册
- 学生学习过程评价量表
- 1.我们生活的世界
- 第9章 政府单位预算会计核算
- 欧陆590系列数字直流式调速器中文说明书
- 分布函数(课堂PPT)
- 古城南京的城市演变与现代规划
- 测绘地理信息业务档案保管期限表(20150305)..
- 国家开放大学电大《物流信息系统管理》期末题库及答案
- 精忠报国歌谱
- 固体火箭发动机制造工艺
评论
0/150
提交评论