人类mhcii、iii区域精神分裂症相关基因的遗传学研究_第1页
人类mhcii、iii区域精神分裂症相关基因的遗传学研究_第2页
人类mhcii、iii区域精神分裂症相关基因的遗传学研究_第3页
人类mhcii、iii区域精神分裂症相关基因的遗传学研究_第4页
人类mhcii、iii区域精神分裂症相关基因的遗传学研究_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人类MHCII、III区域精神分裂症相关基因的遗传学研究未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进行任何形式的复制、修改、发行、出租、改编等有碍作者著作权的商业性使用但纯学术性使用不在此限。否则,应承担侵权的法律责任。内容提要精神分裂症是一种常见的病因尚未完全阐明的精神系统疾病。发病率为1。多起病于青壮年,常有特殊的思维、知觉、情感和行为等多方面的障碍和精神活动的不协调。精神分裂症作为特殊的疾病,给社会和家庭带来了严重的经济和精神上的负担。因此,明确其发病机制是目前迫切需要解决的重大课题。2122313324212526222111151433目前,通过连锁研究发现1Q、5Q、6P、6Q、8P、10P、13Q1113及22Q等染色体区域可能含有精神分裂症易感基因。WEI和HEMMINGS首次报道第6号染色体短臂人类主要组织相容性复合体MHC区域NOTCH4基因及其附近区域可能与精神分裂症密切相关。此后,许多学者对此区域做了重复性研究,也得到了类似的结果。本研究在上述研究的基础上,选择人类第六号染色体MHC、类基因区为精神分裂症易感基因候选区,以中国汉族精神分裂症患者和他们的健康父母组成的核心家系为研究对象,利用连锁不平衡分析方法,在ADR、TSBP、NOTCH4和TNXB基因上构建SNP连锁不平衡图,检测该区域内是否存在精神分裂症易感位点。在技术路线上,遵循全基因组扫描染色体阳性区域基因图SNPS图RFLP限制性片段长度多态图这样一个基本研究过程。用PCRRFLP方法检测SNPS基因型,采用SPSS统计学软件管理和分析基因分型数据,用拟合优度卡方检验验证每个SNP基因型在抽样群体中的分布是否符合HARDYWEINBERG平衡。用EH软件分析两个SNPS之间的连锁不平衡程度。利用单倍体相对风险HRR和传递不平衡检验TDT方法分析单位点SNP数据,用TRANSMIT软件分析由两个以上SNPS构成的单倍型数据。结果发现,NOTCH4基因SNP108位点由父母传递给患病子女的等位基因频率偏离50的期望值P005。说明NOTCH4基因与精分症相关联。而ADR、TSBP及TNXB基因与精分症无关联。提示精神分裂症分析时应多考虑基因位点易质性及种族差异在其中所起的作用。本研究的结果认为,在MHC、区可能存在精神分裂症的易感基因或SNP突变位点,这些结果将为最终明确精神分裂症的遗传机制提供重要的实验依据。本研究工作是后基因组时期功能基因组学研究的前沿课题。所获得的实验结果不仅有助于阐明精神分裂症的分子遗传学机制,也为其他重大多基因遗传疾病的研究提供了新思路和新途径。0目录前言1英文缩写2第一章文献综述4第一节人类基因组计划411人类基因组计划的提出及历史回顾412人类基因组计划的内容与实施现状513后基因组研究的内容及重要意义714人类基因组计划的意义8第二节单核苷酸多态性921定义922单核苷酸多态性的研究进展923单核苷酸多态性的医学意义10第三节主要组织相容性复合体1231人类MHC的基因结构与特点1232HLA基因多态性特点1333HLA与疾病关联研究1334HLA与精神分裂症相关联的研究16第四节精神分裂症1741定义1742精分症的临床症状及分型1743精神分裂症诊断1844精神分裂症病因1945精神分裂症研究现状2146精神分裂症遗传学的研究展望28第二章材料和方法321研究对象3212主要试剂及仪器323确定候选基因及候选基因上的SNPS334引物设计345基因分型366数据库建立377统计学处理38第三章实验结果401遗传标记的选择402等位基因及基因型频率403HARDYWEINBERG平衡检验结果464遗传标记之间连锁不平衡程度的检验475SNPS与精分症相关性分析486SNPS与精分症临床症状相关性分析68第四章讨论791NOTCH4基因与精神分裂症802TNXB基因与精神分裂症813精神分裂症的遗传异质性814SNP研究的几种新方法和存在的问题83结论85参考文献86附件94作者简介97中文摘要1ABSTRACT7致谢吉林大学博士学位论文原创性声明中国优秀博士硕士学位论文全文数据库投稿声明2前言人类基因组序列提供了人类生命过程中的全部基因信息,作为生命背景的一个特有的参照物,将大大促进下个世纪人类生物学和医学的进展。人类基因组计划是将人类的基因组DNA序列分为大小为150200碱基片段,装载到定位重叠的细菌克隆中。力求每个克隆序列的准确率大于999。这种基因序列的可参照性,特别是最近研究较多的单核苷酸多态性SNP,为研究人类基因序列变异提供了基础。人类基因组序列是基于少数人的草图,反映人类基因的稳定性的一面,未反映变异性的一面。有关我们人类基因组的研究可归于2个方向,纵向人类基因组序列计划是绘制完成全部核苷酸序列的检测。横向则是在基因特异位点上的序列变化即SNP,SNP分型是一种十分有效的基因分析工具,能帮助我们揭示在基因中某些特殊位点和许多疾病的关系。不同个体间SNP的发生率大约为1个SNP/KB。近期广泛进行的发现定位SNP并建立SNP基因图谱的工作,可以提供一个对所有基因的完全性的描述。SNP做基因分析的优点是可以提供一大套在致病基因内部或者附近的标志,同时位于基因内部的SNP更可能影响蛋白的结构或者表达水平,可能改变代表遗传机制的候选基因。SNP的遗传性稳定,数量大,有希望迅速获得大量有效的SNP来做遗传风险因子分析。精神分裂症是一种常见的病因尚未完全阐明的精神系统疾病。发病率为1。多起病于青壮年,常有特殊的思维、知觉、情感和行为等多方面的障碍和精神活动的不协调。精神分裂症作为特殊的疾病,给社会和家庭带来了严重的经济和精神上的负担。因此,明确其发病机制是目前迫切需要解决的重大课题。本研究在上述研究的基础上,选择人类第六号染色体MHC、类基因区为精神分裂症易感基因候选区,以中国汉族精神分裂症患者和他们的健康父母组成的核心家系为研究对象,利用连锁不平衡分析方法,在ADR、TSBP、NOTCH4和TNXB基因上构建SNP连锁不平衡图,检测该区域内是否存在精神分裂症易感位点。结果发现,NOTCH4基因SNP108位点由父母传递给患病子女的等位基因频率偏离50的期望值P005。说明NOTCH4基因与精分症相关联。而ADR、TSBP及TNXB基因与精分症无关联。提示精神分裂症分析时应多考虑基因位点易质性及种族差异在其中所起的作用。本研究的结果认为,在MHC、区可能存在精神分裂症的易感基因或SNP突变位点,这些结果将为最终明确精神分裂症的遗传机制提供重要的实验依据。1英文缩写AFATTRIBUTABLEFRACTION可归因分数APMAFFECTEDPEDIGREEMEMBER患病家族成员法ASPAFFECTEDSIBPAIR患病同胞对法腭心面综合征中缺失的犰狳ARVCFARMADILLOREPEATGENEDELETED重复基因INVELOCARDIOFACIALSYNDROMEBPBASEPAIR碱基对BPBBROMOPHENOLBLUE溴酚蓝CICONFIDENCEINTERVAL可信限CMCENTIMORGAN厘摩尔根CDC45LCELLDIVISIONCYCLE45细胞分裂周期45基因CLDN5CLAUDIN5TRANSMEMBRANEPROTEIN腭心面综合征中缺失的膜转运DELETEDINVELOCARDIOFACIALSYNDROME蛋白基因CSNPCODINGSNP编码区SNPDNTPDEOXYRIBONUCLEOTIDETRIPHOSPHATE脱氧核糖核苷三磷酸EBETHIDIUMBROMIDE溴化乙锭表达序列标志ESTEXPRESSEDSEQUENCETAGHRRHAPLOTYPERELATIVERISK单倍体相对风险分析HWHARDYWEINBERGHARDYWEINBERG平衡HGPHUMANGENOMEPROJECT人类基因组计划HIRAHIRHISTONECELLCYCLE组织细胞周期调节缺陷基因REGULATIONDEFECTIVEHOMOLOGAA型IBDIDENTICALBYDESCENT血缘同一IDIDENTIFICATION编号LDLINKAGEDISEQUILIBRIUM连锁不平衡NCBINATIONALCENTERFORBIOTECHNOLOGY美国国家生物技术信息中心INFORMATIONNPLNONPARAMETRICLINKAGEANALYSIS非参数连锁分析方法2NSNOTSIGNIFICANT无统计学意义ORODDSRATIO相对危险度PICPOLYMORPHICINFORMATIONCONTENT信息度PCRPOLYMERASECHAINREACTION聚合酶链式反应RESTRICTIONFRAGMENTLENGTH限制性片段长度多态性RFLPPOLYMORPHISMSTRSHORTTANDEMREPEAT短串联重复SNPSINGLENUCLEOTIDEPOLYMORPHISM单核苷酸多态性SPSSSTATISTICALPACKAGESFORSOCIAL科学统计软件包SCIENCESSTSSEQUENCETAGGEDSITES序列标志位点TDTTRANSMISSIONDISEQUILIBRIUMTEST传递不平衡检验TRISTRISHYDROXYMETHYLAMINOMETHANE三羟甲基氨基甲烷TETRISEDTABUFFERTRISEDTA缓冲液UFD1LUBIQUITINFUSIONDEGRADATION1LIKE泛有素融合降解1型蛋白基因UVULTRAVIOLET紫外线VCFSVELOCARDIOFACIALSYNDROME腭心面综合征22QDS22Q11DELETIONSYNDROME22Q11微小缺失综合征3第一章文献综述第一节人类基因组计划人类基因组序列提供了人类生命过程中的全部遗传信息,作为生命背景的一个特有的参照物,将大大促进下个世纪人类生物学和医学的进展。人类基因组计划是将人类的基因组DNA序列分为大小为150200碱基片段,装载到定位重叠的细菌克隆中,力求每个克隆序列的准确率大于999。这种基因序列的可参照性,特别是最近研究较多的单核苷酸多态性SNP,为研究人类基因序列变异提供了基础。人类基因组序列是基于少数人的草图,反映人类基因组的稳定性的一面,未反映变异性的一面。有关人类的信息可归于2个方向,纵向人类基因组测序计划是绘制完成全部核苷酸序列的检测横向则是在基因特异位点上的序列变化即SNP。SNP分型是一种十分有效的基因分析工具,能帮助我们揭示在基因中某些特殊位点和许多疾病的关系。基因组中SNP的发生率大约为1个SNP/KB。近期广泛进行的发现定位SNP并建立SNP基因图谱的工作,可以提供一个对所有基因的完全性的描述。SNP做基因分析的优点是可以提供一套在致病基因内部或者附近的标志,同时位于基因内部的SNP更可能影响蛋白质的结构或表达水平。SNP的遗传性稳定,数量大,有希望迅速获得大量有效型SNP来做遗传风险因子分析。通过新定位的基因产物比较和已知功能蛋白的同源性分析,有助于推测并检验这些基因的生物学功能。随着对基因序列及其突变性的认识的深入,人类能够更精确地定位越来越多的常见人类复杂疾病的易感基因。如果充分识别了那些控制基因表达的序列,人类就能够对自身基因的功能有一个更详尽的理解。通过基因序列比较,我们还可以检测基因在个别组织的表达情况,通过比较不同种属之间的相应基因序列,可以识别那些在进化中高度保守的区域。这些研究都大大加速了对人类基因序列的解释和翻译。11人类基因组计划的提出及历史回顾1953年两位学者共同发现了DNA的双螺旋结构,阐明了组成人类遗传物质的信息载体为脱氧核糖核酸DNA的不同序列,其排列由不同的四个碱基ATCG依序而成,从而首次证实遗传物质的结构及传递方式的分子模式。1985年CETUS公司首创PCR技术,使DNA片段得以体外的特异扩增,使获得目的基因的速度大幅增加,同时借助PCR技术和DNA自动测序技术使DNA的测序能力大大加强,一次可测的序列从100BP扩至数千BP。借助这些技术,人类已经克隆并定位了近千个功能蛋白的DNA序列,也发现了近100种疾病的相关基因,为全面解释人类基因的天书奠4定了基础。1986年1987年,美国的科学家认为时机已成熟,开始详细讨论全面解读人体全部DNA序列的可能性。1987年春天,美国能源部的健康与环境研究顾问委员会HERAG正式向国会提交了“人类基因组启动计划”HUMANGENOMEINITIATIVE的报告。1988年初,美国国家技术评价办公室OTA和国家研究委员会NRC对上述报告作了全面评估,并建议分阶段实施该计划。同时,美国国立卫生研究院NIH亦单独向国会提交了相同报告。1988年秋天,美国国会正式批准了人类基因组计划HUMANGENOMEPROJECT,分别资助能源部所属的国家实验室和国立卫生研究院开展该项工作,并委托NIH于1990年初拿出具体实验方案,于1991财政年度开始启动前一个五年计划。NIH于1991年拟定计划并实施,在其后的前两年中新技术层出不穷,新的研究领域不断扩展,被迫于1993年重新拟定新的五年计划,并于1993年秋正式制定了五年计划19941998。1998年秋HGP进展顺利,圆满完成计划。提2,3前2年完成了人类全基因组序列的测定。12人类基因组计划的内容与实施现状人类23条染色体共约30亿BP,按每页2000字计算,约为150万页相当于近万册。功能基因约10万个,疾病相关基因约500010000个。人类基因组计划所涉及的科研工作,主要包括染色体的遗传图谱GENETICMAP、染色体的物理图谱PHYSICALMAP、DNA测序、基因鉴定、模式生物及生物信息学等。在10万个功能基因中,已发现近2万个基因,其中中国发现约100个。500010000个疾病基因中已发现约1500个,其中中国发现并公认的1个。总的来说仍有极大差距。为了完成人类基因组计划,美国政府投资30亿美元,动员医学、生物学、计算机学、结构物理学、化学等多学科科学家共同攻关,其投入与规模均与历史上的MAHHATO计划原子弹计划和APPOLO计划登月计划相比拟。人类基因组计划的基本任务可用下面五张图来概括。121遗传图遗传图又称连锁图LINKAGEMAP,它是以具有遗传多态性的遗传标记为“路标”,以遗传学距离为图距的基因组图。所谓遗传学距离,就是同源染色体两个位点之间发生重组的频率,1重组率定为一个图距单位,用1CM表示。遗传图为人类疾病相关基因定位克隆研究奠定了基础。人类遗传图谱经历了第一代、第二代及第三代的发展历程。第一代标记是一类经典的遗传标记。遗传图谱的概念最早由BOSTEIN等提出,当时是以RFLP作为DNA标记。而HUNTINGTON舞蹈症则成为第一个被确定为与某个RFLP标记连锁的常染色体遗传病。随后不久,著名杂志CELL在1987年发表5了人类第一张RFLP标记图谱。RFLP标记的主要研究对象是各种形式的序列水平上的DNA多态性,包括单碱基改变、插入/缺失突变、长度重复多态性等。检测的手段主要是SOUTHERN杂交。由于检测成本的昂贵,又不易发展到自动化水平,所以相对而言耗时耗力,这一方法并未能获得广泛推广应用。然而这一方法的出现,的确使人类分子遗传研究成为可能,而且由于这一策略的推动,引导人们定位克隆了许多个重要的孟德尔方式的遗传病基因。第二个遗传图谱上的里程碑是大量微卫星标记的开发和使用。微卫星标记MICROSATELLITEMARKER又称简短串联重复STR,它们的重复单位长度为26个核苷酸。它们的多态性主要是基于重复序列拷贝数的变异。这些微卫星的位点在基因组内不但数目多,其多态信息含量也极为理想。而且由于利用PCR扩增手段进行检测,可大大降低检测成本并提高检测过程的自动化程度。高密度的微卫星遗传图谱目前已经构建完毕,并可以供研究者自由使用。这一技术和策略的发展大大加快了孟德尔方式遗传病的基因定位和克隆工作的速度,并在一定程度上推动了许多复杂的多基因遗传病的研究。迄今已有多张人类微卫星标记图谱发表,最完整的一张是GENETHON实验室的5264个微卫星连锁图谱。微卫星标记的缺点主要是对位点的分型需要凝胶电泳,使之较难达到完全自动化。后来各种荧光自动测序仪的应用,使得这种状况得到了一定改善,但在操作上,大样本的全基因组扫描对于许多实验室仍有很大困难。第三代遗传标记是SNPS,34个SNPS标记构成的单倍型HAPLOTYPE就可以有816种,相当于一个微卫星标记形成的多态性,这种标记数目多,覆盖密度大,因而在基因定位研究中有着其它标记系统不可比拟的优越性和潜力。这种标记的开发和应用摒弃了遗传标记分析技术的瓶颈凝胶电泳,为DNA芯片技术应用于遗传作图提供了基础。122物理图物理图是指基因在染色体DNA上的实际距离,是以一段已知核苷酸序列的DNA片段,称为序列标志部位SEQUENCETAGGEDSITE,STS为位标,以MB或KB作为图距的基因组图。物理图的另一个重要内容是建立以DNA克隆片段相互重叠的邻接克隆群CONTIGS。对于基因克隆来说,物理图有两方面的意义。以STS为位标的物理图与遗传图相互参照,可以把经典遗传学与细胞遗传学的位点信息转化为基因组位点的物理学信息。如某一区域以连锁分析得知在两个STR之间,便能确定在染色体上的物理位置,其大小为多少CM,可基本折算成某一区域大小为多少KB。而邻接克隆群则提供了该区域可以操作的基因组材料,即相互重叠、覆盖这一区域的DNA片段,用这些片段为实验操作材料便可进行这一区域基因组研究或寻找这一区域的基因。以STS为位标的序列标记,将遗传图、细胞遗传学图以及分子水平的6物理图、序列图统一成整体的人类基因组图。123转录图又称基因图,就是在HG中鉴定出占据25长度的全部基因的位置、结构和功能。人们更注意具有表达蛋白质能力或直接导致遗传疾病的基因,所以经常是通过反转录得到相应的CDNA来观察基因的表达情况,这样所得到的基因图谱又被称为基因表达谱或转录图。转录图除了提供序列信息外,也同时提供了基因表达的组织、生理状况与发育阶段等信息,因此可以从表达的差异入手,克隆到疾病相关基因。基因在决定个体正常表型,即形态、代谢和免疫状态等方面起着决定性的作用,通过基因表达赋予个体对疾病的易感性或抵抗力,以及影响机体与环境因素的相互作用,基因也对任何一种疾病的发生发展起着重要作用。因此,人们希望能识别这些基因,以加深对疾病的认识,从而改进疾病的诊断与预防。124序列图人类基因组核苷酸序列图是分子水平上最高层次的、最详尽的物理图,它的完成可以为下一步基于基因组DNA的研究提供指南。国际上的4个最大的生物信息中心,即美国的国家生物技术信息中心NATIONALCENTERFORBIOTECHNOLOGICALINFORMATION,NCBI、基因组序列数据库GENESEQUENCEDATABANK,GSDB、欧洲分子生物学实验室EUROPEANMOLECULARBIOLOGYLABORATORY,EMBL、日本DNA数据库DNADATABANKOFJAPAN,EMBL已建立了数百种生物的基因组DNA序列的大4型数据库。13后基因组研究的内容及重要意义生物信息学的主要任务是利用核苷酸序列提供的信息推测该序列的功能,其主要技术是电脑模拟技术,目前世界上已经形成BLASTP、PROSITE、EMOTIF等大型软件,可协助学者们对核苷酸序列中的调控区、表达区、内显子、外显子进行分析并进而推测CDNA序列和MRNA序列。核酸水平的模拟结束之后,将推测可能的蛋白质的一级结构及可能的立体结构,各立体结构的功能区域以及可能结合的配体。该研究提供的信息可大大加快目的基因的定向研究。30亿碱基组成的DNA序列蕴涵着极大的信息,有人推测整个21世纪亦无法完成其解读工作。显然,依靠传统的技术路线去表达出某EST片段的目的蛋白,然后再观察其生物学功能和药理活性,以确定该基因的功能,已无法满足需要。因此,加快生物信息学的研究与普及是当务之急。基因功能学人类后基因组计划的关键点是基因的功能研究。没有基因的功能分析,基因的序列不过是4种核苷酸的排列组合。只有了解基因的功能,才使这些英文字7母真正有意义。基因的功能研究涉及分子生物学、细胞生物学、蛋白质化学、免疫学、药理学、生物信息学等诸多学科,是基因技术造福于人类之前必须最终解决的问题。基因功能学与生物信息学的结合,将使浩瀚无垠的基因库有一些定向的思路,借助目前先进的基因表达技术及庞大的生物功能检测体系可加快筛选并确知某一特定基因的功能。同时,通过“比较基因学”的进展,可以使学者借不同生物种类、不同分化状态、不同疾病进程等诸多可比配对而分析出基因及其表达的状态,进而5找出基因的功能内涵。14人类基因组计划的意义当基因的功能明确之后,其潜在的应用价值必然引起投资者的关注。已知功能的基因,不仅将帮助人们揭示如生命起源、生物进化、个体发育与分化、人类思维和意识的产生等生命世界的重大奥秘,而且与制药、生物育种、农业、食品、化学、化妆品、环境、能源等领域均有密切关系,从而形成新的产业部门即生命科学工业。这些工业的目的,就是为了将已知功能的基因尽快开发成为可用的产品。由于基因组与后基因组研究的发展,基因医学的概念应运而生。医学家将充分应用基因组与后基因组研究所提供的各种信息和知识储备,解决人类重大疾病的诊断、治疗和预防中的各类问题,21世纪的医学将处处渗透着基因医学的成果和积累。1重要疾病机理的阐明在人类常见疾病中,恶性肿瘤、心血管疾病、神经系统退行性疾病、自体免疫病以及代谢性疾病均是难治之症。这些疾病均涉及基因的先天性缺陷与后天的基因突变,涉及细胞生长、分化与凋亡之间的调控失衡。随着人类10万个基因的结构与功能的阐明,以及对维持人体基因组稳定性、基因表达调控、DNA复制与修补的物质基础的了解,人类对疾病发生的机理将有重要发现,甚至在概念上有重要更改,从而在预防、诊断、治疗上有新的突破。2基因诊断技术的发展医学上对病原体如HIV、HBV、HCV已应用基因诊断技术,21世纪将出现更为精细的基因诊断方法。病原体诊断将发展为毒株检测以及致病力强度的检定和抗菌株的发现。多基因疾病肿瘤、糖尿病、心脑血管疾病等将采用多基因检定、易感基因检定、代谢酶基因检定、DNA修补基因检定等,对于预防及早诊早治确有价值。3基因治疗的推广应用基因治疗进入人体试验正好是HPG批准的1990年,目前已经有近2000例病人尝试基因治疗,尝试的方案有200余种,疾病已涉及癌症、艾滋病、肝炎和几种单基因病。除了表达与转染体系的功效不足外,目的基因的选择仍是主要的难题。目8前的基因治疗方案尚无法解决临床问题。21世纪随着基因医学的发展,功能基因与疾病相关基因的阐明,有针对性的个体化基因治疗将成为临床的一个常规治疗手段。4基因药业的蓬勃发展自1973年重组DNA技术建立和1982年第一个基因工程药物上市以来,全世界范围内已上市的基因药物有50余种,1998年销售额已逾100亿美元。10万个功能基因的阐明将使基因药物的种类大幅增加,HPG总裁预测21世纪中叶人体用药将有50以上来源于基因工程生产的产品。新的细胞因子、生长因子及可溶性受体、生长抑制因子、细胞凋亡信号分子、多肽激素等可溶性生物活性物质,可以作为药6,7物直接使用。第二节单核苷酸多态性21定义单核苷酸多态性SNPS即在某一人群的正常个体基因组内特定核苷酸位置上存在不同碱基,且其最低的基因频率大于或等于1。严格说来,单碱基的缺失、插入不应被认为是SNPS。但通常我们所说的SNPS包括单碱基的转换、颠换以及单碱基的插入/缺失。原则上,SNPS可以是双等位、三等位或四等位基因多态性。然而,人类三等位和四等位基因的SNPS是非常罕见的,因此SNPS有时就简单地说成双等位基因标记。而实际上,SNPS仅仅是所有可能的双等位基因多态性如多碱基变异中的一种,SNPS分为两种形式,一是基因编码区的功能性突变,称为CSNPS二是遍布于基因组的大量单碱基变异。在CDNAS中的单碱基变异之所以被归入SNPS,是因为大部分的CSNPS反映了基因组的DNA8的变异,然而这忽略了这种变异可能是RNA编辑的结果。研究表明,在表达序列中的SNPS远远低于随机的基因组序列中的SNPS,这与表达序列承受更大的选择压力是一致的。胞嘧啶残基C是人类基因组中最易发生变化的地方,因为大多数的C是甲基化的,能够自发地脱氨基产生胸腺嘧啶T。因此,SNPS作为一种碱基替换,9大多数为转换,其与颠换之比为21。22单核苷酸多态性的研究进展8单苷酸的平均突变率为110,则人类基因组中共有57百万SNPS,即每526BP就有一个SNP,目前多种机构都在检测SNP,作SNP图。人类基因组框架工作完成,使SNP研究又有新进展。2000年SANGER中心公布了一张2730个SNPS的图,大多数分布于外显子中,这对疾病关联分析很有价值。比之前两种标记系统,SNP稳定、9数量多,双等位基因标记BIALLELIC,分布于整个基因组中,易于使用高通量、自动化的方法检测。目前,有许多生物医学网站开辟了专门的SNP网页,对其研究进展11的信息可以很方便地及时得到。比较重要的网站有/0/23单核苷酸多态性的医学意义231对复杂疾病的研究SNP基础上关联分析,发现一些复杂性疾病如心脏病、癌症、糖尿病、精神病等的遗传变异是人类遗传学家面临的一个主要挑战,虽然这些疾病在家系中扩展,但它们通常隔代遗传,结果使曾经成功运用于孟德尔疾病的传统的家系连锁分析在此使用受限,复杂性疾病是遗传和环境综合作用的结果。目前,发现这些多基因疾病微效基因最有力的方法是利用与疾病基因关联的DNA标记,对病例组和对照组的标记的等位基因频率进行统计学比较,SNP是这种分析很好的一种标记,因为它数量多,突变率低,在编码区CSNP与非编码区均有分布。LEONIDKRUGLYAK用计算机模拟估计基因组中间的范围,预测含有500000个SNP的全基因组图,对发现复杂性疾病的致病基因有用。研究疾病中究竟需要多少SNPS,依赖于LD从SNP扩展多远。作全基因组分析或关联研究可同时筛选到复杂疾病或性状的众多相关基因,且SNP图越密集,可以检测致病基因的标记数目就越多。现在已通过SNP关联发现了两个前列腺癌相关基因。诸如上述利用SNP进行疾病关联分析的研究时有报道,足见其12在该领域的应用价值之大。232对遗传病的研究一条染色体上两个或两个以上SNP多为连锁,可用来进行连锁不平衡分析LD,且数量大、分布广,在任何已知或未知致病基因附近都可找到众多SNP,并用于遗10传病的单倍型诊断。233法庭科学中的应用SNP用于法医学主要有三方面的优势1低突变率,稳定遗传,有利于亲权鉴定2双等位基因变化,可用高通量的方法自动分型3Y染色体SNP较敏感,有利于混合斑的鉴定。SNPS广泛用于法医个体识别及亲权鉴定,大约3060个SNPS可达到其鉴别力,研究发现如果每个SNPS等位基因频率为05,则30个SNP可以达到上述13个STR位点复合扩增系统的识别率,如果每个SNPS等位基因频率为01,则需60个SNPS才能达其识别力。REYNOLDS等已成功地对5055个SNPS复合扩增MEGAPLEXPCR,然后进行两步杂交获及基因型,用于法医个体识别及亲权鉴定。LAREU等用DNA微阵列进行SNP分型,发展了两种DNA芯片,一种含有100个常染色体SNPS的可用于亲权鉴定另一种是Y染色体SNP芯片,可用于混合斑的鉴定。SNPS在基因组中含量丰富,稳定遗传且有可能进行大规模自动检测SNPS引物结合位点间的距离较近,有利于对高度降解的DNA进行分析,这是它优于前两种标记系统的特点。已有许多SNPS用于法医学,如POLYMARKER系统LDLR、GYPA、D7S8、GC和HGBB,用于亲子鉴定个体识别,其在黄种人中的DP为09962。新检测方13,14法的出现,SNPS有望在法医个体识别亲子鉴定中得到广泛应用。234用于种族起源预测和男性鉴定到目前为止,对它的研究主要集中在种族起源的预测上。JOBLING利用YSNP单倍型进行种族起源分析,Y染色体在男性决定中起重要作用,其为单倍型,Y染色体的大部分免于重组引起Y染色体多样性在谱系中积累,并产生男性特异性单倍型,由于人群遗传和行为因素这种单体型非随机分布在人群中。目前,YSTR数据库是法医中男性个体识别非常有力的工具,YSNP复合扩增,有利于男性物质含量少的混合斑的鉴定。其分布有种群特异性,利用它可帮助推断犯罪现场某个体所属种群。Y染色体与常染色体和线粒体进行DNA多态性比较,其随地理距离改变而出现的遗传差异最大。235SNPS在药物遗传学中有重要作用通过研究遗传多态性尤其是单核苷酸多态性与个体对药物敏感性或耐受性的相关性,可以阐明遗传因素对药物效用的影响,从而对个体化用药和药物开发提供指导和依据。长远来看,SNP数据将使制药业以更快的速度发展,使药物临床试验效率更高。用药物遗传学认定对新药没有反应的人将是一大进步。现在还兴起了药物11基因组学PHARMACOGENOMICS。由于SNP对制药业的巨大作用,世界上各大制药公司竟相出资研究SNP图及发展大量检测新SNP的方法,如THESNPCONSORTIUM是由十大制药公司和5个公共基因组中心及组成的联盟HTTP/SNP/CSHL/ORG。SNP还用于人类进化方面的研究,帮助描述突变进程及检测正性、负性选择。有作者用EST为基础的SNP数据进行人类突变和选择过程的定性推断。SNP在免疫学方面研究也有进展,可用它进行骨髓移植分析,人类主要组织相容性复合物15,16MHC区域内及其亚区内存在大量SNP,现在正处于研究中。第三节主要组织相容性复合体主要组织相容性抗原是指在不同种属或不同系的动物个体间进行正常组织或肿瘤移植会出现排斥,它是供者与受者组织不相容的反映。其本质是一种免疫反应,它是由组织表面的同种异型抗原诱导的。这种代表个体特异性的同种抗原称为组织相容性抗原或移植抗原。31人类MHC的基因结构与特点HLA复合体位于人第6号染色体短臂,占人类整个基因组的1/3000,DNA片段长约3540MB。HLA复合体有224个基因座,其中128个为功能性基因,96个为假基因。40的基因与免疫功能相关,特别是类区域中几乎所有基因均显示免17疫相关功能。传统上按其产物的结构、表达方式、组织分布与功能分为三类。HLA类基因在基因区存在多达31个有关的类基因座,其中HLAA,HLAB,HLAC为经典的HLA类基因,其他基因产物有限且功能不明,另外还有许多伪基因。HLA类基因HLA类基因区包括近30个座,其中经典的类基因一般指DR、DP和DQ,它们编码的产物均为双肽链、分子。近年来,陆续发现了一些位于类基因区的新基因座,其中某些基因的产物与内源性抗原的处理与呈递有关。HLA类基因HLA类基因区域至少已经发现36个基因座,其中C2、C4和BF座编码相应的补体成分,另外还有21羧化酶基因CYP21A、B、肿瘤坏死因子基因TNFA、B以及热休克蛋白70HSP70基因。补体C4由2个不同的基因C4A与C4B编码。1232HLA基因多态性特点HLA复合体是由一系列紧密连锁的基因群组成,每一个基因又由于其DNA序列的差异存在许多变异体成为等位基因。由于HLA分子抗原结合凹槽中序列基序是由每个等位基因编码的,因而如此众多的HLA多态性,导致了抗原结合槽的构象及结合、递呈抗原肽给T细胞的效率大大不同,这使得不同的HLA基因型对疾病的易18感性不同。有关HLA多态性的发生机制尚未完全清楚,一般认为,HLA复合体通过基因突变、基因重组及基因转换等机制可导致其基因结构发生变异,这是HLA多态性产生的基础。基因转换可产生新的等位基因,新等位基因在群体中得到积累,形成多态性。从基因的储备上,造就了对抗原入侵反应性和易感性不同的个体。使之能对付多变的环境条件及各种病原体的侵袭。HLA等位基因多态性在漫长的进化过程中是如何得以维持的呢学者对此提出了不少假说。八十年代末期,有学者提出达尔文正选择假说90年代,提出基因重组假说此外还有理论群体遗传学者提出的频率依赖选择假说等。HLA的高度多态性显示了遗传背景的多样性,它保证了机体对各种病原体产生合适的免疫反应以维持机体稳定性。对于维持种属的生存与19延续具有重要的生物学意义。33HLA与疾病关联研究HLA与疾病关联性的研究至今已有30多年的历史了。所谓关联ASSOCIATION是指两个遗传学性状在一个群体中非随机地共同发生。HLA是第一个被发现与疾病有明确联系的遗传系统。331HLA与自身免疫病一般认为,自身免疫病AUTOIMMUNEDISEASE,AID的发生是由遗传因素、免疫功能异常以及体内外环境因素等多种因素共同作用的结果。近年来的研究表明,目前有70多种自身免疫病和HLA关联,也是HLA与疾病研究比较广泛深入的一类疾20,21病。1HLA与系统性红斑狼疮系统性红斑狼疮SLE是一种非器官特异性自身免疫病,好发于2040岁女性,在儿童也有发病,且近年有增加趋势。SLE病因及发病机制尚不完全清楚,但许多证据表明该病是在先天遗传易感素质基础上,外界环境及性激素作用下,激发机体免疫功能紊乱及免疫调节障碍而引起的一种自身免疫病。HLAI类分子与SLE的相关性研究始于1971年,GRUMENT利用淋巴细胞毒试验方法发现数SLE患者的发病与HLAA明显相关,随后日本也报道了SLE患者与813HLAA、B、B表现型有关。近年也有文献报道可溶性HLAI类分子可作为SLE11354022活动性指标。由于发现HLAII类抗原基因群中具有免疫应答的调节基因,对自身免疫的相关性研究起重要作用,人们转向研究HLAII类抗原基因群,并以研究DR、DQ与疾病相关性最为重要。最初使用血清学分型方法发现北美、西欧白种人SLE与DR3有关,而中欧白种人、中国人、日本人及美国人SLE与DR2相关。随着分子生物学技术的广泛应用,能在DNA水平更为精确的确定HLAD区基因与SLA的23关系。有研究发现北欧白种人SLE与HLADRB103、HLADRB30101、DQA10501及DQB10201相关。GALEAZZI等对6个欧洲国家的448例SLE患者的研究发现,神经精神性狼疮患者的AGM1I

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论