版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基因多态性数据库与运用建议和意见请发送到:yangms88@
基因多态性数据库建议和意见请发送到:yangms88@yah
讲课内容三、人类遗传物质的差异--基因多态性二、导致人类表型多样性的原因四、SNPs概论五、SNPs数据库构建六、SNPs实验分析技术七、SNPs实验分析中的问题八、实际工作中SNPs的选择原则一、人类表型的多样性九、SNPs数据库使用流程演示讲课内容三、人类遗传物质的差异--基因多态性二、导致人类表一、人类表型的多样性一、人类表型的多样性基因多态性数据库与运用1课件基因多态性数据库与运用1课件遗传背景一致性和部分表型的差异遗传背景一致性和部分表型的差异二、导致人类表型的多样性的原因生存环境因素的影响
自然条件文化背景生活与饮食习惯社会体制………2.自身遗传物质的作用
基因的功能和调节非编码DNA序列的影响表观遗传的作用上位抑制的影响多态性位点的存在………
二、导致人类表型的多样性的原因基因多态性数据库与运用1课件基因多态性数据库与运用1课件基因多态性数据库与运用1课件血缘关系与患病风险示意图血两个重要的容易混淆的概念1.易感性(Susceptibility)
一个个体仅在遗传因素的作用下罹患某种疾病的风险。2.易患性(Liability)
一个个体在遗传因素和环境因素的共同作用下罹患某种疾病的风险。
两个重要的容易混淆的概念1.易感性(Susceptibil常用的遗传学研究资源和数据库1GeneticAssociationDatabase:Anarchiveofhumangeneticassociationstudiesofcomplexdiseases.
/2SchizophreniaGeneDatabase:Anarchiveofgeneticassociationstudiesperformedonschizophreniaphenotypes.
/res/sczgene/default.asp
3OnlineMendelianInheritanceinMan:Acatalogueofhumangenesdisorders.
/sites/entrez?db=OMIM&
4HumanGeneMutationDatabase.Acatalogueofpublishedgeneresponsibleforhumaninheriteddisease.
http://www.hgmd.cf.ac.常用的遗传学研究资源和数据库1GeneticAssoci5HumanGenomeVariationDatabase:Acatalogueofnormalhumangenomevariation.
/
6dbSNP:Acatalogueofhumansinglenucleotidepolymorphisms.
/projects/SNP/
7GeneSNPs:Adatabaseofpolymorphismsinhumangenesthatarearoleinsusceptibilitytoenvironmentalexposure.
/genesnps/
8PharmGKB:Adatabaseofpharmacogenomicsresearch.
/index.jsp
9GeneCards:Adatabaseofhumangenesthatincludesgenomic,proteomictranscriptomicinformation,aswellasorthologies,diseaserelationships,geneexpressionandgenefunction.
/
5HumanGenomeVariationDatab常用的候选基因分析软件和工具GeneSeeker
http://www.cmbi.ru.nl/GeneSeeker/GFSST
Endeavour
http://www.esat.kuleuven.be/endeavour
POCUShttp://www.hgu.mrc.ac.uk/Users/Colin.Semple/
G2D
http://www.ogic.ca/projects/g2d_2/
SUSPECTS
http://www.genetics.med.ed.ac.uk/suspects/
TOM
http://www-micrel.deis.unibo.it/~tom/
BioMercator
http://moulon.inra.fr/~bioinfo/BioMercator
GFINDer
http://www.bioinformatics.polimi.it/GFINDer/
PROSPECTR
http://www.genetics.med.ed.ac.uk/prospectr/
QTLMixer
http://qtl.pzr.uni-rostock.de/qtlmix.php
CoGenT++
http://cgg.ebi.ac.uk/cogentpp.html
SNPs3D
http://www.SNPs3D.org
PhD-SNP
http://gpcr.biocomp.unibo.it/cgi/predictors/PhD-SNP/
……常用的候选基因分析软件和工具GeneSeekerhtt一个基因可以具有多个不同的表达模式一个蛋白质可以具几种不同的结构和功能衍生物现以脂蛋白酯酶基因(LPL)为例进行说明LPL是脂质代谢的关键酶,目前发现其具有四种剪切模式4AlternativeSplicingDatabase(ASD)splicepatterns(SP)forLPL.doc一个基因可以具有多个不同的表达模式现以脂蛋白酯酶基因(LPLGeneticControlofGeneExpressioninVariousTissues.NEnglJMed2009;360:1759-68.GeneticNEnglJMed三、人类遗传物质的差异基因多态性1.人类自身遗传物质99.8%是完全一致的2.人类自身遗传物质的差异大约为0.2%其中:在核苷酸碱基水平上约占0.80%比如:碱基的替换、点突变、碱基的插入或缺失、SNPs等
在基因组结构水平上约占0.20%
(包括片段的插入、缺失、倒置、移位、互换等)比如:2-1000bp片段:微卫星、小卫星等1kbp-亚显微结构:拷贝数量多态性等显微-亚染色体结构:片段的非整倍体等整条染色体-全基因组:染色体互换或非整倍性等
3.30亿个碱基对中95%为非编码序列,5%为蛋白编码序列三、人类遗传物质的差异基因多态性1.人类自身遗NatGenet.2007,39(7Suppl):S7-S15NatGenet.2007,SingleNucleotidePolymorphisms
(SNPs)SingleNucleotidePolymorphism微卫星(MicrosatelliteMarkers)Variablenumbersoftandemrepeats(2,3,4)basesUniqueprimersfor400markersStutterduetoslippageofpolymeraseMarker-dependent,variablestuttermorphologyAlsoCalled--ShortTandemRepeat(STR)微卫星(MicrosatelliteMarkers)VFourColorDetectionwithFilterSetIIFourColorDetectionwithFiltMegaBACEGenotypeMegaBACEGenotypeFatherMotherChildtgtcatgctagattCACACAggttcgtagtcagtgtcatgctagattCACACACACACACAggttcgtagtcagFatherMotherChildtgtcatgctagat微卫星运用例证1:原发性习惯性流产遗传位点的研究微卫星运用例证1:原发性习惯性流产遗传位点的研究基因多态性数据库与运用1课件基因多态性数据库与运用1课件基因多态性数据库与运用1课件ReproductiveSciencesVol.17No.6June2010578-584ReproductiveSciencesVol.17微卫星运用例证2:亲子鉴定母子父微卫星运用例证2:亲子鉴定母子父基因多态性数据库与运用1课件CopyNumberVariants(CNVs)CopyNumberVariants(CNVs)野生型DNA片段DNA片段的缺失
DNA片段的插入ABCABCABNACBDNA片段的倒置BACGHIGHICDNA片段的移位GABHCIDNA片段的互换DNA片段多态性野生型DNA片段DNA片段的缺失DNA片段的插入ABCABManyvariantswithsmalleffects,asmallernumberwithintermediateeffectsandrelativelyfewwithlargeeffects.NatRewGenet,2005,[6(2)]109-118AnL-shapedorexponentialdistributionofvariantseffectsizeshaswidesupport.Manyvariantswithsmalleffec88%oftrait-associatedSNPs(TASs)wereintronic(45%)orintergenic(43%),
12%locatedin,oroccurintightlinkagedisequilibriumwith,protein-codingregionsofgenes.NEnglJMed2010;363:166-76.PNAS,2009[106(23)]9362-936788%oftrait-associatedSNPs(四、SNPs概论1.定义:单核苷酸多态性(singlenucleotidepolymorphism,SNP,发音为“snip”)是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。2.特征:是最常见的一种变异,约占所有已知多态性的40%;分布广,1个/300~1000个碱基对,总数可能>2470万;由单个碱基的转换(transition)或颠换(transversion)所导致;转换的发生率较高,SNP中转换型变异者约占2/3;(可能是因为CpG二核苷酸上的胞嘧啶残基最易发生突变,其中大多数是甲基化的,可自发地脱去氨基而形成胸腺嘧啶)SNP基本上表现为二等位多态性;根据SNP在基因中的位置,可分为基因编码区SNPs(Coding-regionSNPs,cSNPs)、基因周边SNPs(PerigenicSNPs,pSNPs)以及基因间SNPs(IntergenicSNPs,iSNPs)等三类;四、SNPs概论
位于编码区内的SNP(codingSNP,cSNP)比较少,又可分为2种:同义(synonymous)cSNP和非同义(non-synonymous)cSNP,参与蛋白质编码;位于非编码区内的SNP比较多,其变异率是cSNP的5倍,参与基因表达的调控;先形成的SNP在人群中常有较高的频率,而后形成的SNP频率较低;3.现有SNP在白色、黑色和黄色人种中的分布频率<20%,占7%;实验无法证实者,占17%;在一个人种中频率≥20%,占76%;在二个人种中频率≥20%,占53%;在三个人种中频率≥20%,占27%;位于编码区内的SNP(codingSNP,cSNP)比OccurrenceofSNPsintheHumanPopulationandTheirRepresentationintheCurrentCollectionNatureGenetics2001,27:234-236
OccurrenceofSNPsintheHuma基因多态性数据库与运用1课件4.SNPs网上资源主要有:NIH的dbSNP多态性数据库:/SNP德国的HGBAS网站的人类SNP数据库:hgbas.cgr.ki.sei日本建立的JSTSNP数据库:snp.ims.utolkyo.ac.jpNIH的与癌症和肿瘤相关的候选SNP数据库:/GAIFastSNPSearch:.twPerlegenBrowser:UCSCGenomeBioinformaticsSite:美国Utah大学SNP数据库:美国波士顿儿童医院SNP数据库:SNP联盟数据库:英国Sanger研究所:www.sanger.ac.ukHapMapHomepage:EnsemblGenomedatabasesandtools:……4.SNPs网上资源主要有:5.NIH的dbSNP多态性数据库:/SNP
dbSNP的挑选方式和不足:60%的“候选”SNPs是通过统计学方法预测出来的即通过比较重叠克隆中的DNA序列痕迹来确定“候选”SNPs。因此,大多数的dbSNP是频率未知的“候选”SNPs。
总数量约为2470万个SNPs;
三大来源:SNP联盟数据库:英国Sanger研究所:www.sanger.ac.uk美国WashingtonUniversity,St.Louis
设立的参照SNP(Reference_SNP)>400万个,采用rs+数字编号来表示;
5.NIH的dbSNP多态性数据库:www.ncbi.nl可从多个路径查找SNPs:Humangenomeresources,mapview,Genebank等等;dbSNP的质量:已经证实的Ref_SNPs,大约有400万个非人类的SNPs,大约有216万个无法证实的SNPs,大约有184万个在某一群体中不是多态性的,大约有152万个在某一群体中频率<20%的,大约有126万个被证实的其频率>20%的SNPs,大约有63万个可从多个路径查找SNPs:Humangenomeres五、SNPs数据库构建1.生物信息数据库的构建与获取图1数据库的建立:采用数据库转换技术将不同格式、来源的数据转化为同一格式,从而建立单一的大数据库。NatRevGenet.2003[4(5)]337-345五、SNPs数据库构建1.生物信息数据库的构建与获取图1图2连点和节点。运用连点和节点方法将各自独立的资源整合起来,对于一些重要的关联信息比如同源基因,则采取特定数据库的方式储存起来。NatRevGenet.2003[4(5)]337-345图2连点和节点。运用连点和节点方法将各自独立的资源整合图3生物数据库的结构和获取绝大多数生物数据库采用三层结构模式:第一层的数据管理系统(底层)第二层的中间设备,包括获取数据的软件和网络服务器(中层)第三层的网络浏览器(高层),即用户。NatRevGenet.2003[4(5)]337-345图3生物数据库的结构和获取2.SNP生物信息分析2.1分析的参数或指标挑选拟进行分析的基因及其DNA序列的长度,比如5’端上游5000bp+整个基因序列+3’端下游5000bp,要求包含两端的非转录区(UTR)。在上述碱基范围内,寻找获取下列的信息:所有SNP的信息:位置、群体中的频率标记SNP(Tag_SNP)的情况:位置、群体中的频率基因外显子的信息:位置、方向、大小转录因子结合位点信息:名称、位置、数目甲基化位点CpG的信息:位置、数目进化保守区的信息:名称、位置、数目、大小单倍型信息:位置、数目、大小参与调节基因转录的序列簇信息:名称、位置、数目、大小(比如增强子、沉默子和microRNAs结合域等)2.SNP生物信息分析2.2涉及的数据库或网络资源在/获得SNP、CpG、转录因子结合位点信息在/获得进化保守区的信息在/index.html获得基因外显子的信息在/获得标记SNP(Tag_SNP)、单倍型的信息在/browser/index_v2.html获得SNP、单倍型的信息在/cluster-buster/index.html获得参与调节基因转录的序列簇信息………………2.2涉及的数据库或网络资源2.3
SNP信息分析方法和结果的评判分析方法:Cygwinanalysisprogram。该程序通过对基因序列的生物信息进行综合分析,寻找可能具有各种功能的多态性位点,为遗传学、分子生物学、进化和系统发育学的研究提供参考数据或功能信息,对复杂性疾病易感基因的研究工作很有帮助。运行的前提条件:1.在Perl语言环境中进行分析。Perl是PracticalExtractionandReportLanguage(实用摘录和报告语言)的简称,是一种最广泛应用于语法分析和WorldWideWeb的编程语言。2.拟分析的参数或指标,必须进行格式调整,满足Cygwinanalysisprogram的要求。3.需要事先编写好2个参数分析和整合程序。3.1运行cross_ref_SCORED.pl可以得到重叠区域生物信息学文件3.2运行merge_per_hap.pl可以得到整合了单倍型信息后的文件4.将基因外显子信息加入其中,进行重新排列后,获得最终的生物学信息分析结果。2.3SNP信息分析方法和结果的评判生物信息学分析结果例证–中国汉族群体LPL基因SNP生物学信息ECR:EvolutionaryConservedRegions;Tag:标记;转录因子:MYCMAX,NMY;Cluster:调节基因转录的序列簇;CpG:甲基化位点3’splicejunction:外显子3’端剪切位点;MAF:弱势等位基因频率生物信息学分析结果例证–中国汉族群体LPL基因SNP生物学六、SNP实验分析技术基于PCR技术与其它方法相结合的检测方法(获得较普遍的应用)1.1通量相对较小者:
测序、限制性片段长度多态性(restrictionfragmentlengthpolymorphism,RFLP)、单链构象多态性(single-strandconformationpolymorphism,SSCP)、温度梯度凝胶电泳(TGGE)、变性梯度凝胶电泳(DGGE)、随机扩增多态性DNA(RAPD)、连接酶检测反应法(ligasedetectionreaction,LDR)。1.2通量相对较大者:
变性-高效液相色谱(DHPLC)、Pyrosequencing、Ecotilling、基因芯片/阵列分析技术(genechips)、微球法(Illumina)、质谱分析、高分辨溶解曲线分析(HighResolutionMelting,HRM)。
六、SNP实验分析技术基于PCR技术与其它方法相结合的检测方2.以分子杂交技术为基础的检测方法(没有获得较普遍的应用)
寡核苷酸连接分析(OLA)、动态等位基因特异性杂交(DASH)、等位基因特异寡核苷酸片段分析(ASO)和突变错配扩增检验(MAMA)。3.以荧光定量PCR为基础检测方法(获得较普遍的应用)
TaqMan探针法、SNPlex基因分型法、分子信标(Molecularbeacon)和FRET(HybProbe)。4.SNPs的功能性研究手段
比较成熟的对启动子区域内SNPs功能性研究的技术包括:①报告基因转染技术。主要用于研究启动子SNPs对于mRNA转录效率的影响,通过观察转录结局来判断SNPs是否具有功能。报告基因是一种编码可被检测的蛋白质或酶的基因,是一个其表达产物非常容易被鉴定的基因。通过把它的编码序列和基因表达调节序列相融合形2.以分子杂交技术为基础的检测方法(没有获得较普遍的应用)成嵌合基因或与其它目的基因相融合,在调控序列控制下进行目的基因表达。作为报告基因,必须具有如下几个特征:(1)全序列已被测定;(2)表达产物在受体细胞中不存在、且在受体细胞中无相似的内源性表达产物即无背景;(3)可以对其表达产物进行定量测定。②凝胶迁移滞后实验(electrophoreticmobilityshiftassays,EMSA)。基本原理是蛋白质可以与末端标记的核酸探针结合,电泳时这种复合物比无蛋白结合的探针在凝胶中泳动的速度慢,即表现为相对滞后。该方法可用于检测DNA结合蛋白、RNA结合蛋白,并可通过加入特异性的抗体(supershift)来检测特定的蛋白质,并可进行未知蛋白的鉴定。但是由于许多转录调控蛋白有相似或相同的DNA结合位点,这种体外分析获取的结果不一定能真实地反映体内转录调控蛋白和DNA结合的状况。成嵌合基因或与其它目的基因相融合,在调控序列控制下进行放射自显影蛋白质A、B、C****凝胶电泳放射性标记的DNA蛋白质与DNA结合****BDNA-蛋白质结合物电泳迁移缓慢滞后带表明DNA与蛋白质结合*凝胶迁移滞后实验的原理示意图放射性标记的DNA因与蛋白质B结合,顾而在凝胶电泳中移动速度变慢,在放射自显影中呈现滞后的条带。放射自显影蛋白质A、B、C****凝胶电泳放射性标记的DNA③染色质免疫沉淀分析(chromatinimmunoprecipitationassay,ChiP)。基本原理是在活细胞状态下固定蛋白质-DNA复合物,并将其随机切断为一定长度范围内的染色质小片段,然后通过免疫学方法沉淀此复合体,特异性地富集目的蛋白结合的DNA片段,通过对目的片断的纯化与检测,从而获得蛋白质与DNA相互作用的信息。它能真实、完整地反映结合在DNA序列上的调控蛋白,是目前确定与特定蛋白结合的基因组区域或确定与特定基因组区域结合的蛋白质的一种很好的方法。
然而,对于功能性研究结果的评价还需要综合SNPs所在序列信息、进化保守性、群体遗传学、实验功能性研究、暴露评价(如基因-环境交互作用研究)和流行病学证据,最后依据可以获得的各种证据来作出科学的评判。
一般情况下,可将SNPs是否具有功能效应分为三类:功能性、潜在功能性和非功能性。③染色质免疫沉淀分析(chromatinimmunopr5.几种常用的SNPs扩增分析技术及其特点5.1限制性片段长度多态性(RFLP)
技术原理是检测DNA在限制性内切酶酶切后形成的特定DNA片段的大小。因此凡是可以引起酶切位点变异的突变如点突变(新产生和去除酶切位点)和一段DNA的重新组织(如插入和缺失造成酶切位点间的长度发生变化)等均可导致RFLP的产生。酶切反应后凝胶电泳分析结果示意图Marker123
2000bp1000bp750bp500bp250bp100bpAAAGGG=RestrictionsiteGG:完全酶切AG:部分酶切AA:不能酶切5.几种常用的SNPs扩增分析技术及其特点酶切反应后凝胶电泳优点:方法简单、容易操作、经费要求不高。缺点:样品纯度要求较高和用量大、过分依赖于限制性内切酶的种类和数量、分析步骤繁琐、工作量大、分型容易出错、通量较小。5.2TaqMan探针荧光定量PCR
技术原理:探针只与模板特异性地结合,其结合位点在两条引物之间。探针的5’端标记有报告基团(Reporter,R)如FAM、VIC等,3’端标记有荧光淬灭基团(Quencher,Q)如TAMRA等。当探针完整的时候,报告基团所发射的荧光能量被淬灭基团吸收,仪器检测不到信号。随着PCR的进行,Taq酶在链延伸过程中遇到与模板结合的探针,其5’→3’外切核酸酶活性就会将探针切断,报告基团远离淬灭基团,其能量不能被吸收,即产生荧光信号。在探针的5’端使用不同的Report荧光基团,单一PCR中可以检测到多个探针的杂交与相应荧光。只有与模板完全匹配的TaqMan探针在与等位基因发生特异性杂交后,利用Taq酶的5’外切酶活性作用使得探针的5’Report荧光能够被检测。优点:方法简单、容易操作、经费要求不高。5.2TaqManTaqMan探针法原理示意图TaqMan探针法结果报告示意图结果报告示意图优点:方法简单、容易操作、灵敏,特异性高、可在同一管内检测多重PCR、避免了荧光染料对PCR反应的影响、效率和准确性高、通量大、分析和PCR扩增同时进行。缺点:探针设计有一定难度,需要验证效果,探针的合成和双荧光标记成本高。5.3变性-高效液相色谱(DHPLC)
原理是利用离子对反向高效液相色谱原理,通过一个DNA分离柱,进行核苷酸片段的分离和分析。将DNA样品注入到DNA分离柱上,在缓冲液中的桥分子三乙基胺(triethylammoniumacetate,TEAA)的辅助下而被吸附到固相柱基质上;乙腈(acetonitrile)则可以破坏三乙基胺这一作用。随着缓冲液中乙腈浓度逐渐升高,DNA依次从柱上洗脱下来。在合适的变性温度下,有突变的异源双链要比相应的同源双链柱保留时间短而被先洗脱下来;不同序列的DNA同源双链的柱保留时间也有差异。因此,带有突变序列的样品呈现出异源和同源双链混合物的峰型特点,而不含突变序列的样品则只有同源双链的峰型。优点:方法简单、容易操作、灵敏,特异性高、可在同一管内检测多
DHPLC能以三种方式操作:1.不变性温度条件下(50℃),色谱仪类似凝胶电泳仪,可分离分子量不同的双链DNA分子或分析具有长度多态性的片段,类似RFLP分析,也可进行定量RT-PCR及微卫星不稳定性测定(MSI)。2.在充分变性温度条件下(80℃),单链DNA或RNA分子能被区分,适用于寡核苷酸探针合成纯度分析和质量控制。3.在部分变性的温度条件下,变异型和野生型的PCR产物经过变性复性过程,不仅分别形成同源双链,同时也错配形成异源双链,根据柱子保留时间的不同将同源双链和异源双链分离,从而识别变异型。优点:准确性较高(未知突变大于96%,已知突变大于99%)、灵敏度高(少至5%的基因型)、操作容易、自动化分析、结果重复性高,速度快、样品通量高。缺点:DNA分离柱需要定期更换、成本较高、需要先做好PCR扩增。DHPLC能以三种方式操作:1.不变性温度5.4高分辨溶解曲线分析(HighResolutionMelting,HRM)
技术原理在PCR反应前将LCGreen荧光染料与反应Buffer、引物、模板DNA混合(使LCGreen染料饱和加入,LCGreen荧光染料对PCR不会有任何抑制作用)后进行PCR扩增;然后将PCR产物(96孔板或者384孔板)直接放入LightScanner或HR-1仪器中,在一定的温度范围内将PCR扩增产物进行变性,在此期间,仪器的光学检测系统采集密集的荧光信号变化并绘制温度熔解曲线,根据曲线准确区分野生型、杂合突变、纯和突变,软件自动分型。优点:快速(5分钟)、高通量、准确、灵敏度高、特异性好、操作简便。缺点:LCGreen荧光染料价格较高、需要先做好PCR扩增。5.4高分辨溶解曲线分析(HighResolution左图中A,LightScanner一次扫描多个PCR产物,直接判定纯合突变并可以区分不同的SNP,温度熔解顺序为A/A<T/T<C/C<G/G。左图中B,LightScanner一次扫描多个PCR产物,直接判定杂合突变和纯合突变并进行不同SNP分型。HRM分析结果示意图左图中A,LightScanner一次扫描多个PCR产物,直5.5测序分析
测序的基本原理是Sanger末端终止法,在酶的作用下将原本是一条长达数百碱基的片断扩增成数百条片断,彼此间相差一个碱基。用电泳分离这些片断后,再通过测序仪将这些信号转变成峰图,从而最终形成客户所看到的测序序列和测序的峰图。优点:准确、是金标准。缺点:通量小、费时费力、价格高、也会出现错误。5.5测序分析优点:准确、是金标准。5.6基质辅助激光解吸电离飞行时间质谱(MALDI-TOF)原理:通过PCR扩增目标序列,然后加入SNP序列特异延伸引物,在SNP
位点上,延伸1个碱基。将制备的样品分析物与芯片基质共结晶,将该晶体放入质谱仪的真空管,而后用瞬时纳秒(10-9s)强激光激发,由于基质分子经辐射所吸收的能量,导致能量蓄积并迅速产热,从而使基质晶体升华,核酸分子就会解吸附并转变为亚稳态离子,产生的离子多为单电荷离子,这些单电荷离子在加速电场中获得相同的动能,进而在一非电场漂移区内按照其质荷比率加以分离,在真空小管中飞行到达检测器,离子质量越小,就越快到达。特点:高通量、准确性高、简单、灵活、灵敏度高5.6基质辅助激光解吸电离飞行时间质谱(MALDI-TOF分析流程图1分析流程图1分析流程图2分析流程图2数据截图1
数据截图1数据截图2数据截图25.7常用SNP检测技术小结质谱分析法限制性片段长度多态性分析法实时荧光PCR分析法单链构象多态性分析法(SSCP)异源双链分析法(HA)变性梯度凝胶电泳法(DGGE)DNA测序法(DNAsequencing)DNA芯片技术(DNAchip)………………5.8飞行时间质谱VSTaqman基因分型VSBeadstation基因分型.doc5.7常用SNP检测技术小结质谱分析法5.8飞行时间质谱七、SNPs实验分析中的问题最常见和最严重的问题是基因型分型错误(GenotypingErrors)a.1989年以来报道的与基因分型有关的论文数量。b.1989年以来与基因分型有关的领域及其百分率。NatRevGenetg2005[6(11)]847-859七、SNPs实验分析中的问题最常见和最严重的问题是基因型分型基因分型错误和影响:一起案例GagneuxP,WoodruffDS,BoeschC.Furtivematinginfemalechimpanzees.Nature.1997May22;387(6631):358-359GagneuxP,BoeschC,WoodruffDS.MicrosatellitescoringerrorsassociatedwithnoninvasivegenotypingbasedonnuclearDNAamplifiedfromshedhair.MolEcol.1997Sep;6(9):861-868Retraction:Furtivematinginfemalechimpanzees.Nature.2001Nov29;414(6863):508.Alltypesofmolecularmarkerarepronetogenotypingerror,includingsequencedata.基因分型错误和影响:一起案例GagneuxP,Wood1导致基因分型错误的原因
NatRevGenet2005[6(11)]847-859DNA分子的相互影响样本质量差1导致基因分型错误的原因NatRevGenet2生化和仪器假象生化和仪器假象Nullallele:anon-amplifyingallelethatisduetoamutationintheprimertargetsequence;Allelicdropout:thestochasticnon-amplificationofanallele,thatis,amplificationofonlyoneofthetwoallelespresentataheterozygouslocus;Mistakenallele:anallelethatdoesnotcorrespondtothetrueallele,excludingthenullallele,allelicdropoutandfalseallele.Falseallele:allele-likePCR-generatedartifact;Tm:meltingtemperature.人为因素Nullallele:anon-amplifying2减少基因分型错误及其影响的措施
2.1通用建议首先,确定基因分型的可行性。其次,发现理论与实际的出错率以及是否可以耐受。最后,对实验的全过程进行质量控制。2.2降低分型流程中的错误率★仅熟练的研究科学家或技术人员参与其中。★仅使用标准的和有效的操作指南。★尽量减少人为因素或操作的影响。★系统性的采用适当数量的阳性和阴性对照。★运用5%-10%的样本进行盲性重复实验与分析。2减少基因分型错误及其影响的措施2.3等位基因分型后的错误率控制常用的手段有:Mendelianconsistency和Hardy-Weinbergequilibrium的检验。用于上述检验的软件有如下几种:评估出错的影响测试或计算基因分型的错误率2.3等位基因分型后的错误率控制评估出错的影响测试或计算L/Q,linkageorQTLstudies;P,pedigreeanalysis;PG/D,populationgeneticsordemography.NatRevGenet2005[6(11)]847-859对包含错误的数据进行再分析L/Q,linkageorQTLstudies;P2.4控制分型错误和影响的流程示意图NatRevGenet2005[(11)]847-9a.确定本分型的错误率b.确定可接受的错误率c.找出预实验没能发现的出错因素并矫正d.确定数据分析时的出错率e.发表研究结果时,应该告知错误率的控制情况或质控方式2.4控制分型错误NatRevGenet2005[(1八、实际工作中SNPs的选择原则1一般性原则
先功能性的SNPs:外显子上的错义或同义突变位点;每一个外显子两端和内含子中潜在性的剪切位点;基因的3’-端和5-’端序列中可能具有调节功能的位点;
先标志性(Tag)的SNPs:它可以包含多个的SNPs的信息;
先选常见的SNPs:弱势等位基因频率>5%;八、实际工作中SNPs的选择原则1一般性原则基因多态性数据库与运用1课件基因多态性数据库与运用1课件......…………………......……………2拟分析的SNPs,必须进行研究群体的频率分布确认例如LPL基因的rs18005902拟分析的SNPs,必须进行研究群体的频率分布确认3MAF<5%具有潜在功能或者在患者群体中>5%的SNPs也应选择ForExample:NOD2mutationspredisposingtoCrohn’sdiseasewererecentlyfoundtooccuratafrequencyof6–12%amongcases,butat<5%amongcontrols(Hugotetal.,2001;Oguraetal.,2001).HugotJP,ChamaillardM,ZoualiH,LesageS,CézardJP,BelaicheJ,AlmerS,TyskC,O'MorainCA,GassullM,BinderV,FinkelY,CortotA,ModiglianiR,Laurent-PuigP,Gower-RousseauC,MacryJ,ColombelJF,SahbatouM,ThomasG.AssociationofNOD2leucine-richrepeatvariantswithsusceptibilitytoCrohn’sdisease.Nature.2001,411:599–603OguraY,BonenDK,InoharaN,NicolaeDL,ChenFF,RamosR,BrittonH,MoranT,KaraliuskasR,DuerrRH,AchkarJP,BrantSR,BaylessTM,KirschnerBS,HanauerSB,NuñezG,ChoJH.AframeshiftmutationinNOD2associatedwithsusceptibilitytoCrohn’sdisease.Nature.2001,411:603–606幻灯片873MAF<5%具有潜在功能或者在患者群体中>5%的SNP九、SNPs数据库使用流程演示第一步:输入/
,进入数据库主页NCBI主页.doc第二步:选择SNP库,输入基因名或其简称,比如LPL--获得该基因的所有SNP信息LPL-SNPResults.docNCBI数据库运用举例1.利用基因来找SNP备注:V=Validated(确认)G=Genotypedataavailable(有基因型数据)九、SNPs数据库使用流程演示第一步:NCBI数据库运用举例第三步:点击Human:684,获得人类LPL基因上的684个SNPs信息第四步:任意点击一个SNP,比如rs80303525,即可获得该位点的详细数据Reportrs80303525.doc第五步:在GeneView栏目下,选择即可获得LPL基因上所有SNPs的数据LPL基因上SNPs信息.doc第三步:第四步:第五步:第六步:按照SNP选择原则,挑选出需要进行研究的SNP位点幻灯片792.利用Marker来找SNP第一步:输入/进入数据库主页第二步:点击SNP,进入dbSNP数据库主页dbSNP数据库主页.doc第六步:按照SNP选择原则,挑选出需要进行研究的SNP位点幻第三步:点击here进入检索页面在BetweenMarkers栏目下,输入两个Markers名称后进行检索即可获得介于这两个Markers之间的所有
SNPs信息比如:输入RH79657和RH45644,点击SubmitSTSMarkers,即可获得位于人类15号染色体上的1577个SNP信息第四步第五步第六步操作参见--1.利用基因来找SNP第三步:比如:输入RH79657和RH45644,点击SubHapMap数据库运用举例第一步:输入/,
进入HapMap数据库主页.doc第二步:点击Data进入数据库浏览页.doc第三步:点击GenericGenomeBrowser,进入HapMap数据浏览和下载网页.docHapMap数据库运用举例第一步:第二步:点击Data进入数第四步:在查询窗中输入基因名或染色体区域,在数据窗选择数据来源库,在保存、查询和其他选择窗中挑选
DownloadSNPgenotypedata或tagSNPdata来分别获取相应的数据。第五步:点击配置,设定参数来获得在CHB群体中的
SNPgenotype或
tagSNPdata第六步:选择CHB,rs,SavetoDisk三个参数来保存SNPgenotypedata,然后用HaploView软件进行分析
或选择CHB,TaggerMultimarker*,r2≥0.8,MAF≥0.05,SavetoDisk五个参数来保存tagSNPdata,获得的数据可用于实验设计或发表论文。第四步:在查询窗中输入基因名或染色体区域,在数据窗选择思考题请任意选择一个人类基因,在中国汉族群体中分析该基因拥有的单核苷酸多态性的生物学信息,然后依据获得数据,提出那些单核苷酸多态性位点可能会具有生物学功能。思考题基因多态性数据库与运用建议和意见请发送到:yangms88@
基因多态性数据库建议和意见请发送到:yangms88@yah
讲课内容三、人类遗传物质的差异--基因多态性二、导致人类表型多样性的原因四、SNPs概论五、SNPs数据库构建六、SNPs实验分析技术七、SNPs实验分析中的问题八、实际工作中SNPs的选择原则一、人类表型的多样性九、SNPs数据库使用流程演示讲课内容三、人类遗传物质的差异--基因多态性二、导致人类表一、人类表型的多样性一、人类表型的多样性基因多态性数据库与运用1课件基因多态性数据库与运用1课件遗传背景一致性和部分表型的差异遗传背景一致性和部分表型的差异二、导致人类表型的多样性的原因生存环境因素的影响
自然条件文化背景生活与饮食习惯社会体制………2.自身遗传物质的作用
基因的功能和调节非编码DNA序列的影响表观遗传的作用上位抑制的影响多态性位点的存在………
二、导致人类表型的多样性的原因基因多态性数据库与运用1课件基因多态性数据库与运用1课件基因多态性数据库与运用1课件血缘关系与患病风险示意图血两个重要的容易混淆的概念1.易感性(Susceptibility)
一个个体仅在遗传因素的作用下罹患某种疾病的风险。2.易患性(Liability)
一个个体在遗传因素和环境因素的共同作用下罹患某种疾病的风险。
两个重要的容易混淆的概念1.易感性(Susceptibil常用的遗传学研究资源和数据库1GeneticAssociationDatabase:Anarchiveofhumangeneticassociationstudiesofcomplexdiseases.
/2SchizophreniaGeneDatabase:Anarchiveofgeneticassociationstudiesperformedonschizophreniaphenotypes.
/res/sczgene/default.asp
3OnlineMendelianInheritanceinMan:Acatalogueofhumangenesdisorders.
/sites/entrez?db=OMIM&
4HumanGeneMutationDatabase.Acatalogueofpublishedgeneresponsibleforhumaninheriteddisease.
http://www.hgmd.cf.ac.常用的遗传学研究资源和数据库1GeneticAssoci5HumanGenomeVariationDatabase:Acatalogueofnormalhumangenomevariation.
/
6dbSNP:Acatalogueofhumansinglenucleotidepolymorphisms.
/projects/SNP/
7GeneSNPs:Adatabaseofpolymorphismsinhumangenesthatarearoleinsusceptibilitytoenvironmentalexposure.
/genesnps/
8PharmGKB:Adatabaseofpharmacogenomicsresearch.
/index.jsp
9GeneCards:Adatabaseofhumangenesthatincludesgenomic,proteomictranscriptomicinformation,aswellasorthologies,diseaserelationships,geneexpressionandgenefunction.
/
5HumanGenomeVariationDatab常用的候选基因分析软件和工具GeneSeeker
http://www.cmbi.ru.nl/GeneSeeker/GFSST
Endeavour
http://www.esat.kuleuven.be/endeavour
POCUShttp://www.hgu.mrc.ac.uk/Users/Colin.Semple/
G2D
http://www.ogic.ca/projects/g2d_2/
SUSPECTS
http://www.genetics.med.ed.ac.uk/suspects/
TOM
http://www-micrel.deis.unibo.it/~tom/
BioMercator
http://moulon.inra.fr/~bioinfo/BioMercator
GFINDer
http://www.bioinformatics.polimi.it/GFINDer/
PROSPECTR
http://www.genetics.med.ed.ac.uk/prospectr/
QTLMixer
http://qtl.pzr.uni-rostock.de/qtlmix.php
CoGenT++
http://cgg.ebi.ac.uk/cogentpp.html
SNPs3D
http://www.SNPs3D.org
PhD-SNP
http://gpcr.biocomp.unibo.it/cgi/predictors/PhD-SNP/
……常用的候选基因分析软件和工具GeneSeekerhtt一个基因可以具有多个不同的表达模式一个蛋白质可以具几种不同的结构和功能衍生物现以脂蛋白酯酶基因(LPL)为例进行说明LPL是脂质代谢的关键酶,目前发现其具有四种剪切模式4AlternativeSplicingDatabase(ASD)splicepatterns(SP)forLPL.doc一个基因可以具有多个不同的表达模式现以脂蛋白酯酶基因(LPLGeneticControlofGeneExpressioninVariousTissues.NEnglJMed2009;360:1759-68.GeneticNEnglJMed三、人类遗传物质的差异基因多态性1.人类自身遗传物质99.8%是完全一致的2.人类自身遗传物质的差异大约为0.2%其中:在核苷酸碱基水平上约占0.80%比如:碱基的替换、点突变、碱基的插入或缺失、SNPs等
在基因组结构水平上约占0.20%
(包括片段的插入、缺失、倒置、移位、互换等)比如:2-1000bp片段:微卫星、小卫星等1kbp-亚显微结构:拷贝数量多态性等显微-亚染色体结构:片段的非整倍体等整条染色体-全基因组:染色体互换或非整倍性等
3.30亿个碱基对中95%为非编码序列,5%为蛋白编码序列三、人类遗传物质的差异基因多态性1.人类自身遗NatGenet.2007,39(7Suppl):S7-S15NatGenet.2007,SingleNucleotidePolymorphisms
(SNPs)SingleNucleotidePolymorphism微卫星(MicrosatelliteMarkers)Variablenumbersoftandemrepeats(2,3,4)basesUniqueprimersfor400markersStutterduetoslippageofpolymeraseMarker-dependent,variablestuttermorphologyAlsoCalled--ShortTandemRepeat(STR)微卫星(MicrosatelliteMarkers)VFourColorDetectionwithFilterSetIIFourColorDetectionwithFiltMegaBACEGenotypeMegaBACEGenotypeFatherMotherChildtgtcatgctagattCACACAggttcgtagtcagtgtcatgctagattCACACACACACACAggttcgtagtcagFatherMotherChildtgtcatgctagat微卫星运用例证1:原发性习惯性流产遗传位点的研究微卫星运用例证1:原发性习惯性流产遗传位点的研究基因多态性数据库与运用1课件基因多态性数据库与运用1课件基因多态性数据库与运用1课件ReproductiveSciencesVol.17No.6June2010578-584ReproductiveSciencesVol.17微卫星运用例证2:亲子鉴定母子父微卫星运用例证2:亲子鉴定母子父基因多态性数据库与运用1课件CopyNumberVariants(CNVs)CopyNumberVariants(CNVs)野生型DNA片段DNA片段的缺失
DNA片段的插入ABCABCABNACBDNA片段的倒置BACGHIGHICDNA片段的移位GABHCIDNA片段的互换DNA片段多态性野生型DNA片段DNA片段的缺失DNA片段的插入ABCABManyvariantswithsmalleffects,asmallernumberwithintermediateeffectsandrelativelyfewwithlargeeffects.NatRewGenet,2005,[6(2)]109-118AnL-shapedorexponentialdistributionofvariantseffectsizeshaswidesupport.Manyvariantswithsmalleffec88%oftrait-associatedSNPs(TASs)wereintronic(45%)orintergenic(43%),
12%locatedin,oroccurintightlinkagedisequilibriumwith,protein-codingregionsofgenes.NEnglJMed2010;363:166-76.PNAS,2009[106(23)]9362-936788%oftrait-associatedSNPs(四、SNPs概论1.定义:单核苷酸多态性(singlenucleotidepolymorphism,SNP,发音为“snip”)是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。2.特征:是最常见的一种变异,约占所有已知多态性的40%;分布广,1个/300~1000个碱基对,总数可能>2470万;由单个碱基的转换(transition)或颠换(transversion)所导致;转换的发生率较高,SNP中转换型变异者约占2/3;(可能是因为CpG二核苷酸上的胞嘧啶残基最易发生突变,其中大多数是甲基化的,可自发地脱去氨基而形成胸腺嘧啶)SNP基本上表现为二等位多态性;根据SNP在基因中的位置,可分为基因编码区SNPs(Coding-regionSNPs,cSNPs)、基因周边SNPs(PerigenicSNPs,pSNPs)以及基因间SNPs(IntergenicSNPs,iSNPs)等三类;四、SNPs概论
位于编码区内的SNP(codingSNP,cSNP)比较少,又可分为2种:同义(synonymous)cSNP和非同义(non-synonymous)cSNP,参与蛋白质编码;位于非编码区内的SNP比较多,其变异率是cSNP的5倍,参与基因表达的调控;先形成的SNP在人群中常有较高的频率,而后形成的SNP频率较低;3.现有SNP在白色、黑色和黄色人种中的分布频率<20%,占7%;实验无法证实者,占17%;在一个人种中频率≥20%,占76%;在二个人种中频率≥20%,占53%;在三个人种中频率≥20%,占27%;位于编码区内的SNP(codingSNP,cSNP)比OccurrenceofSNPsintheHumanPopulationandTheirRepresentationintheCurrentCollectionNatureGenetics2001,27:234-236
OccurrenceofSNPsintheHuma基因多态性数据库与运用1课件4.SNPs网上资源主要有:NIH的dbSNP多态性数据库:/SNP德国的HGBAS网站的人类SNP数据库:hgbas.cgr.ki.sei日本建立的JSTSNP数据库:snp.ims.utolkyo.ac.jpNIH的与癌症和肿瘤相关的候选SNP数据库:/GAIFastSNPSearch:.twPerlegenBrowser:UCSCGenomeBioinformaticsSite:美国Utah大学SNP数据库:美国波士顿儿童医院SNP数据库:SNP联盟数据库:英国Sanger研究所:www.sanger.ac.ukHapMapHomepage:EnsemblGenomedatabasesandtools:……4.SNPs网上资源主要有:5.NIH的dbSNP多态性数据库:/SNP
dbSNP的挑选方式和不足:60%的“候选”SNPs是通过统计学方法预测出来的即通过比较重叠克隆中的DNA序列痕迹来确定“候选”SNPs。因此,大多数的dbSNP是频率未知的“候选”SNPs。
总数量约为2470万个SNPs;
三大来源:SNP联盟数据库:英国Sanger研究所:www.sanger.ac.uk美国WashingtonUniversity,St.Louis
设立的参照SNP(Reference_SNP)>400万个,采用rs+数字编号来表示;
5.NIH的dbSNP多态性数据库:www.ncbi.nl可从多个路径查找SNPs:Humangenomeresources,mapview,Genebank等等;dbSNP的质量:已经证实的Ref_SNPs,大约有400万个非人类的SNPs,大约有216万个无法证实的SNPs,大约有184万个在某一群体中不是多态性的,大约有152万个在某一群体中频率<20%的,大约有126万个被证实的其频率>20%的SNPs,大约有63万个可从多个路径查找SNPs:Humangenomeres五、SNPs数据库构建1.生物信息数据库的构建与获取图1数据库的建立:采用数据库转换技术将不同格式、来源的数据转化为同一格式,从而建立单一的大数据库。NatRevGenet.2003[4(5)]337-345五、SNPs数据库构建1.生物信息数据库的构建与获取图1图2连点和节点。运用连点和节点方法将各自独立的资源整合起来,对于一些重要的关联信息比如同源基因,则采取特定数据库的方式储存起来。NatRevGenet.2003[4(5)]337-345图2连点和节点。运用连点和节点方法将各自独立的资源整合图3生物数据库的结构和获取绝大多数生物数据库采用三层结构模式:第一层的数据管理系统(底层)第二层的中间设备,包括获取数据的软件和网络服务器(中层)第三层的网络浏览器(高层),即用户。NatRevGenet.2003[4(5)]337-345图3生物数据库的结构和获取
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖北省荆州市沙市区沙市中学2025届物理高三上期末复习检测模拟试题含解析
- 甘肃省定西市通渭二中2025届高一物理第一学期期末监测试题含解析
- 安徽省阜阳市临泉县一中2025届高三上物理期中考试试题含解析
- 云南省楚雄州姚安县一中2025届高三物理第一学期期中教学质量检测模拟试题含解析
- 2025届广东省东莞市高级中学物理高三第一学期期中联考模拟试题含解析
- 河北省保定市曲阳县一中2025届物理高一第一学期期末预测试题含解析
- 2025届福建省漳州市东山第二中学物理高一上期末复习检测模拟试题含解析
- 2025届新疆昌吉市一中物理高一第一学期期末考试模拟试题含解析
- 急诊科小讲课护理课件
- 急诊呼气末二氧化碳监测护理课件
- 幼小衔接中存在的问题及对策
- 工程前沿案例作业
- 中级汉语期末考试测试题(共5页)
- 《国家电网公司安全生产事故隐患排查治理管理办法》(国家电网安监[
- 水保监理报告范文
- xx售楼部钢结构及玻璃幕墙工程拆除施工方案
- 工程移交单表格1页
- 云南沿边高校青年教师发展现状及问题分析
- 先进制造业项目专项资金申请报告范文模板
- OOK调制解调电路设计
- 《电影放映经营许可证》年检申请表
评论
0/150
提交评论