基因检测数据分析要点_第1页
基因检测数据分析要点_第2页
基因检测数据分析要点_第3页
基因检测数据分析要点_第4页
基因检测数据分析要点_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因检测数据分析要点ATCG二代测序下机数据分析流程ATCG基因捕获及高通量测序技术简介基因检测数据分析要点及案例ATCG基因捕获及高通量测序技术简介ATCG测序技术的发展ATCG测序技术的发展高通量测序:一次性对几百万到十亿条DNA分子进行并行测序,又称为下一代测序技术,其使得可对一个物种的转录组和基因组进行深入、细致、全貌的分析,所以又被称为深度测序。ATCG文库扩增低通量ASanger测序B高通量测序并行测序

高通量无需建立文库,

两端加测序接头PCR扩增高通量测序技术测序深度全基因组测序WGS30X全外显子测序WES100X靶向测序TS300-1000X

…AAGCTTGCGACTTCAGTTAGCGCTAAG…ATCG人基因组所有区域,30亿对个碱基对人基因组所有编码区域,5000万个碱基对感兴趣的目标区域,30-300个基因点突变CNV缺失1或0拷贝正常2拷贝重复>2拷贝常见的高通量测序方案ATCG目标基因测序片段覆盖片段GAP覆盖度=覆盖片段/目标基因平均测序深度=测序片段/目标基因测序深度:该位点被测到的次数A位点为4,B位点为3AB常见的高通量测序参数介绍ATCG198020082016一代测序技术常见突变热点少数几个基因1-100个位点某种疾病相关所有基因10-300个基因50万个位点全外显子测序22000多个基因30亿个位点一代测序技术疾病PANEL全外显子测序二代测序技术一代测序技术每一个人都有大约2万多个变异位点,其中绝大部分都是良性变异,那么如何从2万多个变异位点中找到患者真正的致病性变异位点?高通量测序数据解读面临的问题二代测序下机数据分析流程ATCGDNA全基因组文库制备目标基因区域的捕获新一代基因测序基因序列的生物信息学分析基因突变信息(SNP,InDel等)基因组打断连接接头文库与捕获探针杂交目标区域富集高通量测序数据分析ATCG基因捕获高通量测序实验流程ATCGRawdataCleanDataAlignmentSNP,InDelSVCNVAnnotation原始数据过滤:RawData—CleanData1)去除带接头2)去除低质量数据常用软件:1.BWA2.Samtools3.Picard二代测序下机数据分析流程ATCG测序数据质量分布图

GC含量分布检查1)去除带接头(adapter)的reads2)去除N的比例大于10%的reads3)去除低质量reads(小于10)碱基数超过reads长度比例的50%的reads原始数据过滤ATCG常用软件:1.BWA2.Samtools3.PicardAlignment比对ATCGGATKbestPracticesandBroadpipelinesSNV和Indel注释基因注释突变/基因与疾病关系的注释突变频率注释突变预测注释筛选正常人频率突变类型有无文献报道可疑突变位点质量控制ACMG指南临床症状致病突变位点ATCG注释正常数据库1000genomeInhouseESP6500EXACDGVdbSNP……疾病相关HGMDprofessionalCOSMICDecipherClinvarOMIM……突变功能预测SIFTPolyPhen_2MutationTasterGERP++FATHMMMetaSVMCLINSIG……基本注释CytoBand;gene;

RepeatRegionGene_region(exonic;5’UTR;3’UTR;splicing;intronic;intergenic)Effect(synonymous,nonsynonymous,splicing,stopgain,nonframeshift)OD2:NM_022162:exon8:c.G2722C:p.G908RATCG相关数据库功能筛选千人数据库等OMIM家系验证HGMDACMG指南ACMG评判:该位点父母验证结果是新生突变;(PS)相关基因已报道,与临床症状相符;(PS)正常人群中频率低,不出现;(PM)ATCG二代测序报告模板ATCG基因检测数据分析要点及案例临床过滤—以临床表型为依据进行突变过滤

Clinicalfilter—phenotype-drivingvariantanalysis技术过滤—系统误差,批次间误差,批次控制和内部数据库.Technicalfilter—systematicerrors,batcherrors,batchcontrolsandinternaldatabase.流行病学过滤–人群频率(1000G,EVS,ExAC)

Epidemiologicalfilter–populationfrequency(1000G,EVS,ExAC)突变功能过滤–非编码区,同义突变. Functionalannotations:VEP(VariantEffectPredictor)scoreorANNOVARorSnpEff遗传过滤—遗传模式

Geneticfilter-inheritancepattern.ATCG突变位点筛选方案ATCGOMIM:在线人类孟德尔遗传数据库基因遗传和疾病表型信息基因和突变的文字描述病例记录分子诊断参考文献OMIM数据库ATCGHGMD:人类基因突变数据库突变类型列表相应的参考文献对应的疾病列表致病突变(DM)疑似致病突变(DM?)疾病相关的多态性变异(DP)有功能证据支持的疾病相关多态性变异(DFP)体外/实验室或体内功能的多态性变异(FP)HGMD数据库ATCGClinVar数据库1.生物学意义分析突变是否会影响蛋白质的功能有无文献报道突变类型正常人频率突变位点的保守性2.遗传学意义分析是否存在共分离现象是否存在外显不全报道3.临床特征分析(最重要)突变基因相关疾病是否和患者临床特征吻合如何筛选单基因有害突变位点分析顺序文献报告过的位点危害性很高的突变类型(移码突变,终止突变,剪切位点突变)正常人群中的频率很低(AR:5%,AD:1%)符合该基因致病遗传方式AD/XD显性遗传,het杂合突变AR/XR隐性遗传,hom纯合突变ATCG生物学遗传学临床学致病性分析:ACMG指南

检测到了可以解释临床的基因变异,但是否真的就是患者的致病原因呢?ACMG(AmericanCollegeofMedicalGeneticsandGenomics)美国遗传学与基因组学学会正常人频率太高的多态性位点家族特有的良性变异真正的致病原因可能会是此基因其他更严重的变异(缺失重复)或其他基因的变异ATCG变异等级证据

EvidenceofpathogenicityPVS(VeryStrong)大突变:无义、移码、起始密码子、剪接(第1、2位)、外显子缺失PS(Strong)文献报道(HGMD数据库)自发突变-亲子关系确定(家系验证)已有功能验证高风险位点(OR值>5;几例病人均有)PM(Moderate)位于功能域人群数据库不出现(AR,频率低)(千人基因组、EXAC等)AR:与已知致病位点组成复合杂合整码插入缺失与文献报道同一位置,不同氨基酸自发突变-不确定亲子关系PP(Supporting)遗传共分离该基因很少有良性变异软件预测均致病(SIFT/PolyPhen)单基因病因其他实验室数据表明致病致病性突变位点分级ATCG变异等级证据

EvidenceofBenignBA(Standalone)MAF>5%(任何一个正常人数据库)BS(Strong)

大于发病率正常人也有该位点(前提100%外显率)功能验证不致病遗传不分离BP

(Supporting)已报道的都是大突变,发现的是小突变和致病位点位于一等位基因上Inframe插入缺失(重复区域)软件预测均不致病不是该病致病基因其他实验室数据显示不致病同义突变且软件预测不影响剪接致病性突变位点分级ATCG致病(pathogenic)可能致病(90%)(likelypathogenic)良性(benign)可能良性(likelybenign)致病性不明确(uncertainsignificance)I.1个PVS证据加上≥1个PS证据或≥2个PM证据或1个PM证据加上1个PP证据或≥2个PP证据

II.≥2个PS证据或

III.1个PS证据加上≥3个PM证据或2个PM加上≥2个PP证据或1个PM加上≥4个PP证据

I.1个PVS证据加上1个PM证据或

II.1个PS证据或加上1-2个PM证据或III.1个PS证据加上≥2个PP证据或IV.≥3个PM证据或V.2个PM证据加上≥2个PP证据或VI.1个PM证据加上≥4个PP证据

I.1个BA证据或

II.≥2个BS证据

I.1个BS证据加上1个BP证据或

II.≥2个BP证据

I.未满足上述的分级标准或

II.良性证据与致病证据相互矛盾

ACMG致病性判定标准ATCG功能筛选千人数据库等OMIM家系验证HGMDACMG指南ACMG评判:该位点父母验证结果是新生突变;(PS)相关基因已报道,与临床症状相符;(PS)正常人群中频率低,不出现;(PM)ATCG二代测序报告模板ATCG案例1-新生儿代谢V3检测临床症状:7岁男孩,智能低下,惊厥发作和色素减少。疾病:怀疑为PKUATP7Bp.R827Q位点无文献报道,ACMG指南评估为uncertain。且临床症状与PKU相符。ATCG案例2-甲基丙二酸尿症ATCG判断致病性:正常人群中频率低,不出现;(PM)终止突变,蛋白被截断,功能丧失;(PVS)相关基因被报道与甲基丙二酸血症相关,与临床症状相符;(PS)外显子缺失;(PVS)该位点被报道过与疾病相关,为致病位点;案例2-甲基丙二酸血症ATCG179个基因,2844个外显子157个变异:非同义变异43个;同义变异101个;终止突变1个;

氨基酸插入缺失2个;剪切位点变异10个人群中频率<5%,且排除同义变异:剩下3个考虑隐性遗传,临床症状:剩下1个案例3-癫痫检测特殊案例ATCG判断致病性:正常人群中频率低,不出现;(PM)终止突变,蛋白被截断,功能丧失;(PVS)相关基因被报道与癫痫性脑病相关,与临床症状相符;(PS)该位点父母验证结果是新发突变;(PS)该位点被报道过与疾病相关,为致病位点;案例3-癫痫检测特殊案例判断致病性:正常人群中频率低,不出现;(PM)终止突变,蛋白被截断,功能丧失;(PVS)相关基因被报道与癫痫性脑病相关,与临床症状相符;(PS)该位点父母验证结果是新发突变;(PS)该位点被报道过与疾病相关,为致病位点;(PS)母亲无突变,孩子有突变:新生突变;患者是男孩,X染色体上是杂合突变?

嵌合?XXY?X染色体上的片段重复?ATCG案例3-癫痫检测特殊案例通过CNV分析,排除XXY123.……………X对CDKL5分析,排除单个外显子的扩增通过CDKL5:R559X测序深度分析突变频率:112/(112+56)=65%明确为:每3个细胞中有2个细胞突变的嵌合体ATCG案例3-癫痫检测特殊案例ATCG12已报道过的AD杂合位点来源于父母一方突变基因对应多种疾病类型父母双方是否有相应的症状无有有明确症状轻微症状致病位点高度怀疑有外显不全报道无外显不全报道致病位点非致病位点突变位点是否有文献报道无有对应文献报道的疾病类型HGMD突变谱突变类型预测对应疾病类型相关文献研究突变区域检测结果解读相关问题ATCG第X代公司平台名称测序方法检测方法大约读长优点相对局限性第一代ABI/生命技术公司3130xL-3730xL桑格-毛细管电泳测序法荧光/光学600-1000高读长,准确度一次性达标率高,能很好处理重复序列和多聚序列通量低;样品制备成本高,使之难以做大量的平行测序第二代Roche/454基因组测序仪FLX系统焦磷酸测序法光学230-400在第二代中最高读长;比第一代的测序通量大样品制备较难;难于处理重复和同种碱基多聚区域;试剂冲洗带来错误累积;仪器昂贵第二代IlluminaHiSeq2000,HiSeq2500/MiSeq可逆链终止物和合成测序法荧光/光学2x150很高测序通量仪器昂贵;用于数据删节和分析的费用很高第二代ABI/Solid5500xlSolid系统连接测序法荧光/光学25-35很高测序通量;在广为接受的几种第二代平台中,所要拼接出人类基因组的试剂成本最低测序运行时间长;读长短,造成成本高,数据分析困难和基因组拼接困难;仪器昂贵常见的一代、二代测序平台ATCG桥式PCR边合成边测序可逆终止物Illumina测序平台ATCG桥式PCR实验原理ATCG多重PCR靶向扩增多重PCR扩增效率的一致性一直是一大难题,同一个反应体系中,引物越多,引物间相互干扰的问题就越严重,从而造成扩增子无法被扩增或扩增子间扩增不均一的问题。液相芯片捕获法液相芯片捕获产品TargetSeq可根据需求捕获基因组序列上任意片段、任意大小的区域,可能够检测到已知基因的未知突变位点及较大区域的插入/缺失和基因融合现象。高通量测序关键技术——基因捕获ATCGCNV检测结果的解读考虑因素具体意见熟悉已知的相邻基因综合征对经常出现的和临床典型的缺失/重复综合征、一些低拷贝重复序列以及关键区域,进行仔细的比对确认。CNV大小CNV越大致病性的可能性越大,但是并无直接关联,需具体分析。考虑CNV涉及区域内的基因1.有相关文献报道致病突变的基因2.无文献报道的致病突变基因3.相关区域内无基因本实验室内部数据库及外部公用数据库CNV数据比较1.普通人群中的CNV剂量不平衡2.非致病性CNV和可疑致病CNV的大小3.注意患者性别和数据库资料的个体性别

4.出现在普通人群的CNV的有效性5.“正常”个体的临床特征ATCGCNV检测结果的解读考虑因素具体意见致病性变异CNV在以往的文献中明确了致病的临床意义。注:检测到的CNV区域包括已报到过的明确致病区域。不确定临床意义的CNV1.不确定临床意义可能致病

a.个案报告,但具有明确的断裂点和表型且和患者临床特征相关。b.在CNV区域内有明显的功能和患者病因有关的基因。2.不确定临床意义可能非致病性变异a.因CNV大小超过了实验室建立的标准而被报告,但该CNV区域内没有基因。b.该CNV在数据库的少数病例中有描述,但亦非多态性。3.不确定临床意义a.CNV区域内包含基因,但基因是否是剂量敏感型未知。b.CNV在多个文献或数据库的报道结果矛盾,其确切的临床意义尚无结论。非致病性变异CNV在多个已有的文献或数据库资料均报道为良性变异注:在定义非致病性变异时还应注意CNV的种类。例如,某些区域的重复变异可能是非致病性的CNV,而在同一区域内的缺失变异可能有临床意义。

ATCG检测结果:

1.CNV类型:缺失

2.染色体与基因组位置:[hg19]22q11.21(chr22:18856356-21739888)*13.CNV大小:2.88MbCNV检测案例1-胎儿胎儿右位主动脉弓,胎儿双侧肾孟分离微缺失综合征最主要临床表现有:心脏缺陷、胸腺发育不全、咽腭闭锁不全伴腭裂、甲状旁腺发育不全版低钙血症、异常面容等。ATCG该异常在正常人数据库不出现,在Decipher疾病数据库中已报道与22q11deletionsyndrome(Velocardiofacial/DiGeorgesyndrome)相关CNV检测案例1-胎儿ATCG父亲检测结果:未检测到22q11.21区缺失母亲检测结果:未检测到22q11.21区缺失CNV检测案例1-父母CNV在以往的文献中明确了致病的临床意义。致病性变异:ATCG检测结果:1.CNV类型:重复和缺失2.染色体与基因组位置:[hg19]1p36.31(chr1:6706500-6865265)*3[hg19]13q21.1(chr13:57701609-57918855)*13.CNV大小:158.77K和217.25KCNV检测案例2-胎儿不确定临床意义的CNVATCGCNV检测案例1-胎儿Thisgeneisoneoffiveidenticallociinaclusteronchromosome13q21.1.Thepredictedproteinisproline-richandcontainsseveraldopamineD4receptorsignaturesandPRINTSdomains.[providedbyRefSeq,Oct2008]ATCG检测结果:1.CNV类型:缺失和重复2.染色体与基因组位置:[hg1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论