外显子组测序信息分析_第1页
外显子组测序信息分析_第2页
外显子组测序信息分析_第3页
外显子组测序信息分析_第4页
外显子组测序信息分析_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

外显子组测序在医学研究中的应用

一外显子组测序技术简介二外显子组测序流程三外显子组测序信息分析内容四外显子组测序的应用方案一、外显子组测序技术简介

外显子组序列仅占全基因组序列的1%左右,与人类85%致病基因突变相关。与全基因组测序相比,外显子组测序不仅费用较低,而且测序覆盖度更深,数据准确性更高。外显子测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后,再进行高通量测序的基因组分析方法。二、外显子组测序流程基因组DNA的随机打断DNA片段的末端修复和接头的连接PCR扩增文库DNA液相探针杂交捕获目的片段PCR扩增捕获的DNA片段测序文库的检测HiSeq2500测序生物信息分析三、外显子组测序信息分析流程主要信息分析内容归类3.1、数据过滤与评估3.2、整体质量评估3.3、SNP检测与注释3.4、InDel检测与注释3.5、高级分析3.1、数据过滤与评估过滤接头。对含接头的reads去除接头序列。一条reads上N(未能确定出具体的碱基类型)的比例大于5%,则过滤掉该reads。过滤低质量reads,过滤掉Q30<85%reads。3.1.1、原始数据过滤3.1.2、测序数据统计与评估测序质量值分布图碱基含量分布图3.2、整体测序质量评估3.2.1、测序深度统计注:横坐标代表测序深度,纵坐标代表目标区域上对应深度的碱基数占总碱基数的百分比。目标区域的单碱基分布近似服从泊松分布。3.2.2、外显子捕获统计TargetregionstatX1X2X3X4Length_of_target_region(Mb)1118.70118.70118.70118.70Reads_mapping_ref(singlereads)2182.95168.4897.7696.16Mapping_datasize(Mb)3137211263697769616Effective_sequences_on_target(Mb)592.0590.8666.8464.37Average_sequencing_depth_on_target747.3146.7543.0541.45Mismatch_rate_in_target_region8Mismatch_rate_in_all_effective_sequence9Base_covered_on_target(Mb)106904681566846437Coverage_of_target_region11Fraction_of_target_covered_with_at_least_20x12Fraction_of_target_covered_with_at_least_10x13Fraction_of_target_covered_with_at_least_4x14当比对到参考基因组目标区域的数据量在60%之上,认为外显子捕获效率合格。3.2.3、染色体覆盖深度分布注:横坐标为染色体长度,纵坐标为覆盖深度取对数。3.3、SNP检测及注释3.3.1、SNP检测SNP的检测主要使用GATK软件工具包实现。BMKIDSNPNumberTransitionNumberTransversionNumberTi/TvRatioHeterozygosityNumberHomozygosityNumberX19852546691723160822.11207400777854X28425165733992691172.13167179675337X3263326178220851062.0926436236890X4289954196145938092.0930446259508Total1556901TypeR01R02R03R04INTERGENIC449352380794113110125682INTRAGENIC34252896892975INTRON401739343966111218121865UPSTREAM244522135061056521DOWNSTREAM95551835652773230377UTR_3_PRIME395407112124UTR_5_PRIME21651891776850SPLICE_SITE_ACCEPTOR31361414SPLICE_SITE_DONOR61541921CDSNON_SYNONYMOUS_CODING19711899882925NON_SYNONYMOUS_START2100START_GAINED37834693100START_LOST8632STOP_GAINED2624108STOP_LOST5310SYNONYMOUS_CODING17721732923940SYNONYMOUS_STOP1100Other1068932183.3.2、SNP注释3.3.3、突变特征突变频谱图注:横坐标为不同类型的突变,纵坐标为不同类型突变对应的频率。3.3.3、突变特征突变位点上下文碱基偏好性注:横坐标为突变位点上下文的碱基位置,0为SNP突变位点,负数代表突变位点前的碱基,正数代表突变位点后的碱基,纵坐标为不同碱基对应的比例。从图上可以看出,不同类型的SNP突变上下文具有不同的碱基偏好性。3.4、

InDel检测及注释3.4.1、

InDel检测RegionR01R02R03R04TotalInsertion5168944234152331657392775Deletion57643510611670517840107838Heterozygosity89744788482858630639--Homozygosity195881644733523774--Total109332952953193834413200613TypeR01R02R03R04INTERGENIC48070416011357914755INTRAGENIC410337123117INTRON45413396821370114581UPSTREAM30602706759851DOWNSTREAM116331026535533851UTR_3_PRIME333174UTR_5_PRIME26524687106SPLICE_SITE_ACCEPTOR152364SPLICE_SITE_DONOR6833CDSCODON_DELETION151635CODON_INSERTION12502EXON_DELETED2672427393FRAME_SHIFT94922730CODON_DELETION151635CODON_INSERTION12502Other19241263.4.1、

InDel注释3.5、高级分析3.5.1、基因融合注:最外圈表示人基因组及基因组上基因分布情况;文字代表发生基因融合的基因ID;红色线条代表染色体间基因融合;绿色线条代表染色体内基因融合。3.5.2、氨基酸替换预测ChrIDPosCodonsSubstitutionSNPTypePredictionGenechr1881627CTG-tTGL615LSynonymousTOLERATEDENSG00000188976chr111884555GAG-GgGE198GNonsynonymousTOLERATEDENSG00000011021chr112776344ATG-tTGM1LNonsynonymousTOLERATEDENSG00000188984chr112919111GAA-aAAE83KNonsynonymousDAMAGINGENSG00000120952chr116356501GCC-aCCA447TNonsynonymousTOLERATEDENSG00000186510注:

Codons:密码子的变化情况;Substitution:氨基酸的替换信息;SNPType:SNP的类型;Prediction:预测结果(damaging/tolerated),TOLERATED表示这个突变是可以容忍的,即对蛋白质功能没有影响或影响很小,DAMAGING表示突变是有害的,即对蛋白质功能有较大影响;

Gene

:发生替换所在的基因。3.5.3、样品间差异表达基因COG分类统计COG数据库是基于细菌、藻类、真核生物的系统进化关系构建得到的,利用COG数据库可以对基因产物进行直系同源分类。注:横坐标为COG各分类内容,纵坐标为基因数目。在不同的功能类中,基因所占比例多少反映对应时期和环境下代谢或者生理偏向等内容,可以结合研究对象在各个功能类的分布作出科学的解释。差异基因GO注释聚类图

topGO有向无环图3.5.4、样品间差异表达基因GO分类统计差异基因KEGG通路示意图3.5.5、样品间差异表达基因KEGG注释四、外显子组测序的应用思路4.1WES找寻孟德尔疾病致病基因思路全外显子测序Whole-exomesequencing分析及预测候选基因突变致病性Analysisandpredictcandidatecausativevariats生物学功能研究Functionalresearch在多个家系或散发病例中进行突变筛查研究Mutat

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论