

下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、),格式详eger,Description=Read Depth (only filtered reads used for AA,AB,BB genotypes where A=ref and B=alt; not applicable if site is not biallelic eger,Description=Allele countingenotypes,foreachALTallele,in the same order as listed#INFO=eger,Description=Totalnumberofallelesincalledgenotypes #INFO= eg
2、er,Description=Total Depth#INFO=#INFO=#INFO= #INFO=ID=VQSLOD,Number=1,Type=Float,Description=log10-scaled probability of variant trueunderthetrainedgaussianmixture REFALTFILTER FORMAT .TG AG4;SB=-1152.13;VQSLOD=0.1185GT:AD:DP:GQ:PL CTSB=-46.55;VQSLOD=-1.9148GT:AD:DP:GQ:PL TCSB=-0.98GT:AD:DP:GQ:PL #I
3、NFO=ID=VQSLOD,Number=1,Type=Float,Description=log10-scaled probability of variant trueunderthetrainedgaussianmixture REFALTFILTER FORMAT .TG AG4;SB=-1152.13;VQSLOD=0.1185GT:AD:DP:GQ:PL CTSB=-46.55;VQSLOD=-1.9148GT:AD:DP:GQ:PL TCSB=-0.98GT:AD:DP:GQ:PL VCF文件分为两部分内容:以“#”开头的注释部分;没有“#”VCF 看这个注释部分就完全明白了VC
4、FVCF文件HEADERREFALTFILTER .TG5231.78 AGCTTC代表一个 Variant 的信息。3Variation CHROM variantINDEL novelvariantREF 和 ALT:参考序列的碱基 和 Variant 代表一个 Variant 的信息。3Variation CHROM variantINDEL novelvariantREF 和 ALT:参考序列的碱基 和 Variant variant 的可能性越大;计算方法:Phred 值 = -10 * log (1-p) p variant0.1的概率为 90%。FILTERQUAL 值来进行过滤
5、的话,是不够的。GATK 能使用其它的方法INFOvariantFORMAT 和 NA12878:这两行合起来提供了NA12878这个 le .TGCLIPPEDAGCLIPPEDCTCLIPPEDle 的(genotype型。0 ref allele; 1 variant allele; variant allele。因此: 0/0 le 示 s0/1 le 中该位点为杂合的,有ref variant 型; 1/1 le variant AD 和 DP:AD(AlleleDepth)le allele reads 覆盖度,diploid 型;(Dep)为 s le 型的质量值(Genotyp
6、e Quality)。Phred 格式(Phred_scaled)GenotypePhred 值 = -10*log1-p) p 型的质量值(provieds the likelihoods of the given genotypes)1型的可能性越小。 Phred 值 10GenotypePhred 值 = -10*log1-p) p 型的质量值(provieds the likelihoods of the given genotypes)1型的可能性越小。 Phred 值 10*log (p) p 5VCF 8 该列信息都是以 “TAG=Value”,并使用”;”VCF文件的头部注释中
7、给出。以下是这些 TAG 的解释ACAF ANAC(Allele AF(Allele) lele Number) Allele 1 diploid le 则型0/1 Allelele 个等发生了突变),Allele 的频率为0.5(双倍体的le 50%) 型 1/1 le Allele2,Allele 1Allele 2DP:readsreadsDels:FractionofReadsContainingSpanningDeletionsSNPINDELcalling的结果中,有该 TAG 并且值为 0 表示该位点为 SNP,没有则为 INDEL。FSFishersstrandbiasFhre
8、dp值。该值越小越好。一般进行 filter 的时候,可以设置 FS 1020。HaplotypeScore:Consistency of the site wit most two segregating haplotypes InbreedingCoeff:Inbreeding coefficient as estimated from the genotype likelihoodsper-lewhencomparedagainsttheHard-Weinbergumlikelihoodion(MLE)fortheallelecounts(nothesameorderassarily sameastheAC),foreachALTumlikelihoodion (MLE) forthe allelefrequency (not hesameorderasthesameastheAF),foreachALTMQ:RMS Map QualityZeroSum:Z-score From Wilcoxon rsum test of Alt vs. Ref read mapQD:Variant Confidence/Quality by DepthRPA:Number of times tande
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 院外延伸服务总结与市场需求分析计划
- 2025年矿用防爆电器设备合作协议书
- 《平行四边形和梯形-平行与垂直》教学设计-2024-2025学年四年级上册数学人教版
- 假期外出安全教育
- 五年级下册数学教案-2.1 分数的意义 第2课时 青岛版
- 财务印章管理制度制度
- 2023四年级数学上册 数学好玩第3课时 数图形的学问教学实录 北师大版
- 应聘教务管理简历
- 一年级上册数学教案-一共有多少 北师大版
- 二年级下册数学教案-10算式中的推理(数字迷)-青岛版
- 高血压健康宣教-饮食课件
- 八年级-现在完成时复习(共26张)课件
- 电气基础知识培训要点课件
- 福建省泉州市各县区乡镇行政村村庄村名明细及行政区划代码
- 基坑工程施工验收记录表
- GB∕T 37045-2018 信息技术 生物特征识别 指纹处理芯片技术要求
- 德马格及科尼电动葫芦培训
- 质量部人员岗位技能矩阵图
- 沥青项目运营方案参考范文
- 商品混凝土项目园区审批申请报告(范文参考)
- 机电一体化技术专业实践教学评价体系
评论
0/150
提交评论