药监系统官方培训 高通量基因测序仪行业标准 中检院 黄杰 20200929_第1页
药监系统官方培训 高通量基因测序仪行业标准 中检院 黄杰 20200929_第2页
药监系统官方培训 高通量基因测序仪行业标准 中检院 黄杰 20200929_第3页
药监系统官方培训 高通量基因测序仪行业标准 中检院 黄杰 20200929_第4页
药监系统官方培训 高通量基因测序仪行业标准 中检院 黄杰 20200929_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高通量基因测序仪行业标准黄杰非传染病诊断试剂室中国食品药品检定研究院报告内容高通量测序技术发展基因测序仪行标制定标准化挑战测序技术发展第

3代测序第

2代测序•

单分子连续测序法•

中高通量•

准确率在提升•

长读长•

速度快•

单次运行成本低•

小型化,仪器投入低•

大规模并行测序法•

高通量•

准确率高•

短读长•

速度慢•

单次运行成本高表面分子生成测序循环

荧光成像第

1代测序•

桑格测序法•

高准确率•

1kbp读长•

极低通量3大规模并行测序法(高通量测序、二代测序)技术路线乳液PCR(454(Roche),SOLiD(Thermo

Fisher),GeneReader(Qiagen),Ion

Torrent(Thermo

Fisher))在乳液PCR,片段DNA模板与dNTP、引物和DNA聚合酶包在一个油滴中。在凝胶中进行PCR扩增,最后得到成千上万份相同的DNA序列。固相桥式扩增固相模版移位(SOLiD

Wildfire(Thermo

Fisher))(Illumina)片段DNA分散到Flowcell上,与固定的引物结合,进行桥式扩增,从而形成很多DNA簇。片段DNA与固定的引物结合,PCR扩增延长引物得到第二条链。然后部分变性,使得自由端可以与邻近的引物结合,再次扩增,起到放大的效果。DNA

nanoball(Complete

Genomics)片段DNA加两次接头,然后进行滚环扩增,形成一个DNA纳米球,最后纳米球通过杂交的原理固定在阵列的flowcell。滚环扩增——扩增错误零累积GoodWin

S,

et

al.Nat

Rev

Genet.

2016

May二代测序仪发展方向适用于临床机构整合性高灵活度低,仪器费用高适用于国家基因组中心大规模测序服务公司运行费用低,通量高仪器费用高,场地要求高适用于科研机构、临床机构灵活性高,仪器费用低三代高通量测序仪特点:单分子连续测序法优势:长读长,速度快,试剂使用量少不足:单次读取准确率偏低,读数偏少太平洋科技:零维光导的单分子荧光法纳米孔测序:链测序/标签测序技术6报告内容高通量测序技术发展基因测序仪行标制定标准化挑战起草单位•

中国食品药品检定研究院•

深圳华大智造科技有限公司•

广州市达瑞生物技术股份有限公司•

北京市医疗器械检验所•

东莞博奥木华基因科技有限公司•

天津诺禾致源生物信息科技有限公司•

杭州贝瑞和康基因诊断技术有限公司•

安诺优达基因科技(北京)有限公司•

illumina

Inc.(代理人:宜曼达贸易(上海)有限公司)二代测序技术特点•

明显区别于Sanger测序为主要技术原理的基因测序仪测序通量•

不必预先明确目的片段的引物区序列•

基于片段化的DNA•

依赖于独立反应体系进行克隆扩增•

能一次进行对几十万到几百万条核酸序列(DNA)分子并行序列测定和读长一般较短等技术特征为标志。测序错误的来源Specific

baseIndelspecific

lengthABtypeATCG11112222222222222899834313433211100000211262414210121811911454118ACAATTTGCTTAGCGTCCAGATTCGGCAGAother下机数据的背景错误在0.1%左右817721703220047317otherTotal设定位置参数阈值,对聚集性阈值有效过滤,避免比对错误带来的假阳性信号通过评估痕量交叉污染,对污染带来的假阳性信号有效过滤临床高通量基因测序仪技术指标要求性能验证安全性验证•

碱基识别质量百分比•

安全要求•

测序准确率(包含SNP/INDEL,测

电磁兼容性要求序一致序列准确率)•

环境试验要求

测序通量≥20Gb/run

测序通量≥2Gb/run

,且<20Gb/run

测序通量≥100Mb/run,且<2Gb/run•

重复性高通量基因测序仪性能要求•

碱基识别质量百分比•

测序准确率(包含SNP/INDEL,测序一致序列准确率)

测序通量≥20Gb/run

测序通量≥2Gb/run,且<20Gb/run

测序通量≥100Mb/run,且<2Gb/run•

重复性在制造商规定的测序覆盖率和测序平均深度下规定的测序读长模式下,测序通量和测序有效通量高通量基因测序仪性能要求外观要求•

仪器外观应符合如下要求:•

——设备表面不应有明显的凹凸、划痕、脱漆、流痕,金属部位不应有锈蚀及机械损伤;•

——开关、按键应灵活、可靠,紧固件应紧固、无松动;•

——标志、符号应清晰、端正。测序读长和通量•

在规定的测序读长模式下,测序通量和测序有效通量应符合制造商规定的要求。•

注:测序读长模式应根据使用试剂的性能要求进行规定,如:双端150bp、单端200bp等。碱基识别质量百分比•

单次测序,统计碱基识别质量在规定阈值以上的比例,碱基识别质量百分比平均值应不低于制造商规定的要求。•

注:不同原理的测序仪在碱基识别质量表述有差异,如Q20、Q30等。–

性能指标高通量基因测序仪性能要求•

4.4.1

测序通量≥20Gb/run高通量基因测序仪•

测序覆盖率和测序平均深度•

制造商应规定检测国家参考品或标准品的测序覆盖率和测序平均深度。•

测序准确率•

在制造商规定的测序覆盖率和测序平均深度下,应符合以下要求:–

检测人基因组(DNA)参考品或标准品,比对率应符合制造商的要求,与单碱基变异(SNP)、插入缺失变异(Indel)参考数据集比较,SNP、Indel的准确率和灵敏度应符合制造商的要求。–

检测人基因组DNA参考品或标准品,比对率应符合制造商的要求,与人基因组DNA参考序列中指定1Gb参考序列比对,测序一致序列准确率应不低于99.0%;–

检测细菌和病毒DNA参考品,与对应参考序列比对,测序一致序列准确率应不低于99.0%。注1:对限定只用于人基因组DNA检测的基因测序仪可只进行人基因组DNA参考品或标准品检测。注2:对进行单链序列分析的基因测序仪应增加单倍型基因组DNA参考品进行检测。•

重复性•

进行三次重复测序,应均能符合-的要求。高通量基因测序仪性能要求–

4.5软件功能•

高通量基因测序仪软件功能应至少包含仪器运行控制功能和信号实时采集功能两部分:•

仪器运行控制软件应能引导完成仪器运行和控制,并符合制造商的要求。•

信号实时采集软件应能完成测序信号提取和处理,并符合制造商的要求。–

4.6安全要求•

应符合GB

4793.9、YY0648和GB

4793.1中适用条款的规定。–

4.7电磁兼容性要求•

应符合GB/T18268.1和GB/T18268.26中适用条款的要求。–

4.8环境试验要求应符合GB/T14710中适用条款的要求。变异标准数据集构建low-confregiongVCFlow-confregionRawfqAlign

+variant

callFqfilterFqfilterpotentialbaselineVCFVQSRhigh-confregionlow-confregioncombinedpotentialbaselinegVCFVCFRawfqAlign

+variant

callpotentialbaselineVQSRbaseline1.

使用SOAPnuke软件对所有原始数据进行低质量过滤得到有效数据,使用BWA+GATK

HaplotypeCaller对各数据集分别进行变异检测,得到两类文件:(a)gVCF,用于生成候选变异区间;(b)VCF,用GATK

VQSR进行处理,初步过滤得到候选变异集。2.

对于未通过筛选的变异,在其两侧加减50bp,生成低置信变异区间。合并候选变异区间,与低置信变异区间取补集,再与参考基因组非N区间取交集,生成最终的高置信变异区间及变异集结果。3.

合并各平台的候选变异集,使用vcfannotate将各候选变异区间注释到合并的变异集上。测序仪主要质控参数——DUP、比对率和覆盖度

Unique

map

rate:比对到基因组上唯一位置的Platform测序平台base比率,一条reads在相同数量的容错时会有两个或者两个以上的位点都吻合,那么,它的比对结果不唯一。对于某些下游分析,需要去除比对多个位点的reads,只保留唯一比对的reads。Clean

bases(Mb)Mapping

rate(%)Unique

rate(%)

Duplication:重复的

reads

所占比例,为了保证后续变异分析的准确性,会去掉duplication的reads后进行下游信息分析,重复率越低,后续可用的数据量越多。Duplicate

rate(%)Mismatch

rate(%)

Average

sequencing

depth:测序深度(不计算duplication),比对到参考基因组的碱基数目除以基因组的大小。Averagesequencing

depth(X)Coverage(%)

Coverage

at

least

1X(4X、10X、20X):覆盖率,指测序深度达到1X、4X、10X、20X以上的全基因组占比。覆盖度越高,表明基因组上没有覆盖的区域越少。Coverageatleast

4X(%)Coverageatleast

10X

(%)Coverageatleast

20X

(%)不同测序深度覆盖率ABCDEFG覆盖深度均一性100%90%80%70%60%50%40%30%20%10%0%100%90%80%70%60%50%40%30%20%10%0%1

25

49

73

97

1211451691932172412652893133373613854094334571

40

79

118157196235274313352391430469508547586625664703742未去dup捕获效率捕获区间

未去dupGC0.5mean覆盖未去dup捕获效率捕获区间

未去dup

GC0.5mean覆盖0.5mean

覆盖:指能达到0.5倍样本平均深度的碱基比例,反映覆盖均一性改善前:0.5mean

覆盖度达到90%的样本比例为72.5%改善后:

0.5mean

覆盖度达到90%的样本比例提高至98%SV变异检测DELINVDUPINS1.0000.9000.8000.7000.6000.5000.4000.3000.2000.1000.0001.0000.9000.8000.7000.6000.5000.4000.3000.2000.1000.0001.0000.9000.8000.7000.6000.5000.4000.3000.2000.1000.0001.00000.90000.80000.70000.60000.50000.40000.30000.20000.10000.0000dellymantadellymantadellymantadellymanta测序深度•

靶区域的序列复杂度(该区域与基因组多个区域同源,存在重复序列原件或假基因、GC含量高)•

靶向富集的文库构建•

检测的变异类型•

检测限•

容许的假阴性假阳性测序深度确认示例报告内容高通量测序技术发展基因测序仪行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论