EP中文用患者样本进行方法比较和偏差估计_第1页
EP中文用患者样本进行方法比较和偏差估计_第2页
EP中文用患者样本进行方法比较和偏差估计_第3页
EP中文用患者样本进行方法比较和偏差估计_第4页
EP中文用患者样本进行方法比较和偏差估计_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、用患者样本进行方法比较和偏差估计1序言1.1目的本文件给临床实验室设备的用户和制造商提供了在测试同一分析物时, 设计实验来评价两种方法间的偏差的指导原则。理想情况下,测试(或候选)方法应当与参考方法比较。但是对用户来说,比较方法通常是目前的日常方法,并且评价的目的是确定这两种方法在实验统计的功效内是否产生相等的结果。在这种情况下,主要关注的是确定测试方法是否是当前方法合适的替代品。本指导原则允许两种方法间的偏差评估(期望差异)在不同的浓度进行评价。如果比较方法与制造商在声明陈述中所用的相同,可以将统计的实验结果与制造商的声明比较来确认可接受性能。1.2一般比较实验的概述评价一种分析方法需要下面

2、的内容:l 操作者有足够的时间熟悉设备操作和维护步骤。l 操作者有足够的时间熟悉评价方案。l 确保在整个实验期内测试和比较方法在合适的质量控制中。l 有足够的数据来确保测试和比较方法有代表性的数据。(多少数据构成足够的数据取决于两种方法的精密度和干扰影响,和两种方法间偏差的量,和可用的样本分析物值的范围,以及测试的医学要求。)。在设备熟悉期,测试和比较方法的操作者必须全面的熟悉两种方法的设定,操作,维护,故障排除和质量控制。本期可以先于评价实验的其他部分或与制造商的培训期一致。对两种方法运行日常实验室质量控制程序。在熟悉期之后,可以开始方法比较实验。工作组推荐至少40个患者样本在至少5个工作日

3、进行分析。在更长时间分析更多的样本,同时按照制造商的建议进行定标,可增加实验的可靠性和有效性。对每一个患者样本用测试和对比方法进行双份测试。对每种方法的双份测定,在相应方法的同一批内分析。只要可能,至少50的测试样本应当在实验室参考区间之外。1.3本文所用的符号(略)1.4定义(略)2设备熟悉期测试和比较方法的操作者必须熟悉下面的内容:l 操作l 维护步骤l 样本准备方法l 定标和监控功能。如果制造商提供培训,可作为熟悉期的一部分。在实验室建立和运行设备足够长的时间,以确保操作者理解所有的步骤,并能恰当的操作设备。工作组推荐5天作为设备熟悉期。对于极其简单的设备,稍短的时间就够了;对复杂的,多

4、通道的设备,需要更长的时间。操作者应当实践分析实际的样本材料,使他们注意到其他设备在日常操作中可能发生的意外(例如错误标志,错误修正,定标等)。在本期不应收集数据。直到操作者可以自信的操作设备,设备熟悉期才能结束。(这一步骤可能对所有的用户不是必须的。)在开始方法比较评估前,确保日常质量控制程序和适当的控制限在使用中。3方法比较实验·3.1测试样本按照公认的实验室惯例和制造商的建议收集和处理患者样本 。3.1.1储存储存的条件和持续时间取决于被分析成分的稳定性。如果可能,避免储存样本。3.1.2被排斥的样本如果一个样本被排斥,记录排斥的原因。3.2对比方法对于比较方法,用实验室目前的

5、方法,制造商标注声明所用的方法,或公认的参考方法。这个实验给出了在任意特定浓度两种方法间的偏差和偏差的可能区间的评估。因此两种方法间的差异可归因于测试方法的误差。比较方法应满足下列条件:l 具有优于测试方法的精密度,如果需要,可通过重复获得。l 如果可能,不受已知的干扰的影响。l 用与测试方法相同的单位。l 如果可能,具有相对于(可追踪的)国家标准或参考方法的偏差。本实验没有分离来自被比较的每种方法的偏差的不同来源。(关于基质效应觉察的信息,见最新版的NCCLS文件EP14基质效应评价。)干扰影响可能对方法间差异有尽可能多的不精密度影响。(干扰对每一种方法影响的合适的定性,可通过一个单独的实验

6、确定;见最新版的NCCLS文件EP7临床化学的干扰测试。)3.3测试范围评价测试方法应越过临床上有意义的范围,如医学决定水平。通常,范围扩展到从低于到充分高于期望的参考范围。分析物浓度应当分布在超越可报告范围到尽可能扩展的范围。可报告范围是制造商声明的可以提供可接受性能的分析物浓度区间。表1a和1b给出了推荐的分布,它考虑了一组分析物异常的可用性。3.3.1可报告范围研究的范围受两种方法可报告范围的限制。对比方法的范围应当至少与测试方法的范围一样宽,以便比较在可报告范围限的偏差。3.4样本数最少分析40个符合上述标准的样本。更多的样本将提高统计评价的可信度和增加合并未预期的干扰物质的影响的机会

7、(个体特异性偏差)。数据记录表的例子见图A1和A2。3.4.1重复测定为下列原因,每个样本应获得足够的量:1)可用测试方法进行双份测定;2)可用比较方法进行双份测定;3)如果需要,可进行后续研究。3.4.2混合的样本如果一个样本需要的体积无法从一个单独的样本获得,混合来自两个(但不要更多)具有相似病史和大约相同成份水平的患者样本以获得少量的混合液。用这些少量的混合液进行两组重复性分析。如果样本为全血,混合需要血清学的兼容性。注意:合并的作用可通过平均单独或特定的样本偏差而被掩盖,这样可以导致两种方法可比性的乐观的图形。3.5样本次序 分配选择的样本的第一部分在批内有序排列。以相反的顺序进行第二

8、部分(平行双份)。颠倒第二部分的顺序可最小化批内双份测定的均值受携带和漂移的影响。尽可能随机排列序列中的样本。例如,样本可按下列顺序进行测试:1,2,3,4,5,6,7,8和8,7,6,5,4,3,2,1。比较和测试方法都遵照颠倒的步骤,但每种方法最初的序列可以不同。3.6持续时间对于一个给定的样本,不管这个样本是新鲜的还是储存的,应在2个小时内用对比和测试方法进行分析。如果使用储存的样本,应确保它们均储存在保证它们稳定性的情况下,并符合测试和对比方法的要求。对两种程序在相同的情形下保存样本,可避免引入储存条件的差异。如果方法对比实验在精密度实验(EP5)之后进行,每天可以选择并分析8个以上的

9、样本。如果方法对比实验和精密度实验同时进行,在草案熟悉期后10到15天每天仅能分析4个样本。将患者样本分散在很多天和很多批会更好。3.7在收集中对数据进行检查3.7.1分析系统误差当设备提示有错误情况发生时,记录在这段时间内收集的数据,但在最后的数据分析时不要包括这些数据。3.7.2人为误差记录操作者可证明的出错的任何数据,但在最后分析时不要包括这些数据。3.7.3其他有差异数据的评价记录没有发现错误没有经过编辑的成对的双份数据点。如果找不到差异的原因,保留原始数据在数据组中,进行4.1和4.4节的离群点检查。3.8质量控制在实验中遵照实验室日常质量控制程序。保留控制图表,重复两种方法中任意一

10、种显示失控的任意批,直到获得需要的样本数目。3.9被拒数据的证实认真证实和保留任何需要拒绝数据的情况,同时记录任何发现的可接受的原因和问题。4初步数据检查图1给出了本节所述检查步骤的概述。图2 给出了过程中单独步骤的逻辑流程图。在阅读以下章节时参考这些图表。4.1方法内重复测试的离群点的检查应当对所有的点和已经移走的离群点进行分析。对测试方法(Y)和比较方法(X)的双份测定提供下面的步骤。分析应当按两种方式进行:1)对所有的点2)对所有已经被移走的离群点。按如下计算每个样本双份测定间差值的绝对值。这里i=样本数(从1到N,N为总的样本数)。计算每种方法双份测试间差值的绝对值的平均值:计算每种方

11、法绝对差均值的4倍为可接受限(对可报告值进行舍入操作)。如果某个绝对差超出了合适的(X或Y)限制值,用标准化(相对的)绝对差对每种方法进行附加计算;这样:相对差值的均值的4倍的限制,为标准化值提供了测试限。如果一个单独的数据点落在范围和相对范围程序之外,研究为什么会这样,并将该样本从数据组中删除。删除来自该样本的所有数据(X和Y),继续分析数据。如果一个以上的样本被删除,对差异产生的原因进行详细的调查。如果问题的来源被确定,单独追溯到这些样本,取代数据组中的那些样本。问题的原因必须被证实。如果问题可被更正但不能追溯到特定的样本,必须重新收集全部的数据。如果问题既没有发现也无法被更正,评价重复性

12、测定间最大差异相对于方法精密度允许的医学决定限的大小。如果没有超出此限,按随后的步骤重测这些数据。如果超出此限,停止实验并通知制造商。(被据数据的证明见3.9节。)4.2将数据作图用这些数据做4个图。第一个是(双份测定的均值)对(双份测定的均值)的散点图,将测试方法作为Y变量,比较方法作为X变量(见图B1)。画出两个轴的原点和刻度,并画一条通过原点的斜率为1.0的直线。第二个是用相同的方法画出每个对的散点图(见图B2)。第三个是偏差图,X变量取决于比较方法是否为参考方法。如果是,则第三个图是Y均值与X均值差()或每个化验对值的偏差图(见图B3)。这个图的水平中心线为0值。同前,第四个图是每个单

13、独的Y与均值的差对相同的值作图(见图B4)。如果比较方法不是参考方法,或不能确定,则第三个图是Y均值与X均值差()或每个化验对()/2值的偏差图(见图B3)。这个图的水平中心线为0值。同前,第四个图是每个单独的Y与均值的差对相同的()/2值作图(见图B4)。这4个图都很有用,因为它们间刻度的差异可用于平衡对测试和对比方法比较的关于非线性关系,离群点和非恒定变量影响的决定。4.3线性关系的目视检查检查这些图在整个测试范围内X(对比方法)和Y(测试方法)的线性关系。通常非线性出现在浓度值的端点。如果是这样的话,在开始变成非线性时截断数据点。检查剩余的线性部分,确定是否足够宽,以覆盖医学有用的范围。

14、如果是这样,分析在该范围的附加样本,取代这些超出的样本。然后按第4节开始再次检查新的数据。如果非线性部分明显,或如果线性部分太小,停止实验并通知制造商。如果非线性的原因可以确定并更正,重新开始实验。4.4方法间离群点的目视检查检查数据图A和数据图C有无可察觉的明显的离群点。如果没有这样的点,前进到4.5节。如果离群点存在,进行下面的与4.1节中双份测定相似的计算。计算方法间差的绝对值及它们的平均值;这里i样本数1到40,j双份测定数1或2。计算测试限(TLE)为4*,对可报告值进行舍入操作。比较每个与测试限,并标记超出该限的任意点。计算方法间相对差值的绝对值和它们的平均值;计算相对测试限为4*

15、,并比较每一个与此限(不对此限舍入)。标记任何超出此限的点。没有通过两个检测的任意点都为离群点。最多可有2.5的数据可从数据组中去除。如果超过2.5的数据在检查中被确定为离群点,调查可能的干扰,人为错误和设备故障。如果几种分析物在同一设备上同时进行评价,检查异常样本其他分析物的结果。同时回顾该批的质量控制结果。如果无法找到明显的原因,或差异超出了医学重要性的边界,停止实验或另加40个样本。如果发现一个以上的离群点,但离群点没有超出医学重要差异,保留并使用这些数据。如果详细的调查给出了离群点的原因,分析附加的样本,并用这些数据增加数据组。4.5X足够范围的检查回归分析的结果仅在数据的某一假设为真

16、时才有效。其中一个假设是,X变量已知且没有误差。在临床实验室,这并不是真实的,因为每个测试都有固有误差。但是,如果数据范围足够宽,这个误差对回归评价的影响很小,可认为被忽略。为了克服这个问题,修正系数r可被用于评价X范围足够的粗略指导。r的公式如下:这里,作为一般的指导,如果r0.975(或等价的r20.95),X的范围可被认为足够了。如果数据产生的r满足这个需要,X的误差足以被数据范围补偿,可用简单的线性回归评价斜率和截距。如果r2<0.95,则数据的范围必须通过化验附加样本来扩展。然后,重新开始检查全部数据。如果范围无法扩展,用6.2节所述的分区偏差程序取代线性回归来评价平均偏差。注

17、意:这个程序评估了数据的范围;没有测试范围内数据的分布。还必须在整个范围内获得平均的分布。5线性回归5.1计算对于这批成对的观察结果(xij,yij),斜率b和y截距a按下面的公式计算。计算每对X结果的平均值。对于个体的Ys对X平均值,对Y均值对X均值,这里,这样,计算的线用下面的方程描述:对于任意给定的浓度值(X),可用方程产生一个测试方法的预期值()。保留这个回归结果以备随后的使用。仅评价斜率和截距也可用其他的回归方法,如Deming(当1的特定情形为直角)或Passing-Bablok.。在满足这样的模型后,遵照下面的所有其他步骤。应当用直角回归或Deming程序计算评估的标准误差,该值

18、可能任意低,除非基于垂直面而不是直交距离来计算标准误差。5.2恒定分散的目视检查检查散点和偏差图(图B1到B4)是否具有恒定的散度。尽管很少有方法在测试的整个可报告范围内具有恒定的不精密度(对恒定的散度有贡献),目视检查可确定在范围的上下限标准差间是否有显著的重大的差异(大约3:1或更大)。如果数据显示适度的恒定分散,用6.1节描述的线性回归程序计算平均偏差。在这种情况下,仍可用普通的最小二乘法回归评价斜率和截距。即使分散不是恒定的,斜率和截距的评级也没有偏差(在统计意义上)。但在这种情况下,评价的标准差对测试回归线附近的可变性是不可用的。用6.3节描述的分区残差程序评估可变性和陈述平均偏差。

19、当仅有40个样本(80对分析点)可用时,确定足够的恒定散度很困难。因此,工作组推荐如果疑为不恒定分散,应收集更多的样本。另外,存在标准统计程序用于修正存在非恒定分散的回归。这些技巧包括使用转换的数据(例如对数和加权平均)。6计算预期的偏差和它的可信区间6.1线性回归程序(当数据通过足够范围和统一散度检查时)给定数据点与回归线在Y方向的差值,叫做该点的残差。评价的标准差是这些残差的标准差,因而是回归线附近点的分散度的测定。一个点()的残差可用下列公式计算。平均值():通过对单个的进行下列计算得到评估的标准差:平均值在给定的医学决定水平Xc的预期偏差BC的评估给出如下:BC(在Xc的真实偏差)的9

20、5的可信区间给出如下:用第7节的程序对这些统计进行说明。6.2当数据没能通过足够范围检查时用分区个体差异计算平均偏差(分区偏差程序)把这些数据按X值递增的顺序列成表格,然后把这些数据分成3组(低,中,高),每组包括大约相同数量的数据点。基于每对数据的X值进行分组。可通过计数偏差图2N/3处的点确定3组的边界。(这样分配落在边界上的点,保证每组具有大约相当数量的点。)将数据标注在每个数据所属的记录表内。然后,用下面的公式对每组分别计算平均偏差:NK=第K组中数据点的数目。这个计算序列计算了组中每一点的偏差(差)和这些偏差的标准差。的值是对适当浓度范围评估的预期(平均)偏差,3个取代了6.1节中的

21、。如果3个接近相同,则报告3个的平均值作为。临床应用的医学决定水平,根本不依赖于数据划分的范围。如果显示重要的医学决定水平接近两个分区的边界,移动分区,以避免偏差估计的不连续。在医学决定水平浓度XC的预期偏差的95%可信区间可通过为XC选择合适的K获得,进行下面的计算:6.3当数据具有非恒定(变化的)精密度时用分区残差计算预期偏差(分区残差程序)如6.2节所述,把数据分成三组,每组数据点大致相同。然后,分别对每组进行下列计算,这里NK=第K组中数据点的数目(K1,2,3)。在给定医学决定水平XC的预期偏差评估为:并且BC的95%可信区间可通过为XC选择合适的K获得,进行下面的计算:7说明结果并

22、与内部性能标准比较在大多数情况下,对目前方法和候选代替方法间的差异有兴趣。在这种情况下,在医学决定点XC将预期偏差的可信区间与可接受误差定义比较。每个实验室应当开发自己的标准(咨询医学人员和或技术文献)。如果预期偏差的可信区间包含了定义的可接受偏差,则这些数据没有显示候选方法的偏差与可接受偏差不同。但是,期望偏差的可信区间没有包含定义的可接受偏差,则可得出下面两个决定中的一个:l 如果可接受偏差小于预期偏差可信区间的下限,可得出下面的结论:预期偏差很可能(>97.5)大于可接受偏差,因此候选方法的性能和目前的方法不相等,并且不能被定义的应用接受。l 如果可接受偏差大于预期偏差可信区间的上

23、限,可得出下面的结论:预期偏差很可能(>97.5)小于可接受偏差,因此候选方法的性能等同于目前的方法,并可被定义的应用接受。如果没有观察到等价,仍然相信候选方法更特效,而不是拒绝这种方法,在使其进行日常使用前,对其获得新的临床数据(如新的参考范围)。记住为实验室开发的标准应当定义两种方法间允许的差异。在比较两种方法的允许误差时,医学上精密度允许误差的标准可能没有单独给出。误差限的指导原则可以在被研究的测试的个体内生物差异的文献中找到。如果制造商提供了测试方法的方法比较数据,可以进行性能的附加评估。但是,为了与制造商的数据进行有效的比较,对比方法和操作步骤必须与制造商的一样。如果制造商对平均偏差的声明被包含在95的可信区间,可以得到结论,候选方法可以提供相等的结果。8制造商修正8.1实验设计制造商应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论