标准解读

《GB/T 4883-1985 数据的统计处理和解释 正态样本异常值的判断和处理》这一标准,主要针对的是在数据统计分析过程中遇到的数据点偏离正常范围的情况。该标准提供了一系列方法来识别这些可能影响数据分析准确性的异常值,并给出了如何处理这类数值的具体指导。

首先,该标准定义了什么是异常值:在一个给定的数据集中,如果某个观测值明显不同于其他大多数观测值,则可被视为异常值。异常值的存在可能是由于测量错误、记录失误或确实存在极端情况等原因造成的。

接着,标准介绍了几种用于检测正态分布数据中异常值的方法,包括但不限于格拉布斯检验(Grubbs' test)、狄克逊检验(Dixon's Q test)等。每种方法都有其适用条件及局限性,选择合适的方法取决于数据集的具体特性以及研究者的需求。

对于已识别出的异常值,《GB/T 4883-1985》建议采取适当措施进行处理。这可能包括直接删除异常值、使用更稳健的统计方法来减少异常值对结果的影响,或者进一步调查异常值产生的原因以决定最佳行动方案。重要的是,在任何情况下都应保持透明度,即清楚地记录下所做的决策及其理由。

此外,该标准还强调了在整个过程中保持客观性和科学严谨性的必要性。即使面对看似“不合群”的数据点时,也应当谨慎行事,避免无根据地排除信息量丰富的观测结果。


如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。

....

查看全部

  • 被代替
  • 已被新标准代替,建议下载现行标准GB/T 4883-2008
  • 1985-01-29 颁布
  • 1985-10-01 实施
©正版授权
GB/T 4883-1985数据的统计处理和解释正态样本异常值的判断和处理_第1页
GB/T 4883-1985数据的统计处理和解释正态样本异常值的判断和处理_第2页
免费预览已结束,剩余18页可下载查看

下载本文档

GB/T 4883-1985数据的统计处理和解释正态样本异常值的判断和处理-免费下载试读页

文档简介

UDC519.28中华人民共和国国家标准GB4883-85数据的统计处理和解释正态样本异常值的判断和处理Statisticalinterpretationofdata-Detectionandnandlingofoutlyingobservationsinnormalsample1985-01-29发布1985-10-01实施国家标准局批准

中华人民共和国国家标准UDC519.28数据的统计处理和解释GB4883-85正态样本异常值的判断和处理Statisticalinterpretationofdata-Detectionandhandlingofoutlyingobservationsinnormalsample引1.1本本标准规定了判断和处理在正态样本中出现的异常值的一般原则和实施方法。1.2异常值(或异常观测值)是指样本中的个别值,其数值明显偏离它(或它们)所属样本的其余观测值。异常值可能是总体固有的随机变异性的极端表现。这种异常值和样本中其余观测值属于同一总体。异常值也可能是由于试验条件和试验方法的偶然偏离所产生的后果,或产生于观测、计算、记录中的失误。这种异常值和样本中其余观测值不属于同一总体。1.3本标准使用的其它统计学名词,见国家标准GB3358—82《统计学名词及符号》。1应用条件:所考查样本中诸观测值(或经过一定的函数变换后得到的值)除了个别异常值外其余大部分值(样本主体)来自同一正态总体或近似正态总体。关于样本来自正态总体或近似正态总体的判断,,可以根据物理上的、技术上的知识;也可通过与考查对象有同样性质的以往数据,进行正态性检验,,其原理和方法见国家标准GB4882一85《数据的统计处理和解释一正态性检验》。判断异常值的统计学原则2.1本标准在下述不同情形下判断样本中的异常值:上侧情形:根据以往经验,异常值都为高端值,下侧情形:,根据以往经验,异常值都为低端值;双侧情形:异常值是在两端都可能出现的极端值。注:上侧情形和下侧情形统称单侧情形。2.2执行本标准时,应规定在样本中检出异常值的个数的上限(占样本观测值个数的较小比例)当超过了这个上限,对此样本的代表性,应作镇重的研究和处理。2.3判断单个异常值的检验规则根据实际情况,选定适宜的异常值检验规则(见4、5、6章)指定为检出异常值的统计检验的显著性水平a,简称检出水平;根据a和观测值个数n确定统计址的临界值;将各观测值代人检验规则中给出的统计量,所得值若超过临界值,则判断事先确定待查的极端观测值为异常值;香则就判断“没有异常值”。检出水平a的宜取值是5%,1%(或10%)。2.4判断多个异常值的检验规则在允许检出异常值个数可大于1的情形,本标准规定的方法是重复使用同一种判断单个异常值的检验规则,即用指定的检出水平和符合2.3规定的规则首先检验全体观测值,若不能检出异常值,则整个检验停止:若检出了一个异常值,就再用相同的检出水平和相同的规则,对除去已检出的异常值后余下

温馨提示

  • 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  • 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
  • 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。

评论

0/150

提交评论