版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、,数据的统计处理和解释,正态样本离群值的判断和处理 1、 grubbs检验法 2、 dixon检验法,数据的统计处理和解释,数据的统计处理和解释(包括12个国标),正态样本离群值的判断和处理,已知标准差,未知标准差,nair检测法,离群值1,离群值1,grubbs,dixon,偏度-峰度法,dixon,主要内容出自gb/t 4883-2008 数据的统计处理和分析 正态样本离群值的判断和处理 一部分文件引用自gb/t 4882-2001 数据的统计处理和解释 正态性检验 范围:适用于来自正态分布的样本,数据的统计处理和解释,说明:这两个方法及引用术语均来自国家标准,一:术语和定义 离群值 ou
2、tlier 样本中的一个或几个观测值,他们离开其它观测值较远,暗示他们可能来自不同的总体 检出水平 detection level 为检出离群值而指定的统计检验的显著性水平,用表示。除非约定,值应为0.05 注1:用统计的方法检验测定值之间是否存在显著性差异,从而判定结果或分析方法的可靠性,这一过程称为显著 性检验。 注2:在显著性检验中,将具有显著性差异的测定值在随机误差分布中出现的概率(小概率)称为显著性水平(水准)用表示,即这些测定值位于一定置信度所对应的随机误差界限之外。 注3:在置信区间内包含真值的概率称为置信度(置信水平)用p表示。 注4:置信度和显著性水平的关系:p=1-,数据的
3、统计处理和解释,统计离群值 statistical outlier 在剔除水平下统计检验为显著的离群值 剔除水平 deletion level 为检出离群值是否高度离群而指定的统计检验的显著性水平,用*表示,除非约定,*值应为0.01 歧离值 straggler 在检出水平下显著,但在剔除水平下不显著的离群值,数据的统计处理和解释,二:符号和缩略语 n 样本量 样本平均值 检验离群值所使用的显著水平,简称检出水平 *检验统计离群值所使用的显著水平,简称剔除水平(* ) x(i)观测值从小到大排序后的第i个值 总体标准差 s 样本标准差 gn grubbs 上统计量 gn grubbs 下统计量
4、 dn dixon 上统计量 dndixon 下统计量,数据的统计处理和解释,三:离群值的判断 1.来源与判断 来源 a.第一类离群值是总体固有变异性的极端表现,他与样本中其余观测值属于同一总体。 b.第二类离群值是由于试验条件和试验方法的偶然偏离所产生的结果,或产生于观测、记录、计算中的失误,他与样本中其余观测值不属于同一总体。 判断 对于离群值的判定通常可根据技术或物理上的理由直接进行,当上述理由不明确时,可用本判定方法。,数据的统计处理和解释,2.离群值的三种情形 a.上侧情形:根据实际情况或以往经验,离群值都为高端值; b.下侧情形:根据实际情况或以往经验,离群值都为低端值; c.双侧
5、情形:根据实际情况或以往经验,离群值可为高端值,也可为低端值。 3.检出离群值个数的上限 应规定在样本中检出离群值个数的上限(与样品量相比较应较小)当检出离群值个数超出了这个上限时,对此样本应作慎重的研究和处理。,数据的统计处理和解释,数据的统计处理和解释,单个离群值情形的判断,a.依据实际情况和以往经验,选定适宜的离群值检验规则。,c.根据显著水平及样品量,确定检验的临界值,d.由观测值计算相应统计量的值,根据所得值与临界值的比较结果作出判断。,b.确定适当的显著水平,数据的统计处理和解释,判定多个离群值的检验规则 在允许检出离群值的个数大于1的情况下,重复使用单个离群值的检验规则,若没有检
6、出离群值,则整个检验停止;若检出离群值,当检出的个数超出规定样本中检出离群值的上限时,检验停止,对此样本应慎重处理;否则,采用相同的检出水平和规则,对除去已检出离群值后的余下观测值继续检验。,这个是重要的哦!,四:离群值的处理,数据的统计处理和解释,a.保留离群值并用于后续数据处理 b.在找到实际原因时修正离群值,否则予以保留 c.剔除离群值,不追加观测值 d.剔除离群值,并追加新的观测值或用适宜的插补值代替,处理规则,a.在技术或物理上找到产生离群值的原因,则应剔除或修正;未找到则不得剔除或进行修正。 b.找到产生离群值的原因,则应剔除或修正;否则保留歧离值,剔除或修正统计离群值;在重复使用
7、同一检验规则检出多个离群值时,每次检出后,都要再检验它是否为统计离群值。若是,则其前检出的离群值(含歧离值)都应剔除或修正。 c.检出的离群值(含歧离值)都被剔除或进行修正。,处理方式,数据的统计处理和解释,grubbs检验法 1、计算统计量gn和gn的值: gn=(xi- )/s gn=( -x1)/s,2、确定检出水平,在附表1中查出临界值g1- (n) 3、a:上侧判断 当gng1- (n)时,判定xi为离群值,否则判未发现xi是离群值。 b:下侧判断 当gng1-(n)时,判定x1为离群值,否则判未发现x1是离群值。 c:双侧判断 当gngn且gng1-/2(n)时,判定xi为离群值;
8、 当gngn且gng1-/2(n)时,判定x1为离群值; 否则判断未发现离群值。,数据的统计处理和解释,质量,数据的统计处理和解释,4、统计离群值的判断(单侧) a、当检出xi或x1为离群值时,确定剔除水平* b、查附表1,g1-*(n),当gng1-*(n)时,判断xi为统计离群值,否则,xi为歧离值,判断x1为统计离群值,否则x1为歧离值,数据的统计处理和解释,当gng1-*(n)时,否则,数据的统计处理和解释,5、统计离群值的判断(双侧) a、当检出xi或x1为离群值时,确定剔除水平* b、查附表1,g1-*/2(n),当gng1-/2*(n)时,判断x1为统计离群值,否则,x1为歧离值
9、,判断xi为统计离群值,否则xi为歧离值,数据的统计处理和解释,当gng1-/2*(n)时,否则,数据的统计处理和解释,使用grubbs法检验的实例.临时文件soybean meal - november 2007.xls,数据的统计处理和解释,dixon检验法:,dn=r10=,dn=r10=,dn=r11=,dn=r21=,dn=r22=,dn=r11=,dn=r21=,dn=r22=,数据的统计处理和解释,dixon检验法 确认检出水平,在附表2中查出临界值d1-(n)。 当dn d1-(n)时,判定xn为离群值 当dn d1-(n)时,判定x1为离群值 否则二者都判未发现离群值。 附表2相见gb/t4883-2008 单侧dixon检验的临界值表,这里将不再列举。,数据的统计处理和解释,dixon检验法:统计离群值的判断(单侧) a、当检出xn或x1为离群值时,确定剔除水平* b、查附表3,d1-*(n) dixon检验法:统计离群值的判断(双侧)略,当dnd1-*(n)时,判断x1为统计离群值,否则,x1为歧离值,判断xn为统计离群值,否则xn为歧离值,数据的统计处理和解释,当dnd1-*(n)时,否则,数据的统计处
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度年福建省高校教师资格证之高等教育学题库练习试卷B卷附答案
- 2024年度山西省高校教师资格证之高等教育法规综合练习试卷B卷附答案
- 2023年眼镜类产品及其零部件和眼镜盒资金需求报告
- 第41章 氨基甙类抗生素课件
- 社区消防安全集中除患攻坚大整治工作总结
- 运动会入场式方案
- 2024年拍卖交易协议模板集锦
- 2024年设计师服务结束协议模板
- 2024年度防洪排水项目施工协议
- 2024年劳动协议格式与条款汇编
- 《2023级学生手册》奖、惩资助、文明部分学习通超星期末考试答案章节答案2024年
- 第15课 两次鸦片战争 教学设计 高中历史统编版(2019)必修中外历史纲要上册+
- 期末知识点复习 2024-2025学年统编版语文九年级上册
- 《江苏省一年级上学期数学第二单元试卷》
- 上海市普通高中学业水平合格性考试地理基础知识点复习提纲
- 废旧风机叶片循环利用项目可行性研究报告-积极稳妥推进碳达峰碳中和
- 中医脑病科缺血性中风(脑梗死恢复期)中医诊疗方案临床疗效分析总结
- 中国人工智能系列白皮书一元宇宙技术(2024 版)
- 《甘肃省中医康复中心建设标准(2021版)》
- 高中英语外刊-小猫钓鱼50篇
- PowerPoint培训教程课件
评论
0/150
提交评论