版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、正态性检验方法的比较理论部分正态分布是许多检验的基础,比如 F检验,t检验,卡方检验等在总体不是正太分 布是没有任何意义。因此,对一个样本是否来白正态总体的检验是至关重要的。当然, 我们无法证明某个数据的确来白正态总体,但如果使用效率高的检验还无法否认总体 是正太的检验,我们就没有理由否认那些和正太分布有关的检验有意义,下面我就对 正态性检验方法进行简单的归纳和比较。一、图小法1. P-P 图以样本的累计频率作为横坐标,以按照正态分布计算的相应累计概率作为纵坐标, 以样本值表现为直角坐标系的散点。如果数据服从正态分布,则样本点应围绕第一象 限的对角线分布。2. Q-Q 图以样本的分位数作为横坐
2、标,以按照正态分布计算的相应分位点作为纵坐标,把 样本表现为直角坐标系的散点。如果数据服从正太分布,则样本点应围绕第一象限的 对角线分布。以上两种方法以Q-Q图为佳,效率较高。3. 直方图(频率直方图)判断方法:是否以钟型分布,同时可以选择输出正态性曲线。4. 箱线图判断方法:观察矩形位置和中位数,若矩形位于中间位置且中位数位于矩形的中间 位置,则分布较为对称,否则是偏态分布。5.茎叶图判断方法:观察图形的分布状态,是否是对称分布二、 偏度、峰度检验法(冒牌K-S检验法):1. S, K的极限分布样本偏度系数S =关彳;该系数用于检验对称性,S>0时,分布呈正偏态,S<0时, B2
3、 2分布呈负偏态。样本峰度系数K=-Bl3;该系数用于检验峰态,K>0时为尖峰分布,S<0时为 B2扁平分布;当S=0, K=0时分布呈正态分布。H。 : F(x)服从正态分布Hi: F(x)不服从正态分布当原假设为真时,检验统计量SK,6/"" W4"'对于给定的a , R = | 丁S |a|丁 K |a ” 其中人=u a2. Jarque-Bera检验(偏度和峰度的联合分布检验法)检验统计量为JB =空®+【K2很2(2 ), JB过大或过小时,拒绝原假设。64三、非参数检验方法I. Kolmogorov-Smirnov正态性
4、检验(基于经验分布函数(ECDF)的检验)D =max|R x - F° x |Fn (x)表示一组随机样本的累计概率函数,F°(x)表示分布的分布函数。当原假设为真时,D的值应较小,若过大,则怀疑原假设,从而,拒绝域为R=Dd。对于给定的a , p = PDd=a ,又p = PDn全田2. Lilliefor正态性检验该检验是对Kolmogorov-Smirnov检验的修正,参数未知时,由? = X,b=S2可计算得检验统计量Dn的值。3. Shapiro-Wilk(W 检验)检验统计量:n - -2J2nn2' ai 3 寸 Xj -Xi di 4L ai-a
5、Xi - XW = 一一当原假设为真时,W的值应接近于1,若值过小,则怀疑原假设,从而拒绝域为R = Wc。在给定的ot水平下P Wc = a。4. 72拟合优度检验(也是基于经验分布函数(ECDF)的检验)检验统计量为2=U)2GWki)i4 Pi ninpi2 =i ;(上-P02=£(fi/)H(k-r-1)i4 ?i njn?ir是被估参数的个数若原假设为真时,Z2应较小,否则就怀疑原假设,从而拒绝域为R = Z2芝d,对于给定的 a , p72 芝d=ot 又 p = P72。四、方法的比较1. 图示法相对于其他方法而言,比较直观,方法简单,从图中可以直接判断,无 需计算,
6、但这种方法效率不是很高,它所提供的信息只是正态性检验的重要补充。2. 经常使用的X2拟合优度检验和Kolmogorov-Smirnov检验的检验功效较低,在许 多计算机软件的Kolmogorov-Smirnov检验无论是大小样本都用大样本近似的公式,彳艮 不精准,一般使用Shapiro-Wilk检验和Lilliefor检验。3. Kolmogorov-Smirnov检验只能检验是否一个样本来白于一个已知样本,而 Lilliefor检验可以检验是否来白未知总体。4. Shapiro-Wilk检验和Lilliefor检验都是进行大小排序后得到的,所以易受异常值 的影响。5. Shapiro-Wil
7、k检验只适用于小样本场合(3550),其他方法的检验功效一般随样本容量的增大而增大6. 7-2拟合优度检验和 Kolmogorov-Smirnov检验都采用实际频数和期望频数进行检验,前者既可用于连续总体,又可用于离散总体,而 Kolmogorov-Smirnov检验只适 用于连续和定量数据。7. 72拟合优度检验的检验结果依赖于分组,而其他方法的检验结果与区间划分无关。8. 偏度和峰度检验易受异常值的影响,检验功效就会降低。9. 假设检验的目的是拒绝原假设,当p值不是很大时,应根据数据背景再作讨论。SPS S软件操作1. P-P 图操作步骤:(1)工具栏'Analyze' -
8、> 'Descriptive Statistics' -> 'P-P plots'2. Q-Q 图操作步骤:(1)工具栏'Analyze' -> 'Descriptive Statistics' -> 'Q-Q plots'。3.频率直方图操作步骤:(1)工具栏'Analyze' -> 'Descriptive Statistics' -> 'Frequencies'(2)点击'Frequencies®口中的
9、9;Statistic选项;'(3)点击'Frequencies®口中的'Charts项。4. K-S检验操作步骤:(1)工具栏'Analyze' -> 'Descriptive Statistics' -> 'Explore''Dependent Li噬要被探索的变量。点击Explon®口中的Plot选项;选项'Normality plots with testS字触发'K-S 检验和 Q-Q 图(3)点击Explon®口中的Option选项;Exclud
10、e cases listwise if a ca'se has a missing value for any variable, then they areexcluded from the whole analysis.'Excludeasespairwise data will be excluded only for analyses for which she has missing data.K-S测试结果:红框中的是p-valueTests of NormalityKoimogoro¥*SmirnovJShapiro-WilkStatisticdfSig.StatisticdfSigBorderline Personality Di&order Before Entering the House (%)Borderline Personality Disorder After Leaving the House (%)142.1821510.200*.161.9818681616969052a. Lilliefors Significance Co
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年山东“才聚日照直通名校”北京站校园招聘人员管理单位笔试遴选500模拟题附带答案详解
- 2025年宜宾市农业局下属事业单位考调历年管理单位笔试遴选500模拟题附带答案详解
- 2025年安阳市安阳县畜牧系统招考管理单位笔试遴选500模拟题附带答案详解
- 2025-2030年中国传动部件制造市场现状分析与竞争战略研究报告
- 2024-2030年铸造纤维过滤网搬迁改造项目可行性研究报告
- 2024-2030年国家甲级资质:中国无刷直流电机融资商业计划书
- 山东专用2025版高考数学一轮复习第六章不等式第一讲不等关系与不等式学案含解析
- 2024年浙科版选修5历史下册阶段测试试卷含答案408
- 杭州专版2024中考物理复习方案课时训练03声现象
- 部编版九年级上册道德与法治第五课守望精神家园练习题
- 美食文创计划书
- 江西省赣州市赣县区2022-2023学年四年级上学期期末检测英语试卷
- GB/T 43439-2023信息技术服务数字化转型成熟度模型与评估
- 废水处理系统点检表
- 干湿球温度湿度换算表
- 儿童英文自我介绍演讲PPT模板(完整版)
- 请款单(可直接打印-标准模板)
- 最专业的无人机中文英语对应词汇
- 高中学生学籍表模板(范本)
- 消防验收常见问题汇总
- 1027试验设计课件
评论
0/150
提交评论