版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据的正态性检验汇总2012-11-21 00:01:04| 分类: 统计学习 |字号 订阅如何在 spss中进行正态分布检验一、图示法1、p-p 图以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。2、q-q 图以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。以上两种方法以q-q 图为佳,效率较高。3、直方图判断方法:是否以钟形分布,同时可以选择输出正态性曲线。4、
2、箱式图判断方法:观测离群值和中位数。5、茎叶图类似与直方图,但实质不同。二、计算法1、偏度系数(skewness )和峰度系数(kurtosis )计算公式:g1表示偏度, g2表示峰度,通过计算g1 和 g2 及其标准误g1及 g2然后作 u 检验。两种检验同时得出u0.05 的结论时,才可以认为该组资料服从正态分布。由公式可见,部分文献中所说的偏度和峰度都接近0 可以认为 近似服从正态分布并不严谨。2、非参数检验方法非参数检验方法包括kolmogorov-smirnov检验(d 检验) 和 shapiro- wilk( w检验)。sas 中规定:当样本含量n2000时,结果以 shapir
3、o wilk(w检验)为准,当样本含量n 2000时,结果以 kolmogorov smirnov(d检验)为准。spss 中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位于3 和 50 之间时,计算shapiro-wilk统计量。对于无权重或整数权重,在加权样本大小位于3 和 5000 之间时,计算该统计量。由此可见,部分spss 教材里面关于 shapiro wilk适用于样本量3-50 之间的数据 的说法实在是理解片面,误人子弟。(2)单样本 kolmogorov-smirnov检验可用于检验变量(例如income )是否为正态分布。对于此两种检验,如果p 值大于 0.05
4、,表明资料服从正态分布。三、 spss 操作示例spss 中有很多操作可以进行正态检验,在此只介绍最主要和最全面最方便的操作:1、工具栏 -分析 描述性统计 探索性2、选择要分析的变量,选入因变量框内,然后点选图表,设置输出茎叶图和直方图,选择输出正态性检验图表,注意显示(display )要选择双项(both )。3、output 结果(1)descriptives:描述中有峰度系数和偏度系数,根据上述判断标准,数据不符合正态分布。sk=0,ku=0 时,分布呈正态,sk0 时,分布呈正偏态,sk0 曲线比较陡峭, ku 0 时 , 分布呈正偏态,s k 0 时, 分布呈负偏态。适用条件:样
5、本含量应大于2002、用夏皮罗 -威尔克 (shapiro-wilk)法检验数据正态性即 w 检验 ,1965 年提出 , 适用于样本含量n 50时的正态性检验; 。3、用达戈斯提诺 (dagostino) 法检验数据正态性即 d 检验 ,1971 提出 ,正态性 d 检验该方法效率高,是比较精确的正态检验法。4、shapiro-francia 法即 w 检验 ,于 1972 年提出 ,适用于 50 n 5000 结果以 kolmogorov - smirnov 为准。而 sas 规定 :当样本含量n 2000 时 ,结果以 shapiro - wilk (w 检验 ) 为准 ,当样本含量n
6、2000 时 ,结果以 kolmogorov - smirnov (d 检验 ) 为准问: 对照组和病例组都是20 例,拟对某指标进行正态性检验,是用kolmogorov-smirnov检验(简称 k-s 检验 ), 还是 shapiro-wilk 检验?已用k-s 检验不能认为该指标不是正态分布,但是shapiro-wilk 检验表明其为非正态分布, 我该相信哪个检验结果?答:kolmogorov-smirnov检验:检验频数分布的正态性检验,适合大样本。shapiro-wilk 检验:小样本数据的正态性检验。矩法正态性检验: 不限样本。 问:用 spss中analysze/discript
7、ive statistics/explore法和用 analyze/nonparametric tests/1-sample k-s法评价正态性,结果不完全相同,为什么?答:以第二个为准,第一种方法是参数检验, 而第二种是非参数检验, 第一种是在知道总体分布的情况下做的, 第二种是在不知道总体分布的情况进行的检验,而且大多数的检验,我们都是不知道总体分布到底是什么才做的k-s 检验。因此在做分析的时候一般用第二种,标准的检验单样本分布的方法。不过一般推荐用上面的,并且和 sas 的结果比较吻合。同时样本量小的时候选s-w 的结果,至于结果的不同,应该是不同的方法算出的值不同,这很正常,因为这几
8、个方法的数学表达式就不一样,中间对数据的处理也不一样,会有信息损失等原因的,在正态检验中,尤其是接近水准时,往往容易出现问题,所以要根据资料的性质判断用什么方法进行检验更合适。不是把所有的方法都做一遍。对于到底 p 取多少才有意义, 说法有好多种,常用的是 0.1 吧,spss自带的是 0.2 的界值。其实还是得结合qq,pp图之类的来观察会好些。小样本最好不要看kolmogorov-smirnov的结果,常常会有问题,shapiro-wilk 的结果会好些。 补充: 如果根据国标,其偏态和峰态算法,其值为多少时符合正态别有规定呢?k-s 检验记得在资料上见过8=n5000 结果以 kolmo
9、gorm smimov(d检验 )为准。sas 规定:当样本含量n2000时,结果以shapim wilk(w 检验 )为准,当样本含量n2000 时,结果以 kolmogorovsmimov(d检验 )为准。在 spss 和 sas 等统计分析软件中,通常用统计描述模块中的shapiro-wilk检验、经过 lilliefors 显著水平修正的kolmogorov smirnov 检验和非参数检验模块中的单一样本kolmogorov smirnov 检验进行正态性判定。但是这几种检验方法存在以下几方面的问题。(1)在实际应用中常出现检验结果与直方图、正态性概率图不一致,甚至几种假设检验方法结
10、果完全不同的情况。(2)shapiro wilk 检验 ( 检验 )和经过 lilliefors 显著水平修正的kolmogorov smirnov 检验 (d 检验 )是用一个综合指标 (顺序统计量或d)来判定资料的正态性由于两种方法都是用一个指标反映资料的正态性,所以当资料的正态峰和对称性两个特征有一个不满足正态性要求时,两种方法出现假阴性错误的机率均较大;而且两种方法的检验统计量都是进行大小排序后得到,所以易受异常值的影响。(3)kolmogorov smirnov 单一样本检验是根据实际的累计频数分布和理论的累计频数分布的最大差异来检验资料的正态性,可对正态分布进行拟合优度检验。但它并
11、非检验正态性的专用方法,因此它的检验效率是最低的,最容易受样本量和异常值等因素的影响。没有修正的k-s 检验的原始公式里面,检验的既是标化后的数据是否服从理论的分布。正态性检验(上)2008-04-25 10:45 1. 样本量较大时的结果:运用的数据是 spss13.0data里面的 diameter_sub.sav ,样本含量是 216 对数据分别支用 sas和 spss 进行正态性检验:1.1 sas 中用 proc univariate normal;命令结果如下:tests for normalitytest -statistic- -p value-shapiro-wilk w 0
12、.993604 pr d 0.0789其中 sas中sas 规定:当样本含量n 2000 时,结果以shapiro - wilk (w 检验) 为准,当样本含量n 2000 时,结果以kolmogorov - smirnov (d 检验) 为准。1.2 spss 里面用 explor 过程 plots 选项中 normality plots with tests 结果如下:tests of normalitykolmogorov-smirnov(a)shapiro-wilkstatisticdfsig.statisticdfsig.ap diameter(mm).058216.070.9942
13、16.476a lilliefors significance correction对于 spss 结果选用哪个方法, 我看的资料并不一致: 在 spss13.0书上以样本量50,选 shapiro - wilk 检验,(而有文献spss说样本含量3 n 5000 时,结果以shapiro - wilk (w 检验)为准,有出入)1.3 在 spss13.0中单样本的 k-s 拟合优度检验讲到:可以用来检验样本的分布是否服从某种理论分布可以是正态、均匀等。用上述例子选normal 分布进行计算结果如下:one-sample kolmogorov-smirnov testap diameter(mm)n216normal para
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年江门货运资格证500道题库
- 单车位租赁合同范例
- 婚礼跟妆合同范例
- 2025年新疆货运车从业考试题
- 显微镜购买合同范例
- 2025年宜春年货运从业资格证考试从业从业资格资格题库及答案
- 天府新区航空旅游职业学院《环境设计专题》2023-2024学年第一学期期末试卷
- 《12 图文并茂-精确设置图片尺寸》教学实录-2023-2024学年清华版(2012)信息技术三年级下册
- 2025年山东货物运输从业资格考试答题软件
- 2025年凉山州驾驶资格证模拟考试
- JGJT334-2014 建筑设备监控系统工程技术规范
- 可持续金融智慧树知到期末考试答案章节答案2024年南昌大学
- 2024年网格员考试题库1套
- 生命科学前沿技术智慧树知到期末考试答案章节答案2024年苏州大学
- 2023年小儿推拿保健师考试真题试卷(含答案)
- 低空经济产业园项目可行性研究报告
- 中国神话故事绘本仓颉造字
- MOOC 心理健康与创新能力-电子科技大学 中国大学慕课答案
- 中华传统造型的艺术之美-中国美术史专题精讲智慧树知到期末考试答案章节答案2024年山东工艺美术学院
- 2023-2024学年高一下学期家长会 课件
- 感动中国人物张桂梅心得体会(30篇)
评论
0/150
提交评论