版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第7章 非参数检验 参数检验参数检验(parametric test)是假定总体分布已知条件下是假定总体分布已知条件下,对总体未知参数的检验,这些方法都依赖于总体的对总体未知参数的检验,这些方法都依赖于总体的分布性质。分布性质。非参数检验非参数检验(nonparametric test或或NPar test)是一种不是一种不依赖于总体分布的检验方法依赖于总体分布的检验方法(总体分布未知或了解总体分布未知或了解很少很少),也称自由分布检验。,也称自由分布检验。一般做法一般做法是当资料不满足参数检验条件时,再用非参是当资料不满足参数检验条件时,再用非参数检验方法。数检验方法。非参数检验在非参数检
2、验在SPSS中的实现有两个模块:中的实现有两个模块:Analyze-Nonparametric Tests Analyze Descriptive Statisticcrosstabs(交叉列联表的检验)(交叉列联表的检验)2Analyze-Nonparametric Tests 包含了8个过程:1、Chi-Square 卡方拟合优度检验卡方拟合优度检验2、 Binomial 二项分布检验二项分布检验3、Runs 游程检验游程检验4、 1-Sample K-S 单样本单样本K-S检验检验5、 2 Independent Samples 两独立(成组)样本检验两独立(成组)样本检验6、 K In
3、dependent Samples K个独立样本检验个独立样本检验5、 2 Related Samples 两关联(配对)样本检验两关联(配对)样本检验6、 K Related Samples K个关联样本检验个关联样本检验37.1 Chi-Square1、卡方拟合优度检验、卡方拟合优度检验(Nonparametric Tests - Chi-Square)主要用于分析主要用于分析实际频数与理论频数(已知)拟合情况;实际频数与理论频数(已知)拟合情况;2值反映了实际频数和理论频数的吻合程度。值反映了实际频数和理论频数的吻合程度。2值越小,值越小,说明实际频数与理论频数越吻合。说明实际频数与理论
4、频数越吻合。 适用于一个变量的多项分类数据的检验分析。适用于一个变量的多项分类数据的检验分析。统计原假设统计原假设:实际频数与理论频数相等或实际构成比等于实际频数与理论频数相等或实际构成比等于已知构成比。已知构成比。卡方统计量为卡方统计量为 kieefff1202)( 定义变量基本要求定义变量基本要求:一个频数变量,至少一个分组变量。:一个频数变量,至少一个分组变量。【注意】【注意】频数变量一般需要加权处理。频数变量一般需要加权处理。4【数据准备】【数据准备】各周日为各周日为day,死亡频数为,死亡频数为death。按顺序输入数据。按顺序输入数据。激活激活Data菜单选菜单选Weight Ca
5、ses.命令项,命令项,定义死定义死亡数为加权变量亡数为加权变量。【实例【实例1】某地一周内各日死亡数的分布如某地一周内各日死亡数的分布如表,请检验一周内各日的死亡危险性是表,请检验一周内各日的死亡危险性是否相同?否相同?周周 日日死亡数死亡数一一二二三三四四五五六六日日111917151616195各组理论频数(或构成比)设置各组理论频数(或构成比)设置(个数与观察频数一致)(个数与观察频数一致)【界面设置】【界面设置】各组理论频数(或构各组理论频数(或构成比)相等成比)相等限定参入检验的频数限定参入检验的频数变量范围,少用变量范围,少用分组变量列表,非频分组变量列表,非频数变量数变量6【结
6、果形式】【结果形式】可见,一周内各日的死亡危险性无显著性差异。可见,一周内各日的死亡危险性无显著性差异。7【实例【实例2】某高校大学生的生活支出构成比在某高校大学生的生活支出构成比在2000年和年和2005年的统计数据如表,试分析该校大学生的生活消费是否年的统计数据如表,试分析该校大学生的生活消费是否发生显著变化?发生显著变化?年份膳食学习用品旅游衣服其它20006016.4216.6620054225.68.4186【数据准备】【数据准备】支出类型为支出类型为ZCLX,观察比例(,观察比例(2005年)为年)为GCBL;录;录入数据;入数据;定义定义观察比例观察比例GCBL为加权变量为加权变
7、量。8已知的构成比(个数与要检验已知的构成比(个数与要检验构成比一致)构成比一致)【界面设置】【界面设置】分组变量列表,非频分组变量列表,非频数变量数变量9【结果形式】【结果形式】可见,该校大学生的生活消费发生了显著变化。可见,该校大学生的生活消费发生了显著变化。102、列联表资料的卡方检验、列联表资料的卡方检验(Descriptive Statisticcrosstabs)可进行计数资料和某些等级资料的列联表分析。主要可进行计数资料和某些等级资料的列联表分析。主要两方面两方面功能功能:产生汇总分类数据产生汇总分类数据列联表,即计算行列联表,即计算行/列百分数、列百分数、行行/列汇总数等序列描
8、述统计量;列汇总数等序列描述统计量;检验行变量与列变量是否独立(即有无相关性)。检验行变量与列变量是否独立(即有无相关性)。【数据准备】【数据准备】 定义变量定义变量:一个频数变量(行列对应的频数值,:一个频数变量(行列对应的频数值,应作应作加权处理加权处理),两个组变量(频数对应行及频数对应),两个组变量(频数对应行及频数对应列)。录入数据时,注意三者的对应。列)。录入数据时,注意三者的对应。 11【实例】【实例】用两组大白鼠诱发鼻咽癌的动物实验中,一组用两组大白鼠诱发鼻咽癌的动物实验中,一组单纯用亚硝胺鼻注,另一组附加维生素单纯用亚硝胺鼻注,另一组附加维生素B12 , 生癌率如下生癌率如下
9、表,问两组生癌率有无显著差别?表,问两组生癌率有无显著差别?动物分组动物分组生癌鼠数生癌鼠数未生癌鼠数未生癌鼠数合计合计生癌率生癌率( () )亚硝胺组亚硝胺组亚硝胺亚硝胺+B+B1212组组5252393919193 37171424273.273.292.992.9合计合计9191222211311380.580.512注意变量定义方法及行注意变量定义方法及行列变量的输入值列变量的输入值【数据准备】【数据准备】定义变量名:定义变量名:count为频数变量(行列对应的频数值),为频数变量(行列对应的频数值),group为组变量(频数对应行),为组变量(频数对应行),test为试验结果组变量(
10、频为试验结果组变量(频数对应列)。数对应列)。按三者对应关系录入数据,按三者对应关系录入数据, 并对并对count作加权处理。作加权处理。13【界面设置】【界面设置】行组变量行组变量列组变量列组变量分层变量分层变量按行变量生成频度聚类条图按行变量生成频度聚类条图14计算卡方值,用于行列变量的独立性检验Statistics按钮:按钮:计算pearson和spearman相关系数定类资料的行列变量相关性检验定序资料的行列变量相关性检验定序与定距资料的行列变量相关性检验评判内部一致性相关风险比例两相关二项分类变量的非参检验二项分类变量的因、自变量独立性检验15g gr ro ou up p * *
11、t te es st t C Cr ro os ss st ta ab bu ul la at ti io on n52197157.213.871.073.2%26.8%100.0%57.1%86.4%62.8%46.0%16.8%62.8%3934233.88.242.092.9%7.1%100.0%42.9%13.6%37.2%34.5%2.7%37.2%912211391.022.0113.080.5%19.5%100.0%100.0%100.0%100.0%80.5%19.5%100.0%CountExpected Count% within group% within test%
12、of TotalCountExpected Count% within group% within test% of TotalCountExpected Count% within group% within test% of Total12groupTotal12testTotal【结果形式】【结果形式】16C Ch hi i- -S Sq qu ua ar re e T Te es st ts s6.478b1.0115.2871.0217.3101.007.013.0086.4201.011113Pearson Chi-SquareContinuity CorrectionaLikel
13、ihood RatioFishers Exact TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea. 0 cells (.0%) have expected count less than 5. The minimum expected count is 8.18.b. 校正校正2值为值为5.287,P值为值为0.021, 可认为亚硝胺可认为亚硝胺+B12组组的
14、生癌率显著较高。的生癌率显著较高。177.2 Binomial 二项分布检验二项分布检验主要用于检验变量是否来自二项分布总体的一种检验主要用于检验变量是否来自二项分布总体的一种检验方法。方法。 定义变量定义变量:至少一个数值型的二分变量(只有两个值):至少一个数值型的二分变量(只有两个值)或至少一个利用断点分为两组的变量。或至少一个利用断点分为两组的变量。统计原假设统计原假设H0:检验二项分布的概率:检验二项分布的概率P等于某常数,等于某常数,即即检验变量服从二项分布。检验变量服从二项分布。H0:P=p0统计量统计量:小样本时,统计量为:小样本时,统计量为k/n;大样本时,统计量;大样本时,统
15、计量为为)1 , 0(/ )1(/NnpppnkZ 18【界面设置】【界面设置】注意大小样本的选择注意大小样本的选择检验的落入第一组的检验的落入第一组的概率常数值概率常数值分组值,小于该值为分组值,小于该值为1组,其余为组,其余为1组组19【结果形式】【结果形式】207.3 Runs 游程检验游程检验 主要用于对二分变量(数值型)或利用断点分主要用于对二分变量(数值型)或利用断点分为两组的变量,检验取值的分布随机性或两总体分为两组的变量,检验取值的分布随机性或两总体分布是否一致,即一个布是否一致,即一个case的取值是否影响下一个。的取值是否影响下一个。统计原假设统计原假设H0:样本二分值分布
16、是随机的或两总体分:样本二分值分布是随机的或两总体分布相同。布相同。分组方式,小于该值分组方式,小于该值为为1组,其余为组,其余为1组组21【结果形式】【结果形式】227.4 1-sample K-S 单样本单样本K-S检验检验 主要用于样本数据总体是否服从特定的分布(如正态、主要用于样本数据总体是否服从特定的分布(如正态、泊松、均匀及指数四种分布)泊松、均匀及指数四种分布)统计原假设统计原假设H0: 总体变量服从指定分布总体变量服从指定分布【界面设置】【界面设置】23【结果形式】【结果形式】累计概率的最大绝对差累计概率的最大绝对差247.5 两独立样本非参检验两独立样本非参检验 用于检验两独
17、立样本的总体分布是否有显著性差异。用于检验两独立样本的总体分布是否有显著性差异。统计原假设统计原假设H0:两总体分布无显著性差异两总体分布无显著性差异SPSS 提供了提供了4种检验方法:种检验方法:1)Mann Whitney U检验(检验(Wilcoxon W,威尔科克逊威尔科克逊秩和检验)默认,检验两总体是否来自同一总体。秩和检验)默认,检验两总体是否来自同一总体。要求样本数据为连续的。要求样本数据为连续的。2)Moses extreme reactions(摩西极端反应摩西极端反应)检验)检验 通过检验样本是否存在极端反应,从而判定有无通过检验样本是否存在极端反应,从而判定有无显著性差异
18、,要求样本数据为连续的。显著性差异,要求样本数据为连续的。253)Komogorov-Smirnov Z检验(检验(两独立样本两独立样本K-S检验检验)要求样本数据为比率数据。要求样本数据为比率数据。4)Wald-Wolfwitz Runs 检验(检验(W-W游程检验游程检验)通过游程数目的大小,判定是否来自同一总体(越大,通过游程数目的大小,判定是否来自同一总体(越大,来自同一总体)。来自同一总体)。变量定义变量定义:需要定义两个变量,:需要定义两个变量,一个是待检验变量;另一个是待检验变量;另一个是分组变量(一个是分组变量(2组)组)。数据录入数据录入:将两组数据都录入到待检验变量内;两组
19、数:将两组数据都录入到待检验变量内;两组数据的区分用分组变量值进行(如据的区分用分组变量值进行(如0,1或或1,2等)。等)。26【界面设置】【界面设置】曼曼-惠特尼惠特尼U检验检验P值值小样本用小样本用U检验统计量检验统计量W为容量较为容量较小样本组秩和小样本组秩和【结果形式】【结果形式】Z检验检验P值值大样本用大样本用287.5 多独立样本非参检验多独立样本非参检验 用于检验多个独立样本的总体分布是否有显著性差异,用于检验多个独立样本的总体分布是否有显著性差异,一般推断多个总体的均值或中位数的差异性。一般推断多个总体的均值或中位数的差异性。原假设原假设H0:多总体分布(或中位数)无显著性差
20、异多总体分布(或中位数)无显著性差异SPSS 提供了提供了3种检验方法:种检验方法:1)Kruskal-Wallis H检验检验,默认,检验多总体是否来,默认,检验多总体是否来自同一总体。不要求正态分布,替代自同一总体。不要求正态分布,替代F检验(方差检验(方差分析)。分析)。2)Median(中位数)检验(中位数)检验 检验各样本总体中位数有无显著性差异。检验各样本总体中位数有无显著性差异。多用于样本数据具有二分性或个案有很多相同等级的多用于样本数据具有二分性或个案有很多相同等级的资料。资料。293 3)Jonkheere-TerpstraJonkheere-Terpstra检验检验 其原理
21、类似其原理类似Wilcoxon WWilcoxon W检验。检验。 既可检验连续变量,尤其适合检验定序变量资料既可检验连续变量,尤其适合检验定序变量资料(优于(优于H H检验)。检验)。变量定义变量定义:需要定义两个变量,:需要定义两个变量,一个是待检验变量;另一个是待检验变量;另一个是分组变量(多组)一个是分组变量(多组)。数据录入数据录入:将各组数据都录入到待检验变量内;多组数:将各组数据都录入到待检验变量内;多组数据的区分用分组变量值进行。据的区分用分组变量值进行。30【界面设置】【界面设置】注意与注意与2组的区别组的区别31【结果形式】【结果形式】327.5 两关联样本非参检验两关联样
22、本非参检验 用于检验两配对样本的总体分布是否有显著性差异。用于检验两配对样本的总体分布是否有显著性差异。用途用途(1)同一研究对象(或配对对象)分别给予两)同一研究对象(或配对对象)分别给予两种处理,推断两种处理效果有无显著差异;种处理,推断两种处理效果有无显著差异;(2)同一研究对象一种处理前后(或配对对照),推断同一研究对象一种处理前后(或配对对照),推断该处理效果有无显著作用。该处理效果有无显著作用。原假设原假设H0:两总体分布(或效果)无显著性差异两总体分布(或效果)无显著性差异SPSS 提供了提供了4种检验方法:种检验方法:1)Wilcoxon 符号秩检验符号秩检验,默认;,默认;2)Sign 符号检验符号检验 适用于将每一对数据分出等级的资料。适用于将每一对数据分出等级的资料。333)McNemar 变化显著性检验变
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 失智症老人的护理
- 硫回收装置安全
- 汽车金融流程
- 公共安全大赛
- 制造业薪酬规定
- 住宅小区改造工程合同范本
- 农村教育保障与住宅用地管理
- 航空公司商标印刷规范
- 研发项目招投标资质审核细则
- 能源工程电焊施工合同
- 《区域农业的发展》课件
- 灌溉设施改造施工方案
- 临床护理实践指南2024版
- 2024年下半年包钢(集团)公司新员工招聘【941人】易考易错模拟试题(共500题)试卷后附参考答案
- 政府采购评审专家考试试题库(完整版)
- 高压电气设备预防性试验(电气设备1)
- 专题17 重点语法:宾从、状从、定从综合练90题
- 少儿美术课件国家宝藏系列《鸱吻》
- 第18课《我的白鸽》教学设计++2024-2025学年统编版语文七年级上册
- 小学科学苏教版五年级上册全册知识点(2022新版)
- 第一单元(单元测试)-2024-2025学年三年级上册道德与法治 统编版
评论
0/150
提交评论