统计学第13讲 第13章 非参数检验课件_第1页
统计学第13讲 第13章 非参数检验课件_第2页
统计学第13讲 第13章 非参数检验课件_第3页
统计学第13讲 第13章 非参数检验课件_第4页
统计学第13讲 第13章 非参数检验课件_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第13章 非参数检验13.1 导言 科研中不是所有的变量都可以采用参数检验,如果变量严重偏离已知分布,可考虑采用非参数检验。即便在小样本情况下,非参数检验仍然和参数检验一样有效。 在选择检验方法时要小心,如果是试探性的,可选择一些样本,使用多种检验方法进行统计分析,借以了解不同检验方法的差异。 但是要避免下列错误做法:先搜集数据,在“货比三家”后选择一个有利于自己科研结果的,并且能带来统计显著性的统计方法科研中。虚无假设、备择假设、统计检验、抽样分布以及显著性水平都必须在数据搜集之前就要确定下来。如果先搜集数据,再“货比三家”地考虑统计分析方法,我们会为了“差异显著”而夸大偶然造成的差异效应,

2、会增大犯类错误的概率。13.2 类别变量分类变量的数据就是计数数据,非参数检验适合小样本的计数数据。但是当大样本时,计数数据也可考虑使用参数检验。测量、等距、比率量表,当样本小并且分布不明朗,不服从正态分布,可考虑非参数检验。13.2.1 二项检验称名量表的测量水平最低,常用二分类,(two-category)或二分总体(dichotomous population)请同学举例说明有那些二分总体?男女,对错,正反,阴阳,有无文化.定义:二分总体中, p 为一类所占的比例,q=1p为另一类所占比例。例题:某大学教导主任说,自从学校禁售香烟以来,吸烟学生比例下降到70%以下。但是对其他学校观察发现

3、,禁售对吸烟影响不大,仍然有70%的人在吸烟。请检验教导主任的说法是否正确。随机抽取40名同学,询问发现其中有12名吸烟。则不吸烟的同学数量为: X=28用 P0 表示总体吸烟比例 1. 虚无假设:吸烟学生总体比例P00.72. 备择假设:样本所在总体比例P00.74. 统计检验: 二分总体 , 采用二项式检验5. 抽样分布: 统计量为 X , 在附表N中列出N50时,不同p,q的单侧临界值。3. 显著水平:=0.05,单尾检验6. 临界区间:参照表N,N=40,p=0.30,q=0.70,发现0.05的临界值为18,单尾检验。7. 因为X=2818,拒绝H0,认为教导主任是对的N p q 0

4、.010.990.020.980.300.700.490.510.500.5020.010.051112.30.010.051222.400.010.053334.201826282628490.010.053445.212331333134表N 当N=249时, =0.01和0.05时,p和q各种取值下的临界值N=40,=0.05,因为X=2818,拒绝H0,认为教导主任是对的例题 已知 X=5,N=20,p=q=0.5,=0.05,双尾检验。计算P(X5) 或P(X15)当=0.05,双尾检验时,| z |1.96,所以拒绝H0如果我们从附表M中查找, X=5,N=20,双尾检验,发现:拒

5、绝H0需要NX15,本题NX=15,所以拒绝H0。这和利用正态分布计算是一致的。表M只列出了N=50的临界值,建议N50时才使用正态分布。13.3 单变量的2 检验肥胖与健康问题有关,亚特兰大疾控中心定期进行全国青少年危机监督调查,对11631名男女青年(9到12年级)自身体重观的部分调查结果。偏瘦正常过胖合计419340219955816这个问题可以使用单变量2 检验或拟合优度检验(goodness-of-fit test)观测值与虚无假设下的期望值之间是否存在差异?观测值分布是否与理论分布相吻合?表13-1 女生的自身体重观 表13-2 2 部分临界值表体重偏低体重正常体重偏重合计实际值4

6、19(7%)3402(58%)1995(34%)5816期望值1938.6671938.6671938.6675816 fofe-1519.6671463.66756.3330 (fofe)22309387.702141343.403173.41(fofe)2/fe1191.2241104.5441.3702=2297.138 表13-3 女生对自身体重观念,H0下的期望值及2 值计算表因为2=2297.138 9.210,拒绝H0。34%远远超过7%,这些女生有80%正在减肥13.4 独立类别变量的2检验问题1. 不同社会经济背景的儿童,其暴力犯罪的概率是否存在差异?暴力犯罪与社会经济背景是

7、独立的?还是暴力犯罪部分取决于社会经济背景。问题2. 男女青年对于自身体重观念存在差异吗?人们对自身体重的观念与性别有关吗?上述诸多问题归纳为两点:1. 对两个或多个称名变量的研究2. 每个类别的变量绘制成交叉表交叉表的缺点:没有明显办法计算期望值表13-4 22列联表,男女青年体重自我感觉自我感觉性别过轻过重合计女性419(a)1995(b)2414男性959(c)855(d)1814合计137828504228H0:感觉与性别无关 H1:感觉与性别有关如果H0是真实的,则预期女性自认为体重过轻的比例与行合计认为体重过轻的总比例相同,所以a单元格的期望次数为:注意:使用2检验要求每一个观察值

8、或出现的频次都与其他观察值相独立。你不可能对同一个体进行多次观测,把它看做是不同被试身上得到的,那么造成的误差使得“N增大”,导致犯类错误。电影类型喜剧悲剧被试1男性61被试2男性40被试3女性13被试4女性02例如:研究两男两女4位朋友看电影的情况,417,这类数据不能列成交叉表,宜用参数检验电影类型喜剧悲剧合计男性10111女性156合计1161713.5 顺序量表变量非参数检验1. 曼-惠特尼U检验(Mann Whitney U test)适用于独立样本,因变量可以是定量的,也可以是分类的,定量的不服从正态分布,用U检验代替 t 检验。2. 符号检验(Wilcoxon sign test

9、)适用于两组相关样本设计,根据某些标准条件对被试进行配对,或者对同一被试进行前后测量,尽管因变量分数是顺序量表,我们并不愿意假设差异具有精确的属性。因此,忽略分数之间的差异,只是关心这些差异的方向(即大于还是小于)。有两个统计量,U 和 都可用来检验H013-313-4曼-惠特尼U检验的虚无假设是H0:U =换言之,如果两个分布的等级相同,则 ,并且必须假定两组之间无系统误差。假如一组的等级比较多,则 .当我们拒绝虚无假设时,一组的等级分数比预期的少,而另外一组比预期的多。表13-7 使用公式13-3计算曼-惠特尼U检验(假设数据)实验组控制组计算时间(ms)等级时间(ms)等级1404130

10、11476135215381383160101445165111487170121559171131681219314R1N1=8R2=39N2=7=11=56+36-81检验步骤如下:1. H0: 两组等级差异是机遇所致 2. H1: 两组等级差异不是随机的 3. 统计检验:曼-惠特尼 U 检验4. 显著水平:=0.055. 抽样分布:曼-惠特尼U:N1=8 , N2=76. 拒绝H0的判别区域:U10 或 U46,如果U在此范围之外,就拒绝H0,否者不拒绝H0。因为U=1110,所以不拒绝H0 。这种药物对反应时没有影响。 N1N2123456789207104689207010曼-惠特尼

11、U检验的临界值表见统计表I,根据U和 的值大小决定否拒绝H0。对任意的N1和N2,给定的水平,表中的值给出的是判别值的上下限。所以,统计量U下限, 或 上限,才能拒绝H0。因为U=1110,所以不拒绝H0 。这种药物对反应时没有影响。13.6.1 具有相同等级的曼-惠特尼U检验数据中经常会出现几个分数恰好相同的情况,从理论上说,如果测量工具精确到小数点几位以后,那就不应存在相同测量结果。但是数据是连续的,测量数据大多数比较粗略,常常存在相同数据,好比计算Spearman等级相关一样,要计算平均等级.如果相同等级出现在同一组,倒无所谓。但是,如果相同等级出现在不同的组,那就要采取矫正公式。如不能

12、矫正,其结果是检验比较“保守”,就是说,不该拒绝虚无假设的时候却拒绝了虚无假设,降低了犯类错误的概率。只有相同数值比较多,以及未加矫正的U值接近设定的显著性水平时,才建议矫正。13.6.2 N1 和(或) N2大于20时的曼-惠特尼U检验两个样本容量基本相等,并且其中一个大于20 ,U的分布近似正态分布13-513-713-6检验统计量 z 为:因为 z 1.96 ,所以拒绝H0,结论:两种实验处理产生了差异。13.7 相关样本的非参数检验13.7.1 符号检验重复前面讨论过的问题:假设智力与领导能力是相关变量,根据26人的智力进行配对,设立实验组和控制组。在完成培训任务后,由独立观察者根据5

13、0点量表进行评定。13个对子12345678910111213实验组47433638302225211412595控制组403842252926161884735差异符号0表13-8 两个配对被试组的领导能力得分评定成绩(假设数据)对等级数据唯一能做的合理假设是:两配对分数之间的任意差异仅仅说明差异的方向,不能说明大小差值为零的表示不存在差异,去掉后剩余12对,根据虚无假设,有一半是正向变化,另外一半负向变化,若H0: p=q=0.5 ,成立,则出现正向变化和负向变化(二分总体)的概率相等。其中12对显示出差异,有N+=9,N=3符号检验的缺点:忽略数据中可能存在的定量信息,检验把所有的正向差

14、异视为等同的,负向也是如此(例如-8=-7=-6)。如果数据确实允许我们考虑定量性质:如“差异 876,” ,则使用符号检验会降低检验效力。13.7.2 Wilcoxon 配对符号等级检验如果在研究中同时考虑差异数量和差异方向,则检验更具有效力。Wilcoxon mathced-pairs signed-ranks test对子12345678910111213实验47433638302225211412595控制403842252926161884735差异75613149368260等级95(-)7121(-)4113710(-)27较小等级和T=7+4+2=13742表13-9 两个配对

15、被试组的领导能力得分评定成绩(假设数据)H0:带正号的等级和=带负号的等级和,如果H0为真,则带正号等级和与带负号等级和应该差不多,如果差得多,就应该拒绝H0。统计量 T =13, 根据下表,T13,拒绝H0。单尾检验0.050.0250.010.005双尾检验N0.100.050.020.0155-9853110108531113107512171397结论:领导培训课程确实提高了实验组被试的评定等级,但是符号检验结论与此相反,为什么?13.7.3 Wilcoxon 配对符号检验的理论假设第1假设:数据的测量水平至少要达到顺序水平,即对分数按照大小顺序较小排列。第2假设:分数之间的差异可以组成一个顺序量表我们尚不清楚这个假设对任意一组数据都是有效的。例如在测验情境中,使用人格量表测量焦虑,我们是否可以说,根据这个量表相差5点的差异一定大于相差4点的数据差异?如果不能够得出这个结论,我们就得使用其他的统计方法,哪怕显著性检验不够灵敏、不够有效。再强调一次,科学研究的谨慎使我们宁愿犯类错误,也不愿犯类错误。 小结1. 数据分为两种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论