第四讲-非参数检验_第1页
第四讲-非参数检验_第2页
第四讲-非参数检验_第3页
第四讲-非参数检验_第4页
第四讲-非参数检验_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数检验方法第一节非参数检验的一般问题第二节单样本非参数检验第三节列联表与的独立性检验第四节等级相关分析第五节两个相关样本的非参数检验第六节两个独立样本的非参数检验第七节多个相关样本的非参数检验第八节多个独立样本的非参数检验第一节

非参数检验的一般问题在统计学中,如果总体的精确率分布形式已知,而只是其中的某些参数未知时,通常是从总体中随机取样本,根据样本信息对总体参数进行估计或假设检验,这就是一般所说的参数检验。但在许多实际问题中,我们对总体分布的具体形式是未知或知之甚少的,只知道总体为连续分布还是离散分布,也不能对总体的分布形式作进一步的假定(如假定总体为近似正态分布等),这时要对总体的某些性质进行统计估计或假设检验,就要采用非参数检验。非参数检验方法的特点从参数检验的前提条件看,仅要求观察值是独立的、变量是连续的等简单假设,不要求确保样本所属的总体符合某种理论分布。非参数检验不受总体分布形状的限制,使得其应用范围更为广泛。从非参数检验对原始数据的要求看,它部要求有精确的计量值,可以使用分类数据和顺序数据,非参数检验的处理方法都基于低精度数据,因而它几乎可以处理任何类型的数据。从非参数检验的效率看,虽然非参数检验的计算方法种类繁多,有时对某类数据的算法就有多种,但其表现形式一般比较简单并易于理解,依照不同类型数据的不同算法,效率也不同。研究表明,非参数的检验精度大约是参数检验的95%。也就是说,非参数检验需要更大的样本容量来保证所要求的检验精度。非参数检验的常用方法

拟合优度检验K-S检验符号检验游程检验列联表与的独立性检验第二节单样本非参数检验拟合优度检验单样本K-S检验符号检验单样本游程检验(二分类)一、拟合优度检验(适应性检验)分布在参数统计中可用于方差估计检验,但在非参数统计领域,它有更加广泛的应用。在单样本情况之下,它主要用于检验客观现象是否服从于某种理论分布(称为吻合性或适应性检验),或者检验某种理论分布是否正确(称一致性检验或同质性检验)。我们将两者合称为“拟合优度检验”。原假设及备择假设为:H0:观察值的频数Oi与期望(理论)频数Ei相吻合Hi:观察值的频数Oi与期望(理论)频数Ei不相吻合拟合优度检验原理以及计算

类别12….K总和观测频数

假设检验问题:观测频数和理论频数的差别作为检验总体分布和理论分布是否一致的标准,定义Pearson统计量:拟合优度检验原理以及计算

如果观察频数与设定频数越接近,则值越小,根据皮尔逊定理,当n充分大时,统计量渐近服从于k-1个自由度的分布。我们可以计算出统计量,判断有以下两种方法:依据的分布表,给出所对应的概率值,如果该概率值<给定的显著水平α,则拒绝Ho,即样本所属的总体分布形态与设定的分布存在显著差异;反之则不能拒绝Ho。依据的分布表,给出α所对应的临界值,如果统计值>临界值,则拒绝Ho;反之则不能拒绝Ho。[例12.1]某企业开发了一种新型的食品,初步设想出五种不同的包装方式(每种包装方式的含量相同),现欲了解消费者对这些不同包装方式的偏好是否有差异,经过市场实验,得到如表12-2所示的销售数据。

表12-2各种包装方式的饮料销售量

单位:瓶包装方式甲乙丙丁戊合计销售量3253843203263451700H0:对不同包装方式的偏好无差异H1:对不同包装方式的偏好有差异在H0成立之下,应有:E1=E2=E3=E4=E5=1700/5=340故统计量值为:故不拒绝,即不能认为五种不同包装方式之间销售有显著差异。

二、单样本K-S检验单样本K-S检验,也称Kolmogorov-Smirnov正态性检验。K-S检验也是一种拟合度检验,研究样本观测值的分布和设定的理论分布间是否吻合,通过对两个分布差异的分析确定是否有理由认为样本的观测结果来自设定的理论分布总体。假设样本的经验分布函数为,定义当时,拒绝零假设。

Ho:H1:[例12.3]某茶叶公司的产品灌装生产线在灌装过程中,会出现重量(份量)的偏差。根据质量要求,一定范围之内的误差是允许的。质量标准是:平均盒重(净)500g,允许极限误差(99.73%的可靠性)为12g。现随机抽取1000盒产品进行检验,结果重量资料如表12-3所示(已分组)。现欲想证明该灌装生产线所包装的产品重量是否服从于均值500g,方差为16g的正态分布。表12-3灌装产品重量的样本资料按重量分组盒数累计盒数累计频数按正态分布计算Z值理论累计频数绝对差异

以下110.001-3.50.00020.0008486-488120.002-3.00.00130.0007488-490460.006-2.50.00620.0002490-49216220.022-2.00.02280.0008492-49447690.069-1.50.06680.0022494-496861550.155-1.00.15870.0037496-4981372920.292-0.50.30850.0165498-5002054970.4970.00.50000.0003500-5022107070.7070.50.69150.0155502-5041418480.8481.00.84130.0067504-506829300.9301.50.93320.0032506-508469760.9762.00.97720.0012508-510189940.9942.50.99380.0002510-51249980.9983.00.99870.0007512-51419990.9993.50.99980.0008以上110001.0004.01.00000.0000合计1000此列原假设H0为:产品包装净重服从均值为500g,标准差为4g的正态分布。有关中间过程列在表12-3中。因本例理论分布的总体参数μ与σ均已知,故可计算出每一组上限为止的“理论频率”。D统计量值为:D=max{|Sn(x)-Fn(x)|}=0.0165查D分布表。因本例n大大超过40,我们采用近似的公式计算临界值,即:由于D=0.0165<D0.05(1000)=0.04301故不能拒绝H0,即可认为该生产线产品的包装净重服从正态分布。三、符号检验符号检验是一种利用正、负号的数目对某种假设做出判定的非参数检验方法。它部要求知道被检验量的分布规律,仅依据某种特定的正负号数目多少来对某种假设做出检验。常用于检验总体的均值、中位数等参数是否为某一数值,或判断总体分布有无变化。有配对样本(x1,y1),(x2,y2),…(xn,yn)将记为“+”,记为“-”,记为“0”,记P+

为“+”比例,P-

为“-”比例,那么假设检验问题:可以用符号秩检验。H0:P+=P-

H1:P+=P-[例12.7]某企业生产一种月饼,有A、B两种口味,为确定哪种口味更加适合消费者青睐,此前特作一次市场研究。经市场实验,被调查者对两种月饼的的偏好如表12-6所示。表12-6月饼口味偏爱情况调查表被调查者(评价者)序号更喜欢A口味(+)更喜欢B口味(-)无所谓12345678910√√√√√√√√√√合计721显然,若评价者对两种口味无显著偏好,则+号与-号个数应该是相近的。本例中

n+=7,n-=2,n=9,l=min(n+

,n-)=2,结点舍去,则由二项分布,可计算出“-”号小于等于2的概率P,即

若取显著性水平为0.1,则拒绝H0

,认为消费者更喜欢A种月饼的口味。四、单样本随机游程检验随机性是抽样调查方案设计中的一条重要原则。但在现实生活中,我们经常会遇到一些非随机的序列。游程检验(也称连贯检验)就是为了检验样本观察值出现次序的随机性而发展起来的一种非参数统计方法,有着十分广泛的应用。例如检验股票价格波动的随机性,检验样本的随机性,检验生产过程是否处于随机控制状态等等。如果一个变量的取值只有两种情况(如记为M与F),即是非标志(若不是“是非标志”,我们可以将之转化成“是非标志”)。变量值按一定次序出现(即有顺序的),则就可能有如下形式的序列:MMM

FFF

M

FF

MM

FF

MFFF

MMM

FFFF所谓游程,就是由同类事物(符号,如M)连续构成的一个子序列,它的前面和后面有另外的事物(符号,如F),或前后根本没有别的事物。显然,上面列出的变量值序列就有十个游程。第一个游程是由3个M构成,第二个游程是由3个F构成,第三个游程则由一个M构成,第四个游程由两个F松成……游程检验中最常用的方法是游程个数检验。其原假设及备择假设为:

H0:现象(序列)是随机的H1:序列是非随机的[例12.4]在证券价格理论中,有一种叫“随机漫步”理论,认为股市价格变化是随机的。人们经常采用游程检验来验证这一理论。设某种股票在过去的38个交易日中价格变动情况如下(+表示价格上升,-表示价格下降):+++--+---++-+--++++---++++-++--++-+---计算得

n1=20,n2=18,R=18。查游程总数临界值表,在0.05显著性水平下,

,,显然

,即实际序列中游程个数“不多也不少”,故不能拒绝

H0,即认为该股票价格变化是随机的。第三节列联表与的独立性检验连列表又称交互分类表,指抽自某一总体的样本同时按照两个或两个以上标志进行分类,一下以量个分类标志位例。[例]下表是一个由220名饮酒者组成的随机样本,对饮酒者进行酒的类型偏好的调查。横向看,反映了再固定性别的条件下,对白酒与啤酒的偏好;总向看,反映了再固定酒类型的条件下,各性别的人数。性别饮酒偏好合计白酒啤酒男性6050110女性4070110合计100120220直观看似乎饮酒偏好与性别有关,是这样吗?利用统计量可以完成对分类数据或顺序数据之间是否独立的检验。建立假设:Ho:两个分类变量之间独立(性别与饮酒偏好无关);H1:两个分类变量之间不独立(性别与饮酒偏好有关)计算与列联表中实际次数相对应的期望次数:每一个条件次数的理论次数即期望次数记作则构建统计量:实际次数与理论预期次数有差异,这是可以用其差值的大小来度量两个变量相关程度,相差越大,表明HO为真的可能性就越小;反之则HO为真的可能性就越大。为避免差值的正负抵消,可以采用差值的平方和,这就是统计量:检验判断:若则拒绝假设Ho,即认为性别与饮酒偏好有关系;反之则不能拒绝Ho。第四节等级相关分析有时候我们在研究的两个变量中得到两组顺序数据,如学生的考试成绩与老师为学生排出的工作能力大小顺序。要研究学生的学习能力与工作能力是否一致,就要用啊等级相关分析。对等级数据的相关性的测度主要用等级相关系数,它是把相关的两个变量按等级次序排列,形成与两个等级序列,然后测定与这两个等级序列之间的相关程度。Spearman等级相关系数学生编号考试总分工作能力排名

13509109112360878-113358686244369747-395378131246395212-117388525-39835410910-11936835324103664642411

合计38

=-Spearman等级相关系数Spearman等级相关系数是历史上最早(1904)测定两个样本相关强度的重要指标,记为:Spearman等级相关系数Spearman等级相关系数检验的步骤

1.建立假设:

Ho:两样本相关程度无统计意义,即两样本不相关

H1:两样本相关程度有统计意义,即两样本相关

2.计算,差表确定

3.比较

4.若>,则拒绝Ho,两样本相关程度有统计意义,两

样本相关,学习能力与工作能力有关。反之则学习能力与工作能力无关。第五节两个相关样本的非参数检验麦克勒玛检验威尔克逊配对符秩检验一、麦克勒玛检验基本原理

麦克勒玛(McNemar)检验是适用于研究现象“前后”情况有无显著变化的一种非参数统计方法。设n个样本单位在某一条件下(即变化前)的观察值为第一个样本(观察值为“是非标志”),在另一个条件下(即变化后)的观察值为第二个样本,则可以得到如表12-4所示的频数统计表。表12-4麦克勒玛检验频数表这里,A是前后均为“非”的次数。D为前后均为“是”的次数,B是从“非”变为“是”的次数,C是从“是”变为“非”的次数。显然,前后情况有无变化,就是指C、B两格子内次数的变动情况。麦克勒玛检验关心的也正是这一点,故统计假设为:H0:事件在两个方向上的变化可能性相同

H1:事件在两个方向上的变化可能性不同变化后变化前010AB1CD[例12.6]某高校欲研究某系学生专业态度的变化情况,以验证新生入学专业教育的效果。从整个专业的100名新生中随机抽取80名学生进行态度调查:在刚入校时,记载学生们对所学专业的态度(喜欢或不喜欢),经过一段时间的专业教育,在新生入学后第三个月对这80名学生的专业态度再次作访问调查,两次专业态度整理成下表12-5。表12-5大学生专业态度变化频数统计表入学三个月后的专业态度合计不喜欢喜欢入学初的专业态度不喜欢20(A)40(B)60喜欢6(C)14(D)20合计265480计算卡方统计量值为:

在显著性水平

0.05时

。因为

故拒绝H0

,认为学生专业态度有明显变化(即更多的学生培养起了专业兴趣)。二、Wilcoxon符号秩检验

对称分布的中心一定是中位数,在对称分布情况下,中位数不唯一,研究对称中心比中位数更有意义例:下面的数据中,O是对称中心吗?0Wilcoxon符号秩检验原理以及性质用表示在绝对值样本中的秩,反秩由定义。表示的符号,称为符号秩统计量。Wilcoxon符号秩统计量定义为:首先,设样本绝对值的顺序统计量,如果数据关于0点对称,那么对称中心两侧的数据疏密程度应该一样,整数在取绝对值以后的样本中的秩应该和负数在绝对值样本中的秩和相近。

表12-7方案设计效果调查表达式消费者老方案评分新方案评分前后评分差的秩次符号还原后正秩负秩ABCDEFGHIJKLMNOPQRST80708586607090657080608595809250705540908560968876729568767565809088988077806070+5-10+11+2+16+2+5+3+6-5+5-5+5+8+6+30+7+25+20-206.514151.5161.56.5310.56.56.56.56.51310.520121917.517.56.5151.5161.56.5310.56.56.51310.520121917.5-14-6.5-6.5-17.5[例12.8]某房地产公司为了验证其新的设计方案是否有效,在新设计方案之前与新设计方案之后作了一次对比调查,从消费者中随机抽取20名进行了解,记录了他们在设计方案前后对该公司房产产品的评分,如表12-7所示。要求检验:

H0:新设计方案有效;

H1

:新设计方案无效。有关中间过程的表12-7所示。Wilcoxon-T统计量值为T=44.5。查表(双侧):拒绝H0

,即认为设计方案是显著有效的。第六节

两个独立样本的非参数检验曼—惠特尼U检验中位数检验斯米尔诺夫检验双样本游程检验独立双样本卡方检验一、曼—惠特尼U检验

这是检验两个独立样本是否来自具有相同均值的总体的非参数检验方法,又称秩和检验法。它与配对Wilcoxon检验相类似,要考虑到每一个样本中各观察值所处的次序(秩),故为一种功效较强的检验方法。设第一样本n1个观察值为xi,i=1,2,…,n2;第二样本n2个观察值为xj,j=1,2,…,n2。则其基本步骤为(1)将两个样本合并成一个样本再评秩。可以按升序评秩,也可按降序评秩。若多个观察点数值相同,则取其平均秩次。(2)计算每个样本观察点所得的秩和。记为TR1与TR2。(3)计算U统计量。如果两个样本的确抽自同一个总体(H0),则可以设想样本1所得到的平均秩次与样本2所得到的平均秩次大致相同。故定义统计量U为:其中(4)查U统计量分布表。若

,则拒绝H0

,认为两个样本的均值有显著差异,即抽自不同的总体。[例12.10]对两所大学入学新生的智能进行测验,结果如表12-8所示。现要检验这两所大学新生的智能水平是否有显著差异。

表12-8两所大学新生智能抽样测验分数甲大学学生编号智能分数乙大学学生编号智能分数12345678910111275818795908665789297868212345678910119097827986879491808488取显著性水平0.05。则统计假设为:H0:两校新生智能水平无显著差异H1:两校新生智能水平有显著差异n1=12,n2=11。将这两个样本混合之后评秩,结果如表12-9所示。表12-9两所大学新生智能分数抽样评秩秩次分数学校秩次分数学校1234567.57.5910.510.512.5657578798081828284868687甲甲甲乙乙甲甲乙乙甲乙甲12.514.514.516.516.51819202122.522.58788889090919294959797乙甲乙甲乙乙甲乙甲甲乙二、中位数检验

(一)基本原理

这是检验两个彼此独立样本是否来自有相同中位数的总体。由于在社会经济统计中,我们遇到的变量可能是“定序变量”,若检验两个样本在该变量值上的“一般水平”(统计平均数)是否相同,采用参数统计中“两个均值差异性”的检验可能行不通,这时可采用中位数检验法,因为中位数也是一种平均数。中位数检验的原假设及备择假设为:H

0:两个独立样本来自有相同中位数的总体H

1:两个独立样本来自的有不同中位数的总体[例12.14

]设有两批不同厂家的灯泡,经质量检验,它们的寿命如下(小时):甲厂家:1208,1406,1250,1622,1326,1414,1500,1480,1251,1262,1365,1462,1518,1610,1285,1382

乙厂家:1428,1579,1325,1328,1685,1476,1490,1588,1442,1578,1369,1479,1465,1672,1587,1592,1581

要求检验两厂该灯泡寿命的中位数是否相同。此例若假定该灯泡的寿命服从正态分布,则就可用参数统计中的t检验法进行检验。我们现在采用中位数法进行检验。由所给资料可计算知,n1=16,

n2=17,混合中位数的中数为Me=1465小时。则x(甲厂灯泡寿命超过混合中位数的个数)为5,y(乙厂灯泡寿命超过混合中位数的个数)为11。于是可计算出累积的一伴随概率为:显然,P<α=0.01。故我们认为两个厂的灯泡寿命中位数显著不同。三、斯米尔诺夫检验

(一)基本原理这是在柯尔莫洛夫检验(单样本,见第二节)的基础之上推广到两个独立样本之间的比较,判断两个总体分布是否相等的方法。有时也称K-S双样本检验。第一个样本有n

1个观察值,随机抽自某一分布函数为F

(

x

)(但未知具体形式)的总体,第二个样本有n

2个观察值,随机抽自另一分布函数为G

(

y

)(也未知其具体形式)的总体。现要通过两个样本的比较,对以下假设进行检验H

0

:

F

(

x

)

=G

(

y

),即两总体分布相同(-∞<x

,

y<∞)H

1

:

F

(

x

)

≠G

(

y

),即两总体分布不同(-∞<x

,

y<∞)[例12.16]设男、女两类消费者对某餐厅风味的评分(10分制)资料如下表12-11所示。现欲知两类消费者的评分分布是否相同。表12-11男、女两类消费者的评分男消费者评分女消费者评分序号评分序号评分123456789101112138.010.09.09.08.59.57.57.08.56.56.09.56.0123456789101112137.56.56.06.07.58.08.59.08.56.57.09.09.5先将上述样本资料混合编制单项式分布数列,如表12-12所示。表12-12斯米尔诺夫检验计算过程故不拒绝

H0,即认为男女两类消费者对该餐厅风味的评分分布没有显著差异。按评分值分组消费者人数累计人数累计频率(经验分布)偏差男女男女男女6.06.57.07.58.08.59.09.510.021111222122121221023456810121324578101213130.1538460.2307690.3076920.3846150.4615380.6153850.7692310.9230771.0000000.1538460.3076920.3846150.5384620.6153850.7692310.9230771.0000001.0000000.0000000.0769230.0769230.1538410.1538470.1538460.1538460.0769230.000000合计1313四、双样本游程检验

(一)基本原理和和步骤

这是单样本游程检验的推广,用来检验两个独立样本是否有相同的总体分布,也称“瓦尔德-沃夫维茨”的检验(Wals-Wolflwitz检验,简记W-W游程检验)。其基本步骤如下:

(1)将两个样本的观察值混合,并按大小顺序从小到大排列。并以符号

表示第一样本的元素,以符号y表示第二样本的元素。

(2)计算

,y序列中的游程总数,方法与单样本游程检验完全相同。(3)查游程总数检验临界值表。在单样本情况下,游程个数太多太少都表示

不成立。但在双样本情况之下,游程个数越多,表示两个样本值的混合越理想,

越不能拒绝。故此时要查游程总数检验的下限临界值

。若

,则拒绝

,认为游程个数太少,从而两个样本来自不同的总体。值得指出的是,当

超过20时,可用正态分布来检验。

[例12.17]假设要比较两个医院满月新生儿重量是否有显著差异,从两个医院抽得的满月新生儿重量分别为(单位:KG):

医院1:4.975.214.304.785.094.834.525.344.904.94医院2:4.884.555.364.434.934.705.284.535.464.954.98要求检验这些新生儿的重量分布是否来自同一总体(或来自有相同分布函数的两个总体)。先将上述两组数据混合排序,并在第二样本的数据之下划一横线:4.304.434.524.534.554.704.784.834.884.904.934.944.954.974.985.095.215.285.345.365.46可见,游程总个数R=14。由所给得游程总数临界值(下限)为

,因为

,故不否定

,认为两个总体有相同的分布。五、独立双样本卡方检验

该法是单样本卡方检验的推广,也是列联表分析的应用。主要用于检验两个彼此独立的样本的频率分布是否有差异,或是行变量与列变量之间是否具有相关性。检验步骤如下:

(1)独立随机抽取两个样本,将全部可能观察值进行分组,得到如表12-13所示的频数资料(分布数列)。表12-13样本频数分布样本观察值…合

计样本1频率样本2频率…合

计…(2)计算期望频数。若两个样本对应于具体观察值的出现概率是相同的(即

为真,两个总体无差异),则在实际的调查中,全部n个样本单位中属于第i样品的估计概率为

,全部n个样本单位中,出现第j个观察结果的估计概率应为

。按联合概率,即可推知在全部的n个单位中,出现上述表格每一格子中的期望次数

为:(3)计算卡方统计量:(4)作检验。若,则拒绝

,认为两个总体有显著差异。[例12.18]某市场研究公司对某国际体育产品公司生产的A、B两种品牌产品的消费群进行了一次体育节目收视情况调查,以了解他们喜欢收看哪些体育节目,从而为该企业提供选择广告时段的参考资料。调查结果如表12-14所示。表12-14样本中A、B两品牌消费者观看不同电视节目的人数电视节目

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论