2007统计学第九章_第1页
2007统计学第九章_第2页
2007统计学第九章_第3页
2007统计学第九章_第4页
2007统计学第九章_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章列联分析列联分析可进行两类检验:一致性检验------检验若干个总体的比例是否相同。假设检验的形式为:H:旦=旦=…=旦,H:旦,旦,…,旦不全相同。0 1 2 n1 1 2 n独立性检验——检验两个变量是否有关联,是否相互影响。假设检验的形式为:H0:变量X与变量Y相互独立,H1:变量X与变量Y不相互独立。§1列联表一、列联表的构造列联表(Contingencytable)是由两个变量进行交叉分类的频数分布表。如下表中,某集团公司关于某项改革方案的调查结果一分公司二分公司三分公司四分公司合计赞成该方案68755779279反对该方案32453331141合计10012090110420表的横行是态度变量:取值为赞成、反对表的竖列是总体变量:取值为一分公司、二分公司、…。具有R行C列的列联表称为RxC列联表。二、列联表的分布列联表的分布可反映观察值的分布------两个变量进行交叉分类的频数分布的客观情况;也可反映期望值的分布------在原假设为真的假设下,应有的两个变量交叉分类的频数分布;也可以兼而有之。我们以例子来说明期望值分布列联表的构造。1.一致性检验的情况设由上表中数据,我们要检验四个分公司中赞成改革方案的人的比例是否相同。以P,表示第,个分公司中赞成改革方案的人数所占比例,则我们即要检验:H:P=P=P=P,H:P,P,P,P不全相同。0 1 2 3 4 1 1 2 3 4可用如下方法计算期望值。先求出赞成改革方案的总人数,设为n1与总人数(设为n)相比较。如果P1=P2=P3=P4,则应有n第i个分公司中赞成改革的人数=第i个分公司中总人数X1;n第i个分公司中反对改革的人数n-n=第i个分公司中总人数X——1.n由此,我们即可得到该问题的期望值的分布,见下表:一分公司二分公司三分公司四分公司合计赞成该方案66.4285714379.7142857159.7857142973.07142857279反对该方案33.5714285740.2857142930.2142857136.92857143141合计10012090110420考虑到人数应为整数,即有一分公司二分公司三分公司四分公司合计赞成该方案66806073279反对该方案34403037141合计10012090110420进一步地,我们可以得到观察值与期望值频数对比分布表:一分公司二分公司三分公司四分公司合计赞成该方案68(66)75(80)57(60)79(73)279反对该方案32(34)45(40)33(30)31(37)141合计100120901104202.独立性检验的情况例9-3一种原料来自三个不同的地区,原料质量被分为三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表:一级二级三级合计甲地区526424140乙地区605952171丙地区506574189合计162188150500要求检验各个地区和原料质量之间是否存在依赖关系。这是一个独立性检验问题。可依下述方法构造期望值分布列联表:一般地,设原列联表有r行s列,先对各行各列求和,记为RT,i=1,2,...,riCT,j=1,2,.,s如果两变量相互独立,则第i行第j列位置上的期望值应为竺・以1-n=RTiCTj,n为总的观察值的个数。nn n于是,我们得出本例的期望值分布列联表一级二级三级合计甲地区45.3652.6442140乙地区55.40464.29651.3171丙地区61.23671.06456.7189合计162188150500§2X2检验一、 Z2统计量不论是一致性检验还是独立性检验,我们定义X2统计量,y(f—f)2X2=y o 6 fe其中,fo是观察值频数,fe是期望值频数。从X2统计量的定义可以看出,X2统计量的值越大,则原假设成立的可能性就越小。二、 X2统计量自由度的确定设列联表有r行s列,则共有rxs个变量,而约束条件有yx=RT,i=1,2,…,r,j=1Zx=CT,j=1,2,...,s,i=1Zrt=Zct.ijj=1这些约束条件中有,+^-1个是相互独立的,所以X2统计量自由度为rs-(r+s-1)=(r-1)(s-1).三、X2检验可以证明,由上面定义得到的X2统计量当n较大时,近似服从自由度为(r-1)(s-1)的X2分布。由假设检验的原理,易见不论是一致性检验还是独立性检验,原假设的拒绝域的形式均应为X2>X:((r-1)(s-1)).所以在给定的显著性水平a下,计算X2统计量的观察值并与临界值X决(r-1)(s-1))相比较,如果X2>X;((r—1)(s-1)),则拒绝原假设;否则,接受原假设。说明:在用列联表作一致性检验或独立性检验时,数据要满足下面的要求:1)n的值要很大,2)每个交叉位置上的期望值不是很小,实践中,要求每个匕>5,否则,要通过合并事件来满足这一条件。现在我们来回答第一个例子(例9-1)中四个分公司赞成改革的人数比例是否相同和例9-3中各个地区和原料质量之间是否存在依赖关系的问题。第一个例中,经计算X2=^^(¥o ¥e):=3.0319<6.251=X^(3),e所以,接受原假设,即认为四个分公司赞成改革的人数比例相同。第二个例中,经计算X2=£(f—匕)2=19.82>9.488=X篇(4),e所以,拒绝原假设,即认为各个地区和原料质量之间存在依赖关系。在列联分析中,如果列联表为2行2列,则X2统计量的计算就变得较为简单。设列联表为

12合计1ab(a+b)2cd(c+d)合计(a+c)(b+d)n=a+b+c+dn(ad-bc)Xn(ad-bc)(a+b)(c+d)(a+c)(b+d)【例】有人研究抽烟与肺癌之间是否有联系。在医院门诊部搜集了56人的资料(如卜表)。试检验抽烟与肺癌之间是否有联系。抽烟不抽烟合计有肺癌201636没有肺癌61420合计263056解:建立假设H0:抽烟与肺癌之间没有联系,H1:抽烟与肺癌之间有联系。由样本数据,得X2=56x(2。X14-6X16)2=3.37626x30x36x20查表,得X2(1)=3.841,x2(1)=2.7060.05 0.1所以,在显著性水平0.05下接受原假设,即认为抽烟与肺癌之间没有联系;而在显著性水平0.1下拒绝原假设,即认为抽烟与肺癌之间有联系。利用Excel进行列联分析chitest.xls(ex9-3)四、一致性检验与独立性检验的区别从形式上看,一致性检验和独立性检验中X2统计量的值的计算公式是相同的。但是一致性检验的抽样方法和对期望值的计算规则与独立性检验是不同的。在进行独立性检验时,是从研究的总体中抽取一个样本(容量为n),然后根据样本的观察值进行两向分类;一致性检验则是从比较的两

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论