第9章 卡方检验2_第1页
第9章 卡方检验2_第2页
第9章 卡方检验2_第3页
第9章 卡方检验2_第4页
第9章 卡方检验2_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章

2检验

2检验用途单个频数分布的拟合优度检验完全随机设计两组频数分布

2检验多组频数分布的

2检验配对设计下两组频数分布

2检验

**四格表的确切概率法

2分布和拟合优度检验

2分布

2分布是一种连续型随机变量的概率分布。如果Z服从标准正态分布,那么Z2服从自由度为1的

2分布,其概率密度在(0,+∞)区间上表现为L型,如图7-1对应于自由度=1的曲线,取较小值的可能性较大,取较大值的可能性较小。

v=1v=4v=6v=9

2分布和拟合优度检验图7-1,

2分布的形状依赖于自由度ν的大小,当自由度ν>2时,随着ν的增加,曲线逐渐趋于对称,当自由度ν趋于∞时,

2分布逼近正态分布。各种自由度的

2分布右侧尾部面积为α时的临界值记为列于附表8。

2分布和拟合优度检验拟合优度检验拟合优度检验是根据样本的频率分布检验其总体分布是否等于某给定的理论分布。拟合优度检验步骤:1.建立检验假设H0:总体分布等于给定的理论分布H1:总体分布不等于给定的理论分布

2分布和拟合优度检验2.计算检验统计量

实际观察到的频数用A表示,根据H0确定的理论频数用T表示,则大样本时统计量,自由度=K-1-(利用的参数个数)

2分布和拟合优度检验

以上两个公式

2检验的基本公式,所有其它形式的

2检验公式都来源于此。

2值反映了样本实际频数分布与理论总体分布的符合程度。如果原假设成立,

2值不会太大;反之,A若与T差距大,

2值也大;当

2值超出一定范围时,就有理由认为原假设不成立。

3.确定相应的概率P,作出推断结论

2分布和拟合优度检验例7-1对表7-1所示数据作正态分布拟合优度检验。136例体模骨密度测量值的均数=1.260;标准差=0.010检验的假设:H0:总体分布等于均数为1.260,标准差为0.010的正态分布H1:总体分布不等于该正态分布

表7-1136例体模骨密度测量值频数分布表及拟合优度检验统计量的计算组段(1)实际频数A(2)Φ(X1)(3)Φ(X2)(4)P(X)(5)T=n×P(X)(6)(A—T)2/T(7)1.228―20.000690.004660.003970.54053.941431.234―20.004660.022750.018092.46010.086051.240―70.022750.080760.058017.88890.100161.246―170.080760.211860.1311017.82940.038591.252―250.211860.420740.2088828.40830.408921.258―370.420740.655420.2346831.91670.809611.264―250.655420.841340.1859225.28550.003221.270―160.841340.945200.1038614.12440.249061.276―40.945200.986100.040905.56180.438581.282―10.986100.997440.011351.54340.19130合计—————6.26692

2分布和拟合优度检验

表7-1中第3列、第4列正态分布函数值可通过对作标准正态变换后查正态分布表或利用相应的SAS程序得到,第5列为第4列与第3列的差值,第6列理论频数T等于总例数136与各组段概率的乘积,第7列各数之和即检验统计量

2值。

2分布和拟合优度检验计算统计量:推断结论:自由度=10-1-2=7,查附表8,得到P>0.50,可以认为该样本服从正态分布。

计算TI时的参数有2个(均数和标准差)完全随机设计两组频数分布

2检验二分类情形——2×2列联表

例7-2某医师研究用兰芩口服液与银黄口服液治疗慢性咽炎疗效有无差别,将病情相似的80名患者随机分成两组,分别用两种药物治疗,结果见表7-2。表7-2慢性咽炎两种药物疗效资料药物疗效合计有效无效兰芩口服液41(36.56)4(8.44)45(固定值)银黄口服液24(28.44)11(6.56)35(固定值)合计651580完全随机设计两组频数分布

2检验问题:这两个频数分布的总体分布是否相等?或者这两份样本是否来自同一个总体。因为这里是二分类变量,问两个总体分布是否相等就相当于问两个有效概率是否相等。完全随机设计两组频数分布

2检验(1)建立检验假设H0:π1=π2两药的有效概率相同H1:π1≠π2两药有效概率不同检验水准

=0.05(2)计算检验统计量完全随机设计两组频数分布

2检验自由度

=(2-1)(2-1)=1(3)确定p值查附表8,

=1对应的临界值,P<0.025。(4)结论:拒绝H0,两样本频率的差别具有统计学意义。可以认为,兰芩口服液和银黄口服液的总体有效概率不同,前者(91.1%)高于后者(68.6%)。完全随机设计两组频数分布

2检验对于四格表资料,四格表专用公式

完全随机设计两组频数分布

2检验当n≥40时,如果有某个格子出现1≤T<5,一般需用校正公式完全随机设计两组频数分布

2检验例7-3将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,两组的缓解率见表7-4,问两疗法的总体缓解率是否不同?(1)建立检验假设H0:π1=π2,,两法总体缓解概率相同H1:π1≠π2两法总体缓解概率不同检验水准

=0.05完全随机设计两组频数分布

2检验组别属性合计缓解率(%)缓解未缓解单纯化疗2(4.8)10(7.2)12(固定值)16.7复合化疗14(11.2)14(16.8)28(固定值)50.0合计16244040.0完全随机设计两组频数分布

2检验2)计算检验统计量

=(2-1)(2-1)=13)确定P值:P>0.1,高于检验水准

,不能拒绝H0,差别无统计学意义,尚不能认为两种治疗方案的总体缓解概率不同。

完全随机设计两组频数分布

2检验特别注意:

当四格表出现T<1或n<40时,校正

2值也不恰当,这时必须用四格表的确切概率计算法(见本章第6节)。

完全随机设计两组频数分布

2检验多分类的情形——2×C列联表

定性变量具有多分类时,两个频数分布的数据可表示为一个2×C列联表。例7-4北京市1986年城市和农村20至40岁已婚妇女避孕方法情况如表7-5所示(据王绍贤等调查资料),试分析北京城市和农村采用不同避孕方法的总体分布是否有差别。表7-5北京城市和农村已婚妇女避孕方法情况

地区避孕方法合计节育器服避孕药避孕套节育器其他城市1533316515340431农村320754332018518合计47310820847358949完全随机设计两组频数分布

2检验(1)建立检验假设H0:北京城市和农村已婚妇女避孕方法的总体概率分布相同H1:北京城市和农村已婚妇女避孕方法的总体概率分布不同检验水准

=0.05。完全随机设计两组频数分布

2检验(2)计算检验统计量H0成立时,两组概率分布相同,均近似地等于合并计算的频率分布。完全随机设计两组频数分布

2检验

=(2-1)(4-1)=3,查附表8P<0.001,按

=0.05水准拒绝H0。可以认为,北京城市和农村已婚妇女避孕方法的总体概率分布不同。据调查数据,城市使用男用避孕套的频率高于农村;宫内节育器是城市和农村的主要避孕方式,但农村使用宫内节育器的频率比城市高。完全随机设计多组频数分布

2检验

设有一个定性变量,具有C个可能的“取值”;现有R组独立样本的频数分布,其数据以表7-7的形式表示。这样的数据形式称为R×C列联表。完全随机设计多组频数分布

2检验

例7-5为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的原则下,将条件相似的53名产妇随机分成三组,分别按三种不同剂量服用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论