Z检验和卡方检验_第1页
Z检验和卡方检验_第2页
Z检验和卡方检验_第3页
Z检验和卡方检验_第4页
Z检验和卡方检验_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.二项分布总体概率的Z检验(大样本,n较大)设,当n相当大,以致和都较大(例如,大于5)时,前已学过,X近似地服从,P近似地服从(1) 单组样本例4.7 传染科人员中,乙肝化验阳性35名,问总体阳性率是否高于当地一般人群的阳性率17%?欲检验 (或或)成立时,若Z的当前值所对应的P值很小,则拒绝,否则,不拒绝。例的解:欲检验(单侧),P<0.05,故拒绝。可认为传染科人员的总体阳性率高于当地一般人群的阳性率。(2)两组样本例4.8 常规治疗组:80名中有效者48名常规+心理治疗组:75名中有效者55名问两组有效率是否相等?近似地服从近似地服从近似地服从 欲检验 (或)成立时会如何?先求

2、的联合估计再用代替:近似地服从据Z的当前值查Z分布表得P值,若P值很小,则拒绝;否则,不拒绝。例的解:欲检验成立时,作联合估计计算Z的当前值查Z分布表,得双侧,不能拒绝。尚不能认为两组有效率的差异有统计学意义。2.Poisson分布总体均数的Z检验(大样本,较大)“较大”,例如,(1) 单个观察值例4.9 规定:一定时间内放射质点数的总体均数不得超过50.现一次测定结果为X=58,问总体均数是否超过50? 欲检验设,大样本时,X近似地服从成立时会如何? X近似地服从近似地服从例的解:欲检验 (单侧)查正态分布表,得单侧P,不能拒绝。尚不能认为总体均数超过50。(2)两个观察值例4.10 两样品

3、各测1分钟,问相应的两个总体均数是否相等?欲检验成立时会如何?记近似地服从,近似地服从近似地服从但未知,只能用近似地代替 近似地服从即 近似地服从据Z的当前值查正态分布表,得双侧P值,若P值很小,则拒绝;否则,不拒绝例的解:欲检验查正态分布表,得双侧 P>0.05,不能拒绝。尚不能认为相应的两个总体均数的差异有统计学意义。(2) 两组观察值例4.11 A样品:测10分钟,B样品:测15分钟,问以1分钟为观察单位,A、B两样品总体均数是否相等?A组:独立重复观察个时间单位,记观察值为,平均值为 设每一个时间单位内,B组:独立重复观察个时间单位,记观察值为,平均值为 设每一个时间单位内,欲检

4、验等都近似地服从近似地服从等都近似地服从近似地服从近似地服从但均未知,用代替,用代替近似地服从据Z的当前值查正态分布表得双侧P值,若P值很小,则拒绝,否则,不拒绝例的解:欲检验查正态分布表得双侧P故拒绝.可以认为AB两样品总体均数不相等。第六章离散型分类计数资料的检验6.1 分布和Pearson拟合优度检验1. 分布(1) 自由度为1的分布若则的分布称为自由度为1的分布.(chi-square distribution),记为或.图形:从纵轴某个点开始单调下降,先凸后凹.(2) 互相独立,均服从,则的分布称自由度为的分布,记为或,或简记为.* 图形:单峰,正偏峰;自由度很大时,近似地服从正态分

5、布.* 界值:* 自由度时,查附表7. * 自由度较大时,利用两种做法:(1)给定,先查正态分布的临界值;再代入右端,算出的临界值。或(2)给定的当前值,先算出的当前值;再由标准正态分布表查出值。例:若查表,相差不远。* 性质:若互相独立,则服从分布, 自由度服从分布, 自由度2.关于拟合优度的检验(大样本)给定一张频数表:类别或组段观察频数理论频数问题:试判断这份样本,是否来自该理论分布?检验:(1) :样本的总体与该理论分布无区别:样本与该理论分布有区别(2) l Pearson 统计量可以证明,成立时, * 似然比统计量自由度(3) 将观察值代入得当前值和相应的P值.若P值很小,则拒绝;

6、否则,不拒绝.l “大样本”:等都不小于5.6.2 两二项分布总体概率的比较表6.1 反应变量按二项分类的两个独立样本资料(四格表类型之一)某事件观察总频数阳性频率阳性阴性样本1(给定)样本2(给定)合计 (给定)表6.2 肺心病患者心律失常观察资料洋地黄用药史某事件观察总频数阳性频率阳性阴性曾用药组81(76.28)83(87.72)164未用药组19(23.72)32(27.28)51合计100115215解法一:检验其中,据当前值1.5175查标准正态分布表,P = 0.065 ,不能拒绝。解法二: (1)检验(2) 成立时, ,用近似地代替,理论上应有:一般地, (3) 统计量的当前值

7、* Pearson 统计量上述关于四格表统计量的计算公式等价于:本例中,* 似然比统计量由上可见, 实践中,可任用其中之一.(4) 自由度计算理论频数时,利用了行和、列和,两个行和中,只有一个是独立的,两个列和中也只有一个是独立的,故利用样本资料来估计的参数个数 = 2自由度 = 4 - 1 - 2 = 1 另一种算法 :自由度 = ( 行数 - 1 )( 列数 - 1 )对于例6.1, 自由度 = ( 2 - 1 )( 2 - 1 ) = 1(5)决策: * 据统计量的当前值,查附表7,得P值,若P值很小,则拒绝,否则,不拒绝 .或 * 给定,查附表7,得临界值,若统计量的当前值,则拒绝,否

8、则,不拒绝 .本例中, 当前值为2.3028,查附表7,得自由度 = 1时, ,故不拒绝.或给定,查附表7,得自由度 = 1时,临界值,故不拒绝.讨论: 关于统计量 :l 解法一和解法二Pearson检验完全等价ll 统计量的连续性校正:当(认为是大样本),若有,必须作连续性校正:或它们等价于二项分布正态近似中的连续性校正: 若6.3 2×2交叉分类资料的检验2×2列联表:将样本中个体按照两个二分类属性作交叉分类形成的双向表.表6.3 2×2交叉分类资料表( 四格表类型之二)按属性A分类按属性B分类合计1212合计(给定)1. 两种属性分布间独立性检验(或关联性检

9、验)例6.2 260份血清样品,每份用两种免疫学方法检测风湿因子A法B法合计+-+1728180-126880合计18476260设计: 一份样本;给定;行和与列和事先是不定的;按两种属性交叉分类.问题:两种免疫测定结果是否有关联?(1) 检验的假设属性A和B互相独立 , : 属性A和B互相关联表6.4 2×2交叉分类资料的概率表按属性A分类按属性B分类合计1212合计1(2) 成立时必有. 用样本资料估计,理论频数:一般地, (3) 统计量的当前值同前(4) 自由度同前(5)决策同前l 两种属性分布间独立性检验与两二项分布总体概率的比较虽资料分析的计算方法相同,但设计和解释不同 (

10、1) 检验的假设方法A和B互相独立 ,: 方法A和B互相关联(2) 成立时必有(3) 统计量的当前值利用(6.8a)或(6.7a),(4) 自由度 = (2-1)(2-1) = 1(5)决策据查附表7, 自由度 =1时,P <0.05(更确切P)故拒绝,或给定,查附表7, 自由度 =1时, , P <0.05,故拒绝.(更确切,P)结论:可认为两种方法测定结果间有关联.定义: 关联系数 = (取值在 -1与+1之间)其中,符号由关联的方向决定,与的符号相同上例中, ,故关联系数 = 2.两份非独立样本总体概率相等的检验( McNemer检验)常用于配对设计,数据结构同上.问题不同.

11、例6.2 260份血清样品,每份用两种免疫学方法检测风湿因子A法B法合计+-+1728180-126880合计18476260设计: 一份样本;问:两种测定方法的阳性率是否相等?解:这里不是问是否关联,故不能用上面的办法分析!l 这里有两份样本,接受方法A的个体与接受方法B的个体有关联,故不能用前一节的办法分析!方法A样本阳性率 = 方法B样本阳性率 = 样本阳性率之差 = 取决于四格表副对角线上两个格子中的观察值和.问题:和的差异是否是偶然的?(1) 检验的假设在两种方法结论不一致的条件下,个体出现在这两个格子里的概率为和(2) 成立时应当如何?若共有个体(大样本)结论不一致,则应当有理论频数且故成立时应当有(3) 统计量的当前值同前(4) 自由度 = 2 - 1(5) 决策同前l 以上解决问题的思路:在两方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论