非参数检验检验_第1页
非参数检验检验_第2页
非参数检验检验_第3页
非参数检验检验_第4页
非参数检验检验_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、非参数检验检验第1页,共70页,2022年,5月20日,3点15分,星期四2分布2分布是由正态分布推导出来的一种连续型随机变量的概率分布数学形式:22(k),k是自由度,表示定义式独立变量的个数。 设随机变量x1,x2,xk相互独立且都服从正态分布N(,2)。将它们标准化转变为标准正态变量U1,U2,Uk,k个独立标准正态变量的平方和被定义为2分布的随机变量2。第2页,共70页,2022年,5月20日,3点15分,星期四2 检验(Chi-square test)对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。一、2检验的定

2、义2检验第3页,共70页,2022年,5月20日,3点15分,星期四2检验与测量数据假设检验的区别测量数据的假设检验,其数据属于连续变量,而2检验的数据属于点计而来的间断变量。测量数据所来自的总体要求呈正态分布,而2检验的数据所来自的总体分布是未知的。测量数据的假设检验是对总体参数或几个总体参数之差所进行的假设检验,而2 检验在多数情况下不是对总体参数的检验,而是对总体分布的假设检验。第4页,共70页,2022年,5月20日,3点15分,星期四二、2检验与连续型资料假设检验的区别对总体参数或几个总体参数之差不是对总体参数的检验,而是对总体分布的假设检验正态分布总体分布是未知的连续型资料离散型资

3、料检验对象总体数据资料连续型资料假设检验2 检验第5页,共70页,2022年,5月20日,3点15分,星期四三、2检验的用途适合性检验独立性检验同质性检验第6页,共70页,2022年,5月20日,3点15分,星期四适合性检验(吻合度检验)是指对样本的理论数先通过一定的理论分布推算出来,然后用实际观测值与理论数相比较,从而得出实际观测值与理论数之间是否吻合。因此又叫吻合度检验。适合性检验的零假设是观测次数与理论次数之间无差异。其中理论次数的计算一般是根据某种理论,按一定的概率通过样本即实际观测次数来计算。这里所说的某种理论,可能是经验规律,也可能是理论分布。确定理论次数是卡方检验的关键。第7页,

4、共70页,2022年,5月20日,3点15分,星期四是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立。独立性检验第8页,共70页,2022年,5月20日,3点15分,星期四在连续型资料的假设检验中,对一个样本方差的同质性检验,也需进行2 检验。同质性检验第9页,共70页,2022年,5月20日,3点15分,星期四2检验的原理与方法2检验的基本原理2检验统计量的基本形式2值的特点2检验的基本步骤2检验的注意事项第10页,共70页,2022年,5月20日,3点15分,星期四2检验就是统计样本的实

5、际观测值与理论推算值之间的偏离程度。实际观测值与理论推算值之间的偏离程度就决定其2值的大小。理论值与实际值之间偏差越大, 2值就越大,越不符合;偏差越小,2值就越小,越趋于符合;若两值完全相等时,2值就为0,表明理论值完全符合。第11页,共70页,2022年,5月20日,3点15分,星期四理论值观测值第12页,共70页,2022年,5月20日,3点15分,星期四2检验统计量的基本形式2 (OiEi)2 EiO实际观察的频数(observational frequency)E无效假设下的期望频数(expectation frequency)k第13页,共70页,2022年,5月20日,3点15分

6、,星期四性别观察值(O)理论值(E)O-E公母428448438438-10+10合计8768760876只羔羊性别调察抽样误差?实质性变化?第14页,共70页,2022年,5月20日,3点15分,星期四 要回答这个问题,首先需要确定一个统计量,将其用来表示实际观测值与理论值偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。 判断实际观测值与理论值偏离的程度,最简单的办法是求出实际观测值与理论值的差数。第15页,共70页,2022年,5月20日,3点15分,星期四性别观察值(O)理论值(E)O-E公母428448438438-10+10合计876876羔羊性别观察值与理论值

7、由于差数之和正负相消,并不能反映实际观测值与理论值相差的大小。0第16页,共70页,2022年,5月20日,3点15分,星期四 为了弥补这一不足,可先将实际观测值与理论值的差数平方,即(OE)2,再用差数的平方除以相应的理论值,将之化为相对数,从而来反映(OE)2 的比重,最后将各组求和,这个总和就是2 。第17页,共70页,2022年,5月20日,3点15分,星期四羔羊性别观测值与理论值性别观测值(O)理论值(E)O-E(OE)2 /E公母428448438438-10+100.22830.2283合计87687600.45662 (OiEi)2 Ei2值就等于各组观测值和理论值差的平方与理

8、论值之比,再求其和。第18页,共70页,2022年,5月20日,3点15分,星期四2值的特点可加性非负值随O和E而变化2 (OiEi)2 Ei第19页,共70页,2022年,5月20日,3点15分,星期四2值与概率P成反比, 2值越小,P值越大,说明实际值与理论值之差越小,样本分布与假设的理论分布越相一致; 2越大,P值越小,说明两者之差越大,样本分布与假设理论分布越不一致。第20页,共70页,2022年,5月20日,3点15分,星期四观测值与理论值的差异由抽样误差引起,即观测值理论值。同时给出相就的备择假设HA :观测值与理论值的差值不等于0,即观测值理论值一般确定为0.05或0.011.提

9、出无效假设H02.确定显著水平基本步骤第21页,共70页,2022年,5月20日,3点15分,星期四3.计算样本的2值4.进行统计推断2 2 2P 2P 2 2第37页,共70页,2022年,5月20日,3点15分,星期四例: 有一调查以研究消费者对“有机”食品和常规食品的态度在超级市场随机选择个男性和个女性消费者,问他们更偏爱哪类食品,结果如下性别“有机”常规总数男性女性总数第38页,共70页,2022年,5月20日,3点15分,星期四例: 有一调查以研究消费者对“有机”食品和常规食品的态度在超级市场随机选择个男性和个女性消费者,问他们更偏爱哪类食品,结果如下性别“有机”常规总数男性()()

10、女性()()总数第39页,共70页,2022年,5月20日,3点15分,星期四提出假设:性别与对食品的偏爱无关:性别与对食品的偏爱有关确定显著水平(0.05)检验计算统计推断0.053.84,由于c0.052,所以应该否定而接受,即性别与对食品的偏爱有关,男女消费者对两类食品有不同的态度第40页,共70页,2022年,5月20日,3点15分,星期四给药方式有效无效总数有效率口服注射5864403198(R1)95(R2)59.267.4总数122(C1)71(C2)193(T)给药方式与给药效果的22列联表1.H0 :给药方式与给药效果相互独立。HA :给药方式与给药效果有关联。2.给出显著水

11、平0.05第41页,共70页,2022年,5月20日,3点15分,星期四3.根据H0,运用概率乘法法则:事件A与事件B同时出现的概率为:P(AB)=P(A)P(B)口服与有效同时出现的理论频率口服频率有效频率,即P(AB)=P(A)P(B)98/193 122/193理论频数Ei理论频率总数 (98/193 122/193) 193(98 122)/193=61.95即EijRiCj/T=行总数列总数/总数第42页,共70页,2022年,5月20日,3点15分,星期四E11= R1 C1/T=61.95 E12= R1 C2/T=36.05E21= R2 C1/T=60.05 E22= R2

12、C2/T=34.95给药方式有效无效总数口服注射58(61.95)64(60.05)40(36.05)31(34.95)98(R1)95(R2)总数122(C1)71(C2)193(T)给药方式与给药效果的22列联表第43页,共70页,2022年,5月20日,3点15分,星期四计算2值:由于df=(r-1)(c-1)=(2-1)(2-1)=1,故所计算的2值需进行连续性矫正:给药方式有效无效总数口服注射58(61.95)64(60.05)40(36.05)31(34.95)98(R1)95(R2)总数122(C1)71(C2)193(T)第44页,共70页,2022年,5月20日,3点15分,

13、星期四4.查2表,当df=1时, 20.05 3.841,而2c =0.863 20.05 , P0.05,应接受H0 ,拒绝HA ,说明给药方式与给药效果相互独立.第45页,共70页,2022年,5月20日,3点15分,星期四2 2列联表的2检验可利用以下简式而不必计算理论次数:T/2为矫正数第46页,共70页,2022年,5月20日,3点15分,星期四给药方式有效无效总数口服注射5864403198(R1)95(R2)总数122(C1)71(C2)193(T)第47页,共70页,2022年,5月20日,3点15分,星期四(二)2c列联表的独立性检验 行 列 12C合计12O11O21O12

14、O22O1cO2cR1R2合计C1C2CcT2c列联表的一般形式由于df=(2-1)(c-1) 2,故计算值时不需作连续性矫正第48页,共70页,2022年,5月20日,3点15分,星期四检测甲、乙、丙三种农药对烟蚜的毒杀效果,结果如下,使分析这三种农药对烟蚜的毒杀效果是否一致?甲乙丙合计死亡数未死亡数37150491002357109307合种农药毒杀烟蚜的死亡情况第49页,共70页,2022年,5月20日,3点15分,星期四1. H0 :对烟蚜毒杀效果与农药无关,农药类型间互相独立; HA :二者有关2.取显著水平0.053.统计数的计算第50页,共70页,202

15、2年,5月20日,3点15分,星期四第51页,共70页,2022年,5月20日,3点15分,星期四理论值的计算:甲乙丙合计死亡数未死亡数37(49.00)150(138.00)49(39.04)100(109.96)23(20.96)57(59.04)109307合计187149804162值的计算:第52页,共70页,2022年,5月20日,3点15分,星期四(4)查2值表,进行推断查2表,当df=(2-1)(3-1)=2时, 20.05 5.99,现实得27.69420.05 ,则拒绝H0 ,接受HA ,说明三种农药对烟蚜的毒杀效果不一致。第53页,共70页,2022年,5月20日,3点1

16、5分,星期四简便计算公式甲乙丙合计死亡数未死亡数37(49.00)150(138.00)49(39.04)100(109.96)23(20.96)57(59.04)109307合54页,共70页,2022年,5月20日,3点15分,星期四第55页,共70页,2022年,5月20日,3点15分,星期四(三)rc列联表的独立性检验 行 列 12C合计12rO11O21Or1O12O22Or2O1cO2cOrcR1R2Rc合计C1C2CcT rc列联表是指r3、c 3的计数资料,上表是rc列联表的一般形式。df=(r-1)(c-1)1,故不需进行连续性矫正。第56页,共70

17、页,2022年,5月20日,3点15分,星期四rc列联表的计算公式:i = 1, 2, r j = 1, 2, , c第57页,共70页,2022年,5月20日,3点15分,星期四某医院用碘及治疗地方性甲状腺肿,不同年龄的治疗效果列于下表,试检验不同年龄的治疗效果有无差异?年龄(岁)治愈显效好转无效合计1130315050以上67321092311102023545917949合计109435314219不同年龄用碘剂治疗甲状腺肿效果比较第58页,共70页,2022年,5月20日,3点15分,星期四1. H0 :治疗效果与年龄无关; HA :治疗效果与年龄有关,即不同年龄治疗效果不同;2.给出

18、显著水平0.01第59页,共70页,2022年,5月20日,3点15分,星期四3.计算统计数2 :年龄(岁)治愈显效好转无效合计1130315050以上67321092311102023545917949合计109435314219第60页,共70页,2022年,5月20日,3点15分,星期四4.查2表,当df=(3-1)(4-1)6时,20.0116.81,所以246.98820.01, P0.01,应拒绝H0 ,接受HA,说明治疗效果与年龄有关。第61页,共70页,2022年,5月20日,3点15分,星期四适合性检验2检验独立性检验多组资料22列联表2c列联表rc列联表第62页,共70页,2022年,5月20日,3点15分,星期四多组资料第63页,共70页,2022年,5月20日,3点15分,星期四22列联表2c列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论