




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
非参数检验检验第一页,共七十页,2022年,8月28日χ2分布χ2分布是由正态分布推导出来的一种连续型随机变量的概率分布数学形式:χ2~χ2(k),k是自由度,表示定义式独立变量的个数。设随机变量x1,x2,…,xk相互独立且都服从正态分布N(μ,σ2)。将它们标准化转变为标准正态变量U1,U2,…,Uk,k个独立标准正态变量的平方和被定义为χ2分布的随机变量χ2。第二页,共七十页,2022年,8月28日χ2
检验(Chi-squaretest)
对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。一、χ2检验的定义χ2检验第三页,共七十页,2022年,8月28日χ2检验与测量数据假设检验的区别测量数据的假设检验,其数据属于连续变量,而χ2检验的数据属于点计而来的间断变量。测量数据所来自的总体要求呈正态分布,而χ2检验的数据所来自的总体分布是未知的。测量数据的假设检验是对总体参数或几个总体参数之差所进行的假设检验,而χ2
检验在多数情况下不是对总体参数的检验,而是对总体分布的假设检验。第四页,共七十页,2022年,8月28日二、χ2检验与连续型资料假设检验的区别对总体参数或几个总体参数之差不是对总体参数的检验,而是对总体分布的假设检验正态分布总体分布是未知的连续型资料离散型资料检验对象总体数据资料连续型资料假设检验χ2
检验第五页,共七十页,2022年,8月28日三、χ2检验的用途适合性检验独立性检验同质性检验第六页,共七十页,2022年,8月28日适合性检验(吻合度检验)是指对样本的理论数先通过一定的理论分布推算出来,然后用实际观测值与理论数相比较,从而得出实际观测值与理论数之间是否吻合。因此又叫吻合度检验。适合性检验的零假设是观测次数与理论次数之间无差异。其中理论次数的计算一般是根据某种理论,按一定的概率通过样本即实际观测次数来计算。这里所说的某种理论,可能是经验规律,也可能是理论分布。确定理论次数是卡方检验的关键。第七页,共七十页,2022年,8月28日是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立。独立性检验第八页,共七十页,2022年,8月28日在连续型资料的假设检验中,对一个样本方差的同质性检验,也需进行χ2
检验。同质性检验第九页,共七十页,2022年,8月28日χ2检验的原理与方法χ2检验的基本原理χ2检验统计量的基本形式χ2值的特点χ2检验的基本步骤χ2检验的注意事项第十页,共七十页,2022年,8月28日
χ2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。实际观测值与理论推算值之间的偏离程度就决定其χ2值的大小。理论值与实际值之间偏差越大,χ2值就越大,越不符合;偏差越小,χ2值就越小,越趋于符合;若两值完全相等时,χ2值就为0,表明理论值完全符合。第十一页,共七十页,2022年,8月28日理论值观测值ⅠⅡⅢ第十二页,共七十页,2022年,8月28日χ2检验统计量的基本形式χ2=∑(Oi-Ei)2
EiO--实际观察的频数(observationalfrequency)E--无效假设下的期望频数(expectationfrequency)k第十三页,共七十页,2022年,8月28日性别观察值(O)理论值(E)O-E公母428448438438-10+10合计8768760876只羔羊性别调察抽样误差?实质性变化?第十四页,共七十页,2022年,8月28日
要回答这个问题,首先需要确定一个统计量,将其用来表示实际观测值与理论值偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。
判断实际观测值与理论值偏离的程度,最简单的办法是求出实际观测值与理论值的差数。第十五页,共七十页,2022年,8月28日性别观察值(O)理论值(E)O-E公母428448438438-10+10合计876876羔羊性别观察值与理论值
由于差数之和正负相消,并不能反映实际观测值与理论值相差的大小。0第十六页,共七十页,2022年,8月28日
为了弥补这一不足,可先将实际观测值与理论值的差数平方,即(O-E)2,再用差数的平方除以相应的理论值,将之化为相对数,从而来反映(O-E)2
的比重,最后将各组求和,这个总和就是χ2
。第十七页,共七十页,2022年,8月28日羔羊性别观测值与理论值性别观测值(O)理论值(E)O-E(O-E)2/E公母428448438438-10+100.22830.2283合计87687600.4566χ2=∑(Oi-Ei)2
Ei
χ2值就等于各组观测值和理论值差的平方与理论值之比,再求其和。第十八页,共七十页,2022年,8月28日χ2值的特点可加性非负值随O和E而变化χ2=∑(Oi-Ei)2
Ei第十九页,共七十页,2022年,8月28日
χ2值与概率P成反比,χ2值越小,P值越大,说明实际值与理论值之差越小,样本分布与假设的理论分布越相一致;
χ2越大,P值越小,说明两者之差越大,样本分布与假设理论分布越不一致。第二十页,共七十页,2022年,8月28日观测值与理论值的差异由抽样误差引起,即观测值=理论值。同时给出相就的备择假设HA
:观测值与理论值的差值不等于0,即观测值≠理论值一般确定为0.05或0.011.提出无效假设H02.确定显著水平α基本步骤第二十一页,共七十页,2022年,8月28日3.计算样本的χ2值4.进行统计推断χ2
<
χ2αP>αχ2
>χ2αP<αH0HAH0HA第二十二页,共七十页,2022年,8月28日1、任何一组的理论次数Ei都必须大于5,如果Ei≤5,则需要合并理论组或增大样本容量以满足Ei
>52、在自由度=1时,需进行连续性矫正,其矫正的χ2c为:χ2c=∑(Oi-Ei-
0.5
)2
Eiχ2检验的注意事项第二十三页,共七十页,2022年,8月28日χ2分布是连续型变量的分布,每个不同的自由度都有一个相应的χ2分布曲线,所以其分布是一组曲线。第二十四页,共七十页,2022年,8月28日
由于检验的对象-次数资料是间断性的,而χ2分布是连续型的,检验计算所得的χ2值只是近似地服从χ2分布,所以应用连续型的χ2分布的概率检验间断性资料所得的χ2值就有一定的偏差。
由次数资料算得的χ2均有偏大的趋势,即概率偏低。当df=1,尤其是小样本时,必须作连续性矫正。χ2c
=∑(Oi-Ei-
0.5
)2
Ei第二十五页,共七十页,2022年,8月28日比较观测数与理论数是否符合的假设检验。适合性检验定义适合性检验适合性检验的df由于受理论值的总和等于观测值总和这一条件的约束,故df=n-1第二十六页,共七十页,2022年,8月28日例:国际柑橘协会讨论会宣布,每12个柑橘中,有一个坏的是霉菌引起的。从某地区抽取的132个柑橘中霉菌变质的柑橘有4个,问该地区柑橘霉菌感染变质与上述比例是否有显著差异?按国际柑橘协会讨论会的统计结果,132个柑橘应该有132/12=11人是霉菌感染变质的,剩下的121个非变质柑橘,代入公式有:
因此,在0.05和显著性水平下,该地区被霉菌感染柑橘变质比率与国际柑橘讨论会的统计结果有显著差异,显然根据比例可知该地区柑橘霉菌感染率小于国际柑橘协会讨论会的统计结果。第二十七页,共七十页,2022年,8月28日例:在英语四级考试中,某学生做对了80个四择一选择题中的28题,现在要判断该生是否是完全凭猜测做题假如该生完全凭猜测做题,那么平均而言每道题做对的可能性是1/4,因此80个题中平均而能做对80/4=20题,代入公式有:
因此,该生可能会做一些题。第二十八页,共七十页,2022年,8月28日体色青灰色红色总数子代观测尾数1503991602鲤鱼遗传试验子代观测结果(1)H0:鲤鱼体色子代分离符合3:1比率;
HA:鲤鱼体色子代分离不符合3:1比率;
例:鲤鱼体色子代分离是否符合3:1比率第二十九页,共七十页,2022年,8月28日(2)取显著水平α=0.05(3)计算统计数χ2
:df=k-1=2-1=1在无效假设H0正确的前提下,青灰色的理论数为:Ei
=1602×3/4=1201.5红色理论数为:
Ei
=1602×1/4=400.5需要连续性校正第三十页,共七十页,2022年,8月28日χ2=∑(Oi-Ei-
0.5
)2
Eii=12=+(1503-1201.5
-
0.5
)2
1201.5(99-400.5
-
0.5
)2
400.5=75.41+226.22=301.63(4)查χ2值表,当df=1时,χ20.05
=3.84。现实得χ2c
=301.63>χ20.05
,故应否定H0
,接受HA
,即认为鲤鱼体色子代分离不符合3:1比率。第三十一页,共七十页,2022年,8月28日
对于资料组数多于两组的值,还可以通过下面简式进行计算:Oi
-第i组的实际观测数
pi
-第i组的理论比率
n-总次数
第三十二页,共七十页,2022年,8月28日独立性检验独立性检验的定义2×2列联表的独立性检验2×c列联表的独立性检验r×c列联表的独立性检验第三十三页,共七十页,2022年,8月28日独立性检验(independencetest)又叫列联表(contigencytable)χ2检验,它是研究两个或两个以上因子彼此之间是独立还是相互影响的一类统计方法。第三十四页,共七十页,2022年,8月28日(一)2×2列联表的独立性检验
设A,B是一个随机试验中的两个事件,其中A可能出现r1
、r2个结果,B可能出现c1、c2个结果,两因子相互作用形成4格数,分别以O11
、O12、O21
、O22表示,下表是2×2列联表的一般形式第三十五页,共七十页,2022年,8月28日
行列c1c2总和r1r2O11O21O12O22R1=O11+O12R2=O21+O22总和C1=O11+O21C2=O12+O22T2×2列联表的一般形式第三十六页,共七十页,2022年,8月28日检验步骤1.提出无效假设H0
:事件A和事件B无关,同时给出HA
:事件A和事件B有关联关系;2.给出显著水平α3.依据H0
,可以推算出理论数,计算χ2值4.确定自由度,df=(r-1)(c-1),进行推断。H0HAH0HAχ2
>χ2αP<αP>αχ2
<χ2α第三十七页,共七十页,2022年,8月28日例:有一调查以研究消费者对“有机”食品和常规食品的态度.在超级市场随机选择50个男性和50个女性消费者,问他们更偏爱哪类食品,结果如下.性别“有机”常规总数男性104050女性203050总数3070100第三十八页,共七十页,2022年,8月28日例:有一调查以研究消费者对“有机”食品和常规食品的态度.在超级市场随机选择50个男性和50个女性消费者,问他们更偏爱哪类食品,结果如下.性别“有机”常规总数男性10(15)40(35)50女性20(15)30(35)50总数3070100第三十九页,共七十页,2022年,8月28日1.提出假设.H0:性别与对食品的偏爱无关HA:性别与对食品的偏爱有关2.确定显著水平.(=0.05)3.检验计算.4.统计推断.0.052=3.84,由于c20.052,所以应该否定H0而接受HA,即性别与对食品的偏爱有关,男女消费者对两类食品有不同的态度.第四十页,共七十页,2022年,8月28日给药方式有效无效总数有效率口服注射5864403198(R1)95(R2)59.2%67.4%总数122(C1)71(C2)193(T)给药方式与给药效果的2×2列联表1.H0
:给药方式与给药效果相互独立。HA
:给药方式与给药效果有关联。2.给出显著水平α=0.05第四十一页,共七十页,2022年,8月28日3.根据H0,运用概率乘法法则:事件A与事件B同时出现的概率为:P(AB)=P(A)P(B)口服与有效同时出现的理论频率=口服频率×有效频率,即P(AB)=P(A)P(B)=98/193×122/193理论频数Ei=理论频率×总数=(98/193×122/193)×193=(98×122)/193=61.95即Eij=Ri×Cj/T=行总数×列总数/总数第四十二页,共七十页,2022年,8月28日E11=R1×C1/T=61.95E12=R1×C2/T=36.05E21=R2×C1/T=60.05E22=R2×C2/T=34.95给药方式有效无效总数口服注射58(61.95)64(60.05)40(36.05)31(34.95)98(R1)95(R2)总数122(C1)71(C2)193(T)给药方式与给药效果的2×2列联表第四十三页,共七十页,2022年,8月28日计算χ2值:由于df=(r-1)(c-1)=(2-1)(2-1)=1,故所计算的χ2值需进行连续性矫正:给药方式有效无效总数口服注射58(61.95)64(60.05)40(36.05)31(34.95)98(R1)95(R2)总数122(C1)71(C2)193(T)第四十四页,共七十页,2022年,8月28日4.查χ2表,当df=1时,χ20.05
=3.841,而χ2c=0.863<χ20.05
,P>0.05,应接受H0
,拒绝HA
,说明给药方式与给药效果相互独立.第四十五页,共七十页,2022年,8月28日2×2列联表的χ2检验可利用以下简式而不必计算理论次数:T/2-为矫正数第四十六页,共七十页,2022年,8月28日给药方式有效无效总数口服注射5864403198(R1)95(R2)总数122(C1)71(C2)193(T)第四十七页,共七十页,2022年,8月28日(二)2×c列联表的独立性检验行列12C合计12O11O21O12O22O1cO2cR1R2合计C1C2CcT2×c列联表的一般形式由于df=(2-1)(c-1)≥2,故计算值时不需作连续性矫正第四十八页,共七十页,2022年,8月28日检测甲、乙、丙三种农药对烟蚜的毒杀效果,结果如下,使分析这三种农药对烟蚜的毒杀效果是否一致?甲乙丙合计死亡数未死亡数37150491002357109307合种农药毒杀烟蚜的死亡情况第四十九页,共七十页,2022年,8月28日1.H0
:对烟蚜毒杀效果与农药无关,农药类型间互相独立;HA
:二者有关2.取显著水平α=0.053.统计数的计算第五十页,共七十页,2022年,8月28日第五十一页,共七十页,2022年,8月28日理论值的计算:甲乙丙合计死亡数未死亡数37(49.00)150(138.00)49(39.04)100(109.96)23(20.96)57(59.04)109307合2值的计算:第五十二页,共七十页,2022年,8月28日(4)查χ2值表,进行推断查χ2表,当df=(2-1)(3-1)=2时,χ20.05=5.99,现实得χ2=7.694>χ20.05,则拒绝H0
,接受HA
,说明三种农药对烟蚜的毒杀效果不一致。第五十三页,共七十页,2022年,8月28日简便计算公式甲乙丙合计死亡数未死亡数37(49.00)150(138.00)49(39.04)100(109.96)23(20.96)57(59.04)109307合五十四页,共七十页,2022年,8月28日第五十五页,共七十页,2022年,8月28日(三)r×c列联表的独立性检验行列12C合计12rO11O21Or1O12O22Or2O1cO2cOrcR1R2Rc合计C1C2CcT
r×c列联表是指r≥3、c≥3的计数资料,上表是r×c列联表的一般形式。df=(r-1)(c-1)>1,故不需进行连续性矫正。第五十六页,共七十页,2022年,8月28日r×c列联表的计算公式:i=1,2,…,rj=1,2,…,c第五十七页,共七十页,2022年,8月28日某医院用碘及治疗地方性甲状腺肿,不同年龄的治疗效果列于下表,试检验不同年龄的治疗效果有无差异?年龄(岁)治愈显效好转无效合计11~3031~5050以上67321092311102023545917949合计109435314219不同年龄用碘剂治疗甲状腺肿效果比较第五十八页,共七十页,2022年,8月28日1.H0
:治疗效果与年龄无关;HA
:治疗效果与年龄有关,即不同年龄治疗效果不同;2.给出显著水平α=0.01第五十九页,共七十页,2022年,8月28日3.计算统计数χ2
:年龄(岁)治愈显效好转无效合计11~3031~5050以上67321092311102023545917949
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 五金店新零售模式探索与实施策略考核试卷
- 工程设计规范与标准考核试卷
- 机织运动服装在运动康复中的角色考核试卷
- 技术服务多元化战略与市场拓展考核试卷
- 服装行业大数据分析应用考核试卷
- 户外登山鞋租赁与保养常识考核试卷
- 中小学生手卫生课件
- 施工电梯备案合同范本
- 劳务永久合同范本
- 宠物购买意向合同范本
- 注册安全工程师安全生产技术培训讲义课件
- 美发店承包合同范本(2篇)
- 2023年苏州健雄职业技术学院单招考试面试题库及答案解析
- 公司组织架构图(可编辑模版)
- 人教版六年级科学下册教案全册
- TCITSA 24-2022 基于ETC的高速公路自由流收费技术规范
- 叉车装卸区域安全风险告知牌
- 2022届江苏省南京师范大学附属中学高三(下)考前最后一模物理试题(解析版)
- 《普通生物学教案》word版
- 贵州省就业失业登记表
- 预防电信诈骗网络诈骗讲座PPT幻灯片课件
评论
0/150
提交评论