版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
上节课例1
为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.881771合计45738乙校(X=1)431033甲校(X=0)优秀(Y=1)不优秀(Y=0)合计数学成绩学校
温故知新
依据频率稳定于概率的原理,我们可以推断甲校学生数学成绩优秀的概率大于乙校学生数学成绩优秀的概率,进而可以推断两校学生中数学成绩优秀率之间存在差异.【思考】你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的?
这一结论有可能是错误的.对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.
因此,需要找到一种更为合理的推断方法判断两变量之间有无关系,同时也希望能对出现错误推断的概率有一定的控制或估算.8.3.2 独立性检验独立性检验是假设检验中的一种方法,所谓假设检验,即建立某个假设,通过样本数据分析,进而接受原假设或者拒绝原假设,从而得出结论。小概率事件原理:小概率事件是发生概率一般不超过5%的事件,即小概率事件在一次试验中几乎不可能发生.【思考】在原假设H0成立基础上小概率事件几乎不可能发生,但若通过数据分析,发现小概率事件发生了,这说明什么问题?【探究】一个囚犯正在接受法官审判,你是法官.法官的任务是假定囚犯无罪,但是假如有足够证据证明囚犯有罪,则需审判囚犯有罪.1.原假设是什么?2.备择(对立)假设是什么?3.在什么情况下,法官会做出正确判决?4.在什么情况下,法官会做出错误判决?原假设是无罪,记为H0.备择假设是有罪,记为H1.在无罪的情况下判决无罪,在有罪的情况下判决有罪.在无罪的情况下判决有罪,在有罪的情况下判决无罪.创设情境假设检验就好像一场审判过程,有两类错误:陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确结论H0实际为真H0实际为假判断接受H0正确判断“取伪”错误判断拒绝H0“弃真”错误正确判断第一类错误,发生概率为α第二类错误,发生概率为βα与β呈反比关系假设检验可能犯错,但犯错概率可控,下面探究如何进行假设检验(独立性检验)。探究新知
考虑以Ω为样本空间的古典概型.设X和Y定义在Ω上,取值于{0,1}的成对分类变量.我们希望判断变量X和Y之间是否有关联,即X对Y是否有影响(或Y对X是否有影响).我们需要判断下面的假定关系是否成立,通常称H0为零假设或原假设.什么叫做分类变量X和Y独立?{X=0}与{Y=0}独立{X=0}与{Y=1}独立{X=1}与{Y=0}独立{X=1}与{Y=1}独立如果这些性质成立,我们就称分类变量X和Y独立.假定我们通过简单随机抽样得到了X和Y的抽样数据列联表如下:n=a+b+c+db+da+c合计c+ddcX=1a+bbaX=0Y=1Y=0合计YX
P(X=0)和P(Y=0)对应的频率的乘积为{X=0,Y=0}发生的频数的期望值为原假设成立,下面四个量值不应该太大构造一个合理科学的统计量卡方统计量卡方统计量有什么用呢?思考:那么,究竟
χ2大到什么程度,可以推断H0不成立呢?
统计学家建议,用随机变量
χ2取值
的大小作为判断零假设H0是否成立的依据,当它比较大时推断H0不成立,否则认为H0成立.
根据小概率事件在一次试验中不大可能发生的规律,上面的想法可以通过确定一个与H0相矛盾的小概率事件来实现.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值:例如,对于一个小概率值α=0.05,有如下的具体检验规则:(1)当时,我们推断H0不成立,即认为X与Y不独立,该推断犯错误的概率不超过0.05;
(2)当时,我们没有充分证据推断H0不成立,可以认为X与Y独立.基于小概率值α的检验规则:
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.典例分析:思考:依据小概率值α=0.1的χ2独立性检验,分析例1中的抽样数据,能否据此推断两校学生的数学成绩优秀率有差异?881771合计45738乙校(X=1)431033甲校(X=0)优秀(Y=1)不优秀(Y=0)合计数学成绩学校
解:零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优秀率无差异根据表中的数据,计算得到根据小概率值α=0.1的卡方独立性检验,没有充分证据推断H0不成立.因此可以认为H0成立,即认为两校的数学成绩优秀率没有差异.思考:为何基于同一组数据的分析,却得出了不同的结论,你能说明其中的原因吗?事实上,如前所述,法一只是根据一个样本的两个频率的差异得出两校学生的数学成绩优秀率存在差异的结论,并没有考虑由样本随机性可能导致的错误,所以那里的推断依据不太充分.探究新知在法二中,我们用χ2独立性检验对零假设H0进行了检验.通过计算,发现χ2≈0.837小于α=0.1所对应的临界值2.706,因此认为没有充分证据推断H0不成立,所以接受H0,推断出校的数学成绩优秀率没有差异的结论.这个检验结果意味着,抽样数据中两个频率的差异很有可能是由样本随机性导致的.因此,只根据频率的差异得出两校学生的数学成绩优秀率存在差异的结论是不可靠的.【例1】第24届冬季奥林匹克运动会于2022年在北京举办,为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计,得到如下2×2列联表:
关注冰雪运动不关注冰雪运动合计男451055女252045合计7030100下列说法正确的是参考公式:χ2=
,其中n=a+b+c+d.典例分析附表:α0.1000.0500.0100.001xα2.7063.8416.63510.828A.依据小概率值α=0.01的独立性检验,认为“关注冰雪运动与性别有关”B.依据小概率值α=0.01的独立性检验,认为“关注冰雪运动与性别无关”C.在犯错误的概率不超过1%的前提下,认为“关注冰雪运动与性别无关”D.在犯错误的概率不超过0.1%的前提下,认为“关注冰雪运动与性别有关”√【练】(1)(多选)某机构通过抽样调查,利用2×2列联表和χ2统计量研究患肺病是否与吸烟有关,计算得χ2=3.305,经查对临界值表知P(χ2≥2.706)≈0.10,P(χ2≥3.841)≈0.05,现给出四个结论,其中正确的是A.因为χ2>2.706,故依据小概率值α=0.1的独立性检验,我们认为“患肺
病与吸烟有关”B.因为χ2<3.841,故依据小概率值α=0.05的独立性检验,认为“患肺病
与吸烟有关”C.因为χ2>2.706,故依据小概率值α=0.1的独立性检验,我们认为“患肺
病与吸烟无关”D.因为χ2<3.841,故依据小概率值α=0.05的独立性检验,认为“患肺病
与吸烟无关”√√(2)(多选)某研究所为了检验新开发的疫苗的预防作用,对1000名注射了疫苗的人与另外1000名未注射疫苗的人的一年的健康记录进行比较,并提出假设:这种疫苗不能起到预防该疾病的作用,并计算出P(χ2≥6.635)≈0.01,则下列说法不正确的是A.这种疫苗能起到预防该疾病的作用的有效率为1%B.若某人未使用该疫苗,则他在半年内有99%的可能性得该疾病C.依据小概率值α=0.01的独立性检验,认为这种疫苗能起到预防该疾病
的作用D.在犯错误的概率不超过0.01的前提下,认为这种疫苗能起到预防该疾
病的作用√√【例2】某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.将所给数据进行整理,得到两种疗法治疗数据的列联表.1361152169636675215治愈未治愈合计疗效合计乙甲疗法
根据列联表中的数据,经计算得到根据小概率值α=0.005的χ2独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两种疗法效果没有差异.
疗法疗效合计未治愈治愈乙66369甲155267合计21115136疗法疗效合计治愈未治愈甲521567乙63669合计11521136
典例分析吸烟肺癌合计非肺癌患者肺癌患者非吸烟者7775427817吸烟者2099492148合计9874919965【练】为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法,调查了9965人,得到成对样本观测数据的分类统计结果,如下表所示.依据小概率值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险.解:零假设H0:吸烟与患肺癌之间无关联根据小概率值α=0.001的卡方独立性检验,推断H0不成立,因此可以吸烟与患肺癌之间有关联,此推断犯错误的概率不大于0.001.根据列联表中的数据,经计算得到用频率计算再次进行比较:典例分析不吸烟者中患肺癌的频率为吸烟者中患肺癌的频率为两者的比值为可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌的频率的4倍以上.于是,根据频率稳定于概率的原理,我们可以认为吸烟者中患肺癌的概率明显大于不吸烟者中患肺癌的概率,即吸烟更容易引发肺癌.(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值比较.(3)根据检验规则得出推断结论.(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.归纳总结应用独立性检验解决实际问题主要环节:注意,上述几个环节的内容可以根据不同的情况进行调整.例如,在有些时候,分类变量的抽样数据列联表是问题中给定的.思考:独立性检验的思想类似于我们常用的反证法,你能指出二者之间的相同和不同之处吗?概率辨析反证法独立性检验在某种假设H0下,如果推出一个矛盾,则证明H0不成立;若未能推出矛盾,不能对H0下任何结论,即反证法不成功在零假设H0下,如果出现一个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- pwc -引领未来的数字化领导力模型
- 海-气相互作用和环流异常(讲义)-2025年高考地理一轮复习
- 2024年文教体育用品项目投资申请报告代可行性研究报告
- 2023年炮塔式铣床资金筹措计划书
- 强化管理-有效教育-交通安全-常抓不懈1
- 经济数学-教学日历
- Python程序设计实践- 习题及答案汇 张银南 ch01-21 Python程序设计实验的目的与要求- 中文词云
- 关于青春无悔演讲稿范文分享(33篇)
- 设计单元教学计划
- 【沪科】第三次月考卷
- 2025年蛇年春联带横批-蛇年对联大全新春对联集锦
- 山东省菏泽市牡丹区2023-2024学年七年级上学期期中数学试题(含解析)
- 国家开放大学《比较初等教育》终结性考核大作业参考答案
- 西师大版数学五年级上册 小数混合运算
- 南京某校2023-2024四年级上册语文期中试卷
- 中国普通食物营养成分表(修正版)
- 《大学生创新创业教育》教案 项目5 组建创业团队
- 第12课 明朝的兴亡【知识精研】 《中国历史》 中职中专 高效课堂课件
- 99版-干部履历表-A4打印
- 小学道德与法治-天下兴亡匹夫有责的爱国情怀教学设计学情分析教材分析课后反思
- 广东省通用安装工程综合定额(2018)Excel版
评论
0/150
提交评论