版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独立性检验一、复习引入某药厂研制一种新药,宣称对治疗某种疾病的有效率为90%.随机选择了10名患者,经过使用该药治疗后,治愈的人数不超过六人.你是否怀疑药厂的宣传?请说明理由.问题1.1“药厂的宣传夸大了有效率”这一判断是否一定正确?为什么?问题1.2
这种假设检验与之前学习的什么方法比较类似?它们的相同点、不同点是什么?反证法假设检验相同点方法相同。假设检验和反证法都是在某种假设下推出矛盾,从而证明假设不成立或拒绝零假设。不同点结论一定正确假设检验给出的结论可能会出错,出错的概率可以控制在小概率内。例1
为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.解:用Ω表示两所学校的全体学生构成的集合.考虑以Ω为样本空间的古典概型.对于Ω中每一名学生,定义分类变量X和Y如下:881771合计45738乙校(X=1)431033甲校(X=0)优秀(Y=1)不优秀(Y=0)合计数学成绩学校
典例分析因此,甲校学生中数学成绩不优秀和数学成绩优秀的频率分别为可以用等高堆积条形图直观地展示上述计算结果:通过比较发现,两个学校学生抽样数据中数学成绩优秀的频率存在差异,甲校的频率明显高于乙校的频率.依据频率稳定于概率的原理,我们可以推断甲校学生数学成绩优秀的概率大于乙校学生数学成绩优秀的概率.乙校学生中数学成绩不优秀和数学成绩优秀的频率分别为
因此,可以认为两校学生的数学成绩优秀率存在差异,甲校学生的数学成绩优秀率比乙校学生的高.等高堆积条形图思考2:你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的?甲校学生中数学成绩优秀的频率为:乙校学生中数学成绩优秀的频率为:依据频率稳定于概率的原理,可推断P(Y=1|X=0)>P(Y=1|X=1).即甲校学生的数学成绩优秀率比乙校学生的高,故可认为两校学生的数学成绩优秀率存在差异.“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的.但有可能在随机抽取的样本中,两个频率间确实存在差异,但两校学生的数学成绩优秀率实际上是没有差别的.导致推断放错误的原因:①样本容量较小,导致频率与概率的误差较大;②样本具有随机性,因而频率有随机性,频率和概率之间存在误差;思考3:有多大的把握推断“学校与优秀率有关”?这个推断犯错误的可能性多大?希望能对出现错误推断的概率有一定的控制或估算.典例分析例1
为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.两校学生中数学成绩优秀率之间是否存在差异“所属学校”与“优秀与否”这两个分类变量是否相关联由于样本具有随机性,所以用频率判断得出的结论可能是错的,因此我们需要寻找更加合理的推断方法二、探索新知:独立检验之零假设探究:如何从概率的角度,研究两个分类变量是否有关联?研究“两个分类变量是否有关联”
研究?“两个分类变量是否互相影响”“两个分类变量是否互相独立”问题3:研究事件A、B是否相互独立,如果直接研究不方便,不妨做一个假设。从概率的角度思考:“假设独立”与“假设不独立”哪个更好?假设独立更好事件A、B相互独立提出零假设H0:“所属学校“与”优秀与否“无关(即事件A、B相互独立)二、探索新知:独立检验之零假设为了研究一般情况,把表格中的数字用字母代替,得到2x2列联表(表1)a+b+c+db+da+c合计c+ddc乙校()a+bba甲校(A)不优秀()优秀(B)合计数学成绩学校
写一写:在假设H0成立下,令n=a+b+c+d,请根据观测值表,写出下列事件的概率:零假设:”所属学校“与”优秀与否“无关(即事件A、B相互独立)写一写:在假设H0成立下,令n=a+b+c+d,请根据观测值表,写出下列事件的概率:零假设:”所属学校“与”优秀与否“无关(即事件A、B相互独立)算一算:令n=a+b+c+d,在假设H0成立下,填写下表(表2)中的频数的预测值:优秀不优秀甲校乙校想一想:在假设H0成立下,表1和表2相应位置上的数据应该是什么关系?如果没有此关系,可以下什么结论?二、探索新知:独立检验之统计量试一试:如果要找一个合理的统计量来衡量着两个表格对应数据之间的差异,进而推断假设H0是否成立,你觉得这个统计量应该怎么表示?卡方统计量XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d1900年,英国数学家卡尔.皮尔逊发布了
统计量,用来描述样本的实际观测值与理论推理之间的吻合程度.当
比较大时,推断零假设不成立,否则认为零假设成立。卡方统计量XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d思考:究竟大到什么程度,可以判断零假设不成立?根据小概率事件在一次试验中不大可能发生的规律,可以通过确定一个与H0相矛盾的小概率事件来实现,在假定H0的条件下,对于有放回简单随机抽样,当样本容量n充分大时,统计学家得到了χ2的近似分布.思考:究竟
大到什么程度,可以判断零假设不成立?
P(χ2≥xα)=α
我们称xα为α的临界值,这个临界值可以作为判断χ2大小的标准.
xαα概率值α越小,临界值xα越大.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值:基于小概率值α的检验规则:二、探索新知:独立检验追问3
怎么看这个表呢?二、探索新知:独立检验α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828追问3
怎么看这个表呢?思考:对于小概率值α=0.05,下面两个独立性检验说明什么?
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值:(1)χ2
≥x0.05=3.841(1)χ2
<
x0.05=3.841α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828追问3
怎么看这个表呢?
按α=0.1的卡方独立性检验,没有充分证据推断H0不成立(数学结论),可以认为X和Y独立(实际结论).
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值:典例解析典例解析
例1
采用简单随机抽样的方法得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.解:列2×2列联表零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优秀率无差异.根据上表中的数据,计算得到根据小概率值α=0.1的卡方独立性检验,没有充分证据推断H0不成立.因此可以认为H0成立,即认为两校的数学成绩优秀率没有差异.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828三、总结(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值比较.(3)根据检验规则得出推断结论.(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.总结上面的例子,应用独立性检验解决实际问题主要环节:注意,上述几个环节的内容可以根据不同的情况进行调整.例如,在有些时候,分类变量的抽样数据列联表是问题中给定的.例3某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
解:
零假设为H0:疗法与疗效独立,即两种疗法效果没有差异疗法疗效合计未治愈治愈甲155267乙66369合计21115136由已知数据列出2×2列联表,如下:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根据小概率值α=0.005的χ2独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两种疗法效果没有差异.典例解析典例解析问题5在例3的2×2列联表中,若对调两种疗法的位置或对调两种疗效的位置,则卡方计算公式中a,b,c,d的赋值都会相应地改变.这样做会影响χ2取值的计算结果吗疗法疗效合计未治愈治愈甲155267乙66369合计21115136对调前疗法疗效合计未治愈治愈乙66369甲155267合计21115136对调后这说明,对调两种疗法的位置,不会影响χ2取值的计算结果,同理对调两种疗效的位置也不会影响结果.巩固练习课本134页1.对于例3中的抽样数据,采用小概率值α=0.05的独立性检验,分析乙种疗法的效果是否比甲种疗法好.根据题意,可得解:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根据小概率值α=0.05的χ2独立性检验,推断H0不成立即认为两种疗法效果有差异.巩固练习课本134页2.根据同一抽查数据推断两个分类变量之间是否有关联,应用不同的小概率值,是否会得出不同的结论为什么解
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全微培训课程设计
- c语言课程设计函数分析
- 急性荨麻疹发热的护理评价
- 口才班展示课程设计
- 橡胶制品的销售渠道与分销网络考核试卷
- 用户体验设计在产品营销中的应用考核试卷
- 正常分娩期产妇的护理
- 矿山生态安全与生态保护考核试卷
- 皮革制品行业绿色生产与循环经济发展考核试卷
- 森林经营与管护的森林采伐与土地利用考核试卷
- 防汛应急抢险指挥与实务课件(PPT 89页)
- 农村信用社县级联社费用管控指导意见
- (完整版)八年级上综合性学习-我们的互联网时代-练习卷(含答案)
- 义务教育(数学)新课程标准(2022年修订版)
- 立式圆筒形钢制焊接储罐施工及验收规范》
- 地灾治理全套表格
- 质量事故管理考核办法.
- “同享阳光快乐成长”心理健康特色项目
- LG plc 应用指令手册
- PFMEA制程潜在失效模式及后果分析
- 契诃夫苦恼阅读训练及答案
评论
0/150
提交评论