高二数学1-2 独立性检验_第1页
高二数学1-2 独立性检验_第2页
高二数学1-2 独立性检验_第3页
高二数学1-2 独立性检验_第4页
高二数学1-2 独立性检验_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 独立性检验教学重点、独立性检验的基本方法,独立性检验的步骤难点:基本思想的领会及方法应用知识点一、 独立性检验的基本概念和原理独立性检验是研究相关关系的方法。1.分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.比如男女、是否吸烟、是否患癌症,宗教信仰、国籍等等。2 列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个值,如吸烟与患肺癌的列联表:患病未患病合计吸烟37183220不吸烟21274295合计584575153.条形图为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例如图3.2一3 所示,在等高条形图中,浅色的

2、条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢?4.独立性检验的步骤为了回答下面问题,我们先假设H:吸烟与患肺癌没有关系,看看能够得到什么样的结论。不患肺癌患肺癌合计不吸烟aba+b吸烟cdc+d合计a+cb+da+b+c+d样本容量 n=a+b+c+d如果 “吸烟与患肺癌没有关系”,则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:若 H0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小根据表3一7中的数据,利用公式(1)计算得到 K “的观测值为,这

3、个值到底能告诉我们什么呢?统计学家经过研究后发现,在 H0成立的情况下,. (2)(2)式说明,在H0成立的情况下,的观测值超过 6. 635 的概率非常小,近似为0 . 01,是一个小概率事件现在的观测值56.632 ,远远大于6. 635,所以有理由断定H0不成立,即认为“吸烟与患肺癌有关系”但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99的把握认为“吸烟与患肺癌有关系” . 在上述过程中,实际上是借助于随机变量的观测值建立了一个判断H0是否成立的规则:如果6. 635,就判断H0不成立,即认为吸烟与患肺癌有关系;否则,就判断H0成立,即认为吸烟与患肺癌没有关系在该规则下,把

4、结论“H0 成立”错判成“H0 不成立”的概率不会超过, 即有99的把握认为H0不成立 你觉得和反证法有没有什么共同点?反证法假设检验要证明结论A备择假设H在A不成立的前提下进行推理在H不成立的条件下,即H成立的条件下进行推理推出矛盾,意味着结论A成立推出有利于H成立的小概率事件(概率不超过的事件)发生,意味着H成立的可能性(可能性为(1)很大没有找到矛盾,不能对A下任何结论,即反证法不成功推出有利于H成立的小概率事件不发生,接受原假设上例的解决步骤第一步:提出假设检验问题H:吸烟与患肺癌没有关系 H:吸烟与患肺癌有关系第二步:选择检验的指标(它越小,原假设“H:吸烟与患肺癌没有关系”成立的可

5、能性越大;它越大,备择假设“H:吸烟与患肺癌有关系”成立的可能性越大.第三步:查表得出结论P(k2>k)0.500.400.250.150.100.050.0250.0100.0050.001 k0.4550.7081.3232.0722.7063.845.0246.6357.87910.83注意:1观测值是的值 2假设没有关系,如果大,则H不成立,即两个量有关系。 如果小,说明没有足够证据证明H不成立,即两个量没有关系3.查表后,大于某个值的可能性很小,如果大于,则得出两个量有关系 4得到两个量有(没有)关系的结论是在概率基础上决定的,存在犯错误的概率5有99%的把握(相当于正确概率9

6、9%)认为 有关在犯错误的概率不超过1%的前提下,认为“ 有关”说明:95%就是概率,可以说成有95%的把握,这种事件出现的可能性极大5%当然也是概率,这种事件出现的可能性极小,在新闻中播报的水灾20年一遇,就是概率5%事件发生了题型一概念辨析例题 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A若K2的观测值为k6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能

7、性使得推判出现错误D以上三种说法都不正确A变式1下列关于独立性检验的说法中,错误的是()A独立性检验得到的结论一定正确B独立性检验依赖小概率原理C样本不同,独立性检验的结论可能有差异D独立性检验不是判定两事物是否相关的唯一方法考点:独立性检验的基本思想 分析:对选项进行判断,独立性检验取决于样本、独立性检验是依据小概率原理,用样本计算统计量的、样本不同,观测值统计量也不同、对于检验两个事件是否相关除了统计量外,还可以根据两个分类变量之间频率大小差异进行粗略判断,即可得出结论解答:解:因为独立性检验取决于样本,故结论不一定正确,即A不正确独立性检验是依据小概率原理,用样本计算统计量的,故正确;样

8、本不同,观测值统计量也不同,故正确;对于检验两个事件是否相关除了统计量外,还可以根据两个分类变量之间频率大小差异进行粗略判断,故正确故选:A点评:本题主要考查了独立性检验的定义和检验步骤,独立性检验的意义,属基础题A变式2 对于独立性检验,下列说法正确的是()AK2独立性检验的统计假设是各事件之间相互独立BK2可以为负值CK2独立性检验显示“患慢性气管炎和吸烟习惯有关”,这就是指“有吸烟习惯的人必定会患慢性气管炎”D2×2列联表中的4个数据可以是任意正数分析:利用独立性检验的定义和解题步骤逐一筛选四个选项即可解答:解:由独立性检验的检验步骤可知A正确;2×2列联表中的数据均

9、为正整数,故k2不可能为负值,排除B;K2独立性检验显示“患慢性气管炎和吸烟习惯有关”,是指有一定的把握说他们相关,或者说有一定的出错率,故排除C;2×2列联表中的4个数据是对于某组特定数据的统计数据,故四个数据间有一定的关系,故排除D故选 A点评:本题主要考查了独立性检验的定义和检验步骤,独立性检验的意义,属基础题A.变式3独立性检验中,假设H0:变量X与变量Y没有关系则在H0成立的情况下,估算概率P(K26.635)0.01表示的意义是()A变量X与变量Y有关系的概率为1%B变量X与变量Y没有关系的概率为99%C变量X与变量Y有关系的概率为99%D变量X与变量Y没有关系的概率为9

10、9.9%考点:实际推断原理和假设检验的应用 分析:根据所给的估算概率,得到两个变量有关系的可信度是1-0.01,即两个变量有关系的概率是99%,这里不用计算,只要理解概率的意义即可解答:解:概率P(K26.635)0.01,两个变量有关系的可信度是1-0.01=99%,即两个变量有关系的概率是99%,故选C点评:本题考查实际推断原理和假设检验的应用,本题解题的关键是理解所求出的概率的意义,本题是一个基础题B变式1 在独立性检验中,统计量2有两个临界值:3.841和6.635当23.841时,有95%的把握说明两个事件有关,当26.635时,有99%的把握说明两个事件有关,当23.841时,认为

11、两个事件无关在一项打鼾与患心脏病的调查中,共调查了2000人,经计算2=20.87根据这一数据分析,认为打鼾与患心脏病之间()A有95%的把握认为两者有关B约有95%的打鼾者患心脏病C有99%的把握认为两者有关D约有99%的打鼾者患心脏病考点:独立性检验的应用 分析:这是一个独立性检验理论分析题,根据K2的值,同所给的临界值表中进行比较,可以得到有99%的把握认为打鼾与心脏病有关解答:解:计算2=20.87有20.876.635,当26.635时,有99%的把握说明两个事件有关,故选C点评:考查独立性检验的应用,是一个典型的问题,注意解题时数字运算要认真,不要出错,本题不需要运算直接考查临界值

12、对应的概率的意义二独立性检验的应用题型二、独立性检验的应用例2为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:性别与喜欢数学课程列联表喜欢数学课程不喜欢数学课程总计男 37 85122女 35 143178总计 72 228300由表中数据计算得的观测值能够以95的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?请详细阐明得出结论的依据解: P(k2>k)0.500.400.250.150.100.050.0250.0100.0050.001 k0.4550.7081.3232.0722.7063.845.0246.6357

13、.87910.83在假设“性别与喜欢数学课之间没有关系”的前提下,事件A =3. 841的概率为P (3. 841) 0.05因此事件 A 是一个小概率事件而由样本数据计算得的观测值k=4.514,即小概率事件 A发生因此应该断定“性别与喜欢数学课之间有关系”成立,并且这种判断结果出错的可能性约为5 %所以,约有95的把握认为“性别与喜欢数学课之间有关系”.A变式1 某卫生机构对366人进行健康体检,阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有_的把握认为糖尿病患者与遗传有关系()A99.9%B99.5%C99% D97.5% 解

14、析可以先作出如下列联表(单位:人):糖尿病患者与遗传列联表糖尿病发病糖尿病不发病总计阳性家族史1693109阴性家族史17240257总计33333366根据列联表中的数据,得到K2的观测值为k6.067>5.024.P(k2>k)0.500.400.250.150.100.050.0250.0100.0050.001 k0.4550.7081.3232.0722.7063.845.0246.6357.87910.83故我们有97.5%的把握认为糖尿病患者与遗传有关系A变式2 在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较

15、,结果如表所示问:该种血清能否起到预防感冒的作用? 未感冒感冒合计使用血清258242500未使用血清216284500合计4745261000分析:在使用该种血清的人中,有的人患过感冒;在没有使用该种血清的人中,有的人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异解:提出假设:感冒与是否使用该种血清没有关系由列联表中的数据,求得P(k2>k)0.500.400.250.150.100.050.0250.0100.0050.001 k0.4550.7081.3232.0722.7063.845.0246

16、.6357.87910.83当成立时,的概率约为,我们有99%的把握认为:该种血清能起到预防感冒的作用 A变式 通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男女总计走天桥402060走斑马线203050总计6050110由,算得参照独立性检验附表,得到的正确结论是()A有99%的把握认为“选择过马路的方式与性别有关”B有99%的把握认为“选择过马路的方式与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”B变式1 媒体为调查

17、喜欢娱乐节目A是否与性格外向有关,随机抽取了500名性格外向的和500名性格内向的居民,抽查结果用等高条形图表示如下:(1)作出2×2列联表;(2)试用独立性检验的方法分析,能否在犯错的概率不超过0.001的前提下说明喜欢娱乐节目A与性格外向有关?考点:独立性检验的应用 分析:(1)由等高条形图可知,性格外向、性格内向的人中喜欢节目A的人数,可得2×2列联表;(2)计算K2,与临界值比较,即可得出结论解答:解:(1)由等高条形图可知,性格外向的人中喜欢节目A的有500×0.8=400人,性格内向的人中喜欢节目A的有500×0.5=250人,作2×

18、;2列联表如下 喜欢节目A喜欢节目B合计性格外向     400     100500性格内向      250     250 500合计     650     3501000(2)K2=1000×(400×250100×250)2500

19、5;500×650×35098.90110.828,能在犯错的概率不超过0.001的前提下说明喜欢娱乐节目A与性格外向有关点评:本题考查独立性检验的应用,本题解题的关键是正确理解观测值对应的概率的意义B变式2为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?有效无效合计口服584098注射643195合计12271193分析:在口服的病人中,有的人有效;在注射的病人中,有的人有效从直观上来看,口服与注射的病人的用药效果的有效率有一定的差异,能否认为用

20、药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明解:提出假设:药的效果与给药方式没有关系由列联表中的数据,求得当成立时,的概率大于,这个概率比较大,所以根据目前的调查数据,不能否定假设,即不能作出药的效果与给药方式有关的结论B.变式3 某中学采取分层抽样的方法从应届高三学生中按照性别抽取20名学生,其中8名女生中有3名报考理科,男生中有2名报考文科(1)是根据以上信息,写出2×2列联表(2)用独立性检验的方法分析,能否在犯错误的概率不超过0.05的前提下认为该中学的高三学生选报文理科与性别有关?考点:独立性检验的应用 分析:(1)根据抽取20名学生,其中8名女生中有3名报考理科,男生中有2名报考文科,即可得到列联表;(2)根据所给的表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,得到有95%以上的把握认为学生选报文理科与性别有关解答:解:(1)2×2列联表男生女生总计报考理科10313报考文科257总计12820(2)假设H0:报考文理科与性别无关则K2的估计值K2=20×(10×52×3)212×8×13×74.432因为p(K23.84)=0.05,所以我们

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论