高中数学人教A版2本册总复习总复习(全国一等奖)_第1页
高中数学人教A版2本册总复习总复习(全国一等奖)_第2页
高中数学人教A版2本册总复习总复习(全国一等奖)_第3页
高中数学人教A版2本册总复习总复习(全国一等奖)_第4页
高中数学人教A版2本册总复习总复习(全国一等奖)_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.2独立性检验的基本思想及其初步应用eq\x(基)eq\x(础)eq\x(梳)eq\x(理)1.分类变量的定义.如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.2×2列联表.一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d3.独立性检验.,eq\x(基)eq\x(础)eq\x(自)eq\x(测)1.下列变量中不属于分类变量的是(B)A.性别B.吸烟C.宗教信仰D.国籍解析:“吸烟”不是分类变量,“是否吸烟”才是分类变量.故选B.2.下面是一个2×2列联表y1y2合计x1a2173x222527合计b46100则表中a、b的值分别为(C)A.94、96B.52、50C.52、54D.54、52解析:由a+21=73,得a=52,由b+46=100,得b=54.3.某高校“统计初步”课程的教师随机调查了选修该课程的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2=eq\f(50×(13×20-10×7)2,23×27×20×30)≈>,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为____________.解析:P(K2>=,判断出错的可能性为5%.答案:5%eq\a\vs4\al((一)重点)通过案例理解分类变量、列联表、独立性检验的含义,利用列联表的独立性检验进行估计.eq\a\vs4\al((二)难点)独立性检验的基本思想,随机变量K2的含义.eq\a\vs4\al((三)知识结构图)eq\a\vs4\al((三)思维总结)(1)直观分析的两种方法.①频率分析.通过对样本的每个分类变量的不同类别和事件发生的频率的大小比较来分析变量之间是否有关系,通常通过列联表列出两个分类变量进行分析.一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:yxy1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d在列联表中,如果两个分类变量没有关系,则应该满足ad-bc≈0.因此|ad-bc|越小,说明两个分量之间的关系越弱;|ad-bc|越大,说明两个分类变量之间的关系越强.②图形分析.利用等高条形图来分析两分类变量之间是否具有相关关系,形象、直观地反映两个分类变量之间的总体状态和差异大小,进而推断它们之间是否有关系.a.绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的,两列的数据对应不同颜色.b.等高条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显eq\b\lc\(\rc\)(\a\vs4\al\co1(即\f(a,a+b)和\f(c,c+d)相差很大)),就判断两个分类变量之间有关系.(2)独立性检验及其基本思想.①独立性检验.利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.利用上诉公式求出K2的观测值为k=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).再得出X与Y有关系的程度,通常用到以下数据:(i)如果k>,在犯错误的概率不超过的前提下认为X与Y有关系;(ii)如果k>,在犯错误的概率不超过的前提下认为X与Y有关系;值得注意的是:观察值k越大,越有利于结论“X和Y有关系”,越小越有利于结论“X和Y没有关系”.因此,可以建立一定的规则:当k≥k0时就说X与Y有关系,k<k0时就说X和Y没有关系,故求得观测值后只要与建立的规则进行比较即可得出结论.②独立性检验的基本思想.独立性检验的基本思想是要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观察数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(k≥≈来评价假设不合理的程度,由实际计算出k>,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信度为99%,不合理的程度可查下表得出:1.独立性检验是对两个分类变量间是否有关系的一种案例分析方法,其分析方法有:等高条形图法和利用假设的思想方法,计算出某一个随机变量K2的观测值来进行判断.2.在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例为eq\f(a,a+b),也可以估计满足条件X=x2的个体中具有Y=y2的个体所占的比例为eq\f(c,c+d),两个比例的值相差越大,两个分类变量相关的可能性就越大.3.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表;(2)根据公式K2=eq\f(n(ad-bc)2,(a+b)(a+c)(b+d)(c+d))计算K2的观测值;(3)比较K2与临界值的大小关系作统计推断.1.在等高条形图形中,下列哪两个比值相差越大,“两个分类变量有关系”成立的可能性越大(C)\f(a,a+b)与eq\f(d,c+d)\f(c,a+b)与eq\f(a,c+d)\f(a,a+b)与eq\f(c,c+d)\f(a,a+b)与eq\f(c,b+c)2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表;男女合计爱好402060不爱好203050总计6050110由K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))算得,K2=eq\f(110(40×30-20×20)2,60×50×60×50)≈.附表:P(F2≥k0)k0参照附表,得到的正确结论是(A)A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别无关”3.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:专业性别非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中数据得到,k=eq\f(50(13×20-10×7)2,20×30×23×27)≈,因为k>,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为________.解析:∵k=>,∴有95%的把握可以确定主修统计专业与性别有关,那么这种判断出错的可能性为5%.答案:5%1.在研究两个分类变量之间是否有关系时,可以粗略地判断两个分类变量是否有关的是(B)A.散点图B.等高条形图C.2×2列联表D.以上均不对2.对分类变量X与Y的随机变量K2的观测值k,说法正确的是(B)A.k越大,“X与Y有关系”可信程度越小B.k越小,“X与Y有关系”可信程度越小C.k越接近0,“X与Y无关”程度越小D.k越大,“X与Y无关”程度越大3.下面是一个2×2列联表:y1y2总计x1522173x22ab总计5446100则表中a、b的值分别是(C)A.94、96B.25、21C.25、27D.27、254.分类变量x和y的列联表如下,则(C)y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d-bc越小,说明x与y的关系越弱B.ad-bc越大,说明x与y的关系越弱C.(ad-bc)2越大,说明x与y的关系越强D.(ad-bc)2越小,说明x与y的关系越强解析:由K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))知,(ad-bc)2越大,K2值越大,说明x与y的关系越强.5.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多总数喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总数262450则认为喜欢玩电脑游戏与认为作业多少有关系的把握大约为(B)A.99%B.95%C.90%D.无充分依据解析:由表中数据计算K2=eq\f(50×(18×15-8×9)2,26×24×27×23)≈,而K2=>,所以约有95%的把握认为两变量之间有关.6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14天内的结果如下表所示:死亡存活合计第一种剂量141125第二种剂量61925合计203050进行统计分析时的统计假设是________.解析:根据独立性检验的基本思想,可知其类似反证法,即要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,对本题,进行统计分析时的统计假设应是“小白鼠的死亡与剂量无关”.答案:小白鼠的死亡与剂量无关7.(2023·韶关二模)以下四个命题中:①在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样;②样本数据3,4,5,6,7的方差为2;③对于相关系数r。|r|越接近1,则线性相关程度越强;④通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:男女总计走天桥402060走斑马线203050总计6050110由K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))可得,K2=eq\f(110×(40×30-20×20)2,60×50×60×50)=,则有99%以上的把握认为“选择过马路方式与性别有关”.附表:P(K2≥k0)k0其中正确命题的序号是________.答案:②③④8.某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:类别性别不喜欢语文喜欢语文男1310女720为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到K2的观测值k=eq\f(50×(13×20-10×7)2,23×27×20×30)≈,因为k≥,根据下表中的参考数据:P(K2≥k0)k0P(K2≥k0)k0判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为________.答案:5%9.调查某班学生,按性别和籍贯分类得调查表如下:天津非天津合计男122840女61925合计184765性别对籍贯的影响中,可信度小于________.解析:k=eq\f(65(12×19-28×6)2,40×25×18×47)≈∵<,∴查表可知小于.答案:50%10.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动,你能否判断性别与休闲方式是否有关系?解析:首先建立列联表如下休闲方式为看电视休闲方式为运动合计女性432770男性213354合计6460124∵a=43,b=27,a+b=70,c=21,d=33,c+d=54,a+b+c+d=124,a+c=64,b+d=60,∴k=eq\f(n(ad+bc)2,(a+b)(c+d)(a+c)(b+d))=eq\f(124×8522,14515200)≈>,即有%的把握认为休闲方式与性别有关.11.(2023·深圳二模)2023年3月14日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相关数据如下表:混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂25530使用未经淡化海砂151530总计402060(1)根据表中数据,利用独立性检验的方法判断,能否在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?(2)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,则取出的2个样本混凝土耐久性都达标的概率是多少?参考数据:P(K2≥k)k解析:(1)提出假设H0:使用淡化海砂与混凝土耐久性是否达标无关.根据表中数据,求得K2的观测值k=eq\f(60×(25×15-15×5)2,302×40×20)=>.查表得P(K2≥=.∴能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.(2)用分层抽样的方法在使用淡化海砂的样本中抽取6个,其中应抽取“混凝土耐久性达标”的为eq\f(25,30)×6=5,“混凝土耐久性不达标”的为6-5=1,“混凝土耐久性达标记”为A1,A2,A3,A4,A5”;“混凝土耐久性不达标”的记为B.在这6个样本中任取2个,有以下几种可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15种.设“取出的2个样本混凝土耐久性都达标”为事件A,它的对立事件eq\o(A,\s\up6(-))为“取出的2个样本至少有1个混凝土耐久性不达标”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5种可能.∴P(A)=1-P(eq\o(A,\s\up6(-)))=1-eq\f(5,15)=eq\f(2,3).即取出的2个样本混凝土耐久性都达标的概率是eq\f(2,3).12.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.左下表是甲流水线样本频数分布表,右下图是乙流水线样本的频率分布直方图.甲流水线样本频数分布表(1)根据上表数据作出甲流水线样本的频率分布直方图;(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率;(3)由以上统计数据完成下面2×2列联表,能否在犯错误的概率不超过的前提下认为产品的包装质量与两条自动包装流水线的选择有关?甲流水线乙流水线合计合格品a=b=不合格品c=d=合计n=附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))P(K2≥k0)k0解析:(1)甲流水线样本的频率分布直方图如下:(2)由题表知甲样本中合格品数为8+14+8=30,由题图知乙样本中合格品数为++×5×40=36,故甲样本合格品的频率为eq\f(30,40)=,乙样本合格品的频率为eq\f(36,40)=.据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为.从乙流水线任取1件产品,该产品恰好是合格品的概率为.(3)2×2列联表如下:甲流水线乙流水线合计合格品a=30b=3666不合格品c=10d=414合计4040n=80∵K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))=eq\f(80×(120-360)2,66×14×40×40)≈>.∴在犯错误的概率不超过的前提下认为产品的包装质量与两条自动包装流水线的选择有关.►品味高考1.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中需要志愿者提供帮助的老年人的比例.(2)能否在犯错误的概率不超过的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查办法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))P(K2≥k0)k0解析:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中需要帮助的老年人的比例的估计值为eq\f(70,500)=14%.(2)K2的观测值k=eq\f(500×(40×270-30×160)2,200×300×70×430)≈,由于>,所以在犯错误的概率不超过的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关.(3)由(2)的结论知,该地区的老年人是否需要志愿者提供帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要志愿者提供帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法抽样调查,比采用简单随机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论