




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四节典型统计案例
在实际问题中,独立性检验的结论一定正确吗?提示:不一定.它得到的结论也仅仅是一种数学关系,得到的结论也可能是错误的,但我们可利用统计分析的结果去预测实际问题的结果.1.相关系数是度量()(A)两个变量之间直线关系的强度(B)散点图是否显示有意义的模型(C)两个变量之间是否存在因果关系(D)两个变量之间是否存在关系【解析】选A.由相关系数的定义知.2.如图所示,已知电路中4个开关闭合的概率是,且是互相独立的,灯亮的概率为()(A)(B)(C)(D)【解析】选C.灯不亮的概率为故灯亮的概率为3.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线y=bx+a,那么下面说法错误的是()(A)直线y=bx+a必经过点()(B)直线y=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点(C)直线y=bx+a的斜率(D)直线y=bx+a和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差是该坐标平面上所有直线与这些点的偏差中最小的【解析】选B.回归直线y=bx+a经过样本点的中心(),可能不经过(x1,y1),(x2,y2),…,(xn,yn)中的任何一点,这些点分布在这条直线附近.4.下面是一个2×2列联表则表中a、b处的值分别为()(A)94、96(B)52、50(C)52、54(D)54、52【解析】选C.由2×2列联表得a=73-21=52,b=52+2=54.1.回归分析的模型的确定(1)回归直线只适用于我们所研究的样本的总体,样本的取值范围一般不能超过回归直线的适用范围,否则没有实用价值.(2)两个变量不呈线性关系,不能直接利用回归直线建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.2.独立性检验思想的理解独立性检验的基本思想类似于反证法,首先假设结论不成立,即它们之间没有关系,也就是它们是相互独立的,利用概率的乘法公式可推知,(ad-bc)接近于零,也就是随机变量应该很小,如果由观测数据计算出来的χ2的值不是很小,通过查表P(χ2≥k0)的概率很小,又根据小概率事件根本不可能发生,由此推断假设不成立,从而可以肯定地断言X与Y之间有关系.1
相互独立事件的概率【例1】甲、乙二人进行一次围棋比赛,约定先胜3局者获得这次比赛的胜利,比赛结束.假设在一局中,甲获胜的概率为0.6,乙获胜的概率为0.4,各局比赛结果相互独立.已知前2局中,甲、乙各胜1局.(1)求再赛2局结束这次比赛的概率;(2)求甲获得这次比赛胜利的概率.【审题指导】(1)“再赛2局结束”即为甲连胜2局或乙连胜2局.(2)“甲获胜”即为在后面的比赛中甲连胜2局,或胜1局、负1局,最后一局获胜.【自主解答】记Ai表示事件:第i局甲获胜,i=3,4,5,记Bj表示事件:第j局乙获胜,j=3,4,5.(1)设“再赛2局结束这次比赛”为事件A,则A=(A3·A4)∪(B3·B4),由于各局比赛结果相互独立,故P(A)=P((A3·A4)∪(B3·B4))=P(A3·A4)+P(B3·B4)=P(A3)P(A4)+P(B3)P(B4)=0.6×0.6+0.4×0.4=0.52.(2)记B表示事件:甲获得这次比赛的胜利,因前两局中,甲、乙各胜一局,故甲获得这次比赛的胜利当且仅当在后面的比赛中,甲胜2局,从而B=(A3A4)∪(B3A4A5)∪(A3B4A5).由于各局比赛结果相互独立,故P(B)=P(A3A4)+P(B3A4A5)+P(A3B4A5)=P(A3)P(A4)+P(B3)P(A4)P(A5)+P(A3)P(B4)P(A5)=0.6×0.6+0.4×0.6×0.6+0.6×0.4×0.6=0.648.【规律方法】1.求相互独立事件同时发生的概率的方法主要有(1)利用相互独立事件的概率乘法公式直接求解.(2)正面计算较繁或难以入手时,可从其对立事件入手计算.2.已知两个事件A、B相互独立,它们的概率分别为P(A)、P(B),则有【变式训练】甲、乙两人进行射击比赛,在一轮比赛中,甲、乙各射击一发子弹,根据以往资料知,甲击中8环、9环、10环的概率分别为0.6、0.3、0.1,乙击中8环、9环、10环的概率分别为0.4、0.4、0.2.设甲、乙的射击相互独立.(1)求在一轮比赛中甲击中的环数多于乙击中环数的概率;(2)求在独立的三轮比赛中,至少有两轮甲击中的环数多于乙击中的环数的概率.【解析】记A1、A2分别表示甲击中9环、10环,B1、B2分别表示乙击中8环、9环.A表示在一轮比赛中甲击中的环数多于乙击中的环数,B表示在三轮比赛中至少有两轮甲击中的环数多于乙击中的环数.C1、C2分别表示三轮中恰有两轮、三轮甲击中环数多于乙击中的环数.(1)A=(A1B1)∪(A2B1)∪(A2B2)P(A)=P((A1B1)∪(A2B1)∪(A2B2))=P(A1B1)+P(A2B1)+P(A2B2)=P(A1)P(B1)+P(A2)P(B1)+P(A2)P(B2)=0.3×0.4+0.1×0.4+0.1×0.4=0.2.(2)B=C1∪C2,P(C1)=[P(A)]2[1-P(A)]=3×0.22×(1-0.2)=0.096,P(C2)=[P(A)]3=0.23=0.008.P(B)=P(C1∪C2)=P(C1)+P(C2)=0.096+0.008=0.104.
线性回归分析【例2】测得某国10对父子身高(单位:英寸)如下:(1)画出散点图,说明变量y与x的相关性;(2)如果y与x之间具有线性相关关系,求回归直线;(3)如果父亲的身高为73英寸,估计儿子的身高.【审题指导】(1)根据散点图判断相关性.(2)根据已知数据和提示的公式数据求解.(3)求回归直线y=bx+a,最后进行预测估计.【自主解答】(1)散点图如图所示:观察散点图中点的分布可以看出:这些点在一条直线的附近分布,所以变量y与x之间具有线性相关关系.(2)设回归直线为y=bx+a.由b=≈0.4646.故所求的回归直线为y=0.4646x+35.9747.(3)当x=73时,y=0.4646×73+35.9747≈69.9(英寸).所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸.【规律方法】在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间有相关关系,再求回归直线.【变式训练】某企业的某种产品产量与单位成本统计数据如下:(1)试确定回归直线;(2)指出产量每增加1000件时,单位成本下降多少?(3)假定产量为6000件时,单位成本是多少?单位成本为70元/件时,产量应为多少件?【解析】(1)设x表示每月产量(单位:千件),y表示单位成本(单位:元/件),作散点图.由图知y与x间呈线性相关关系,设回归直线为y=bx+a.由公式可求得b≈-1.818,a=77.364,∴回归直线为y=-1.818x+77.364.(2)由回归直线知,每增加1000件产量,单位成本下降1.818元.(3)当x=6时,y=-1.818×6+77.364=66.456;当y=70时,70=-1.818x+77.364,得x≈4.051千件.∴产量为6000件时,单位成本是66.456元/件,单位成本是70元/件时,产量约为4051件.
独立性检验【例3】某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)内的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否能在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异”?【审题指导】求出优质品率的估计值,填写列联表,求出χ2做出判断.【自主解答】(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为=64%.(2)所以在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异”.【规律方法】1.独立性检验的步骤:(1)根据样本数据制成2×2列联表.(2)根据公式计算χ2.(3)比较χ2与临界值的大小关系作统计推断.2.另外,还可利用图形来判断两个变量之间是否有关系,可以画出等高条形图,从图形上只可以粗略地估计两个分类变量的关系,可以结合所求数值来进行比较,作图时应注意单位统一,图形准确.【变式训练】某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.【解析】由题意可得∵χ2>10.828,故在犯错误的概率不超过0.001的前提下认为学生的学习积极性与对待班级工作的态度有关系.【例】下表是某年美国旧轿车价格的调查资料,以x表示轿车的使用年数,y表示相应的年均价格,求y关于x的回归直线.【审题指导】作出散点图看是否是线性相关关系.若不是,可设出模型拟合,转化为线性相关关系,再进行回归分析.【规范解答】作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此,y与x之间应是非线性相关关系,与已学函数图象比较,用y=ebx+a来刻画题中模型更为合理,令z=lny,则z=bx+a,题中数据变成如下表所示:相应的散点图如图所示,从图中可以看出,变换后的样本点分布在一条直线附近,因此可以用回归直线拟合.由散点图可以看出x与z之间具有线性相关关系,由表中数据得b≈-0.298,a≈8.165,所以z=-0.298x+8.165,最后回代z=lny,即y=e-0.298x+8.165为所求.【规律方法】对于非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作出比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题转化为线性回归分析问题,使之得到解决.【变式备选】某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:检验每本书的成本费y与印刷册数的倒数之间是否具有线性相关关系,如有,求出y对x的回归直线(或曲线).【解析】首先作变量变换,令u=,题目所给数据变成如下表所示的10对数据:然后作散点图如图.由散点图可以看出u与y之间具有线性相关关系.由公式得a≈1.125,b≈8.973,所以y=1.125+8.973u,最后回代u=,可得y=1.125+,这就是题目要求的y对x的回归曲线.
独立性检验解答题的答题技巧【典例】(14分)(2010·新课标全国卷改编)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的讨论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.【审题指导】先根据数据求出比例,再利用公式求出χ2,并作出判断和分析.【规范解答】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为=14%.………4分(2)……………8分由于9.967>6.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.……10分(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,故采用分层抽样方法比采用简单随机抽样方法更好.……14分【失分警示】1.此题在解决时易因为数据较多而且较大在求χ2的值时容易出错,而作出错误的判断导致失分.2.关于独立性检验的题目还应注意:在求得χ2≤2.706应判断为没有充分证据显示X与Y有关系,而不能作为小于90%的量化值来判断,否则会导致失分.【变式训练】在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,利用独立性检验的方法来判断患色盲与性别是否有关?【解析】本题应首先作出调查数据的2×2列联表,利用独立性检验作出判断.根据题目所给的数据作出如下的2×2列联表:根据2×2列联表所给的数据可以有a=38,b=442,c=6,d=514,a+b=480,c+d=520,a+c=44,b+d=956,n=1000,∴所以在犯错误的概率不超过0.001的前提下认为患色盲与性别有关系.1.(2011·银川模拟)下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归直线y=3-5x,变量x增加1个单位时,y平均增加5个单位;③回归直线y=bx+a必过();④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得χ2=13.079,则在犯错误的概率不超过0.1的前提下认为两个变量间有关系.其中错误的个数是()(A)1(B)2(C)3(D)4【解析】选C.①正确,设的方差为,数据xi的方差为si,则=si,与加什么样的常数无关;②错误,变量x增加1个单位则y平均减少5个单位;③正确;④错误,曲线上的点与该点的坐标之间不具有相关关系;⑤错误,在犯错误的概率不超过0.001的前提下认为两个变量间有关系.2.(2011·徐州模拟)在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()①若χ2≥6.635,在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.(A)①(B)①③(C)③(D)②【解析】选C.①推断在100个吸烟的人中必有99人患肺病,说法错误,排除A、B,②某人吸烟,那么他有99%的可能患有肺病说法错误,②错.③正确,故选C.3.(2010·辽宁高考改编)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表表2:注射药物B后皮肤疱疹面积的频数分布表(1)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;(2)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.001的前提下认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.【解析】(1)从频率分布直方图中可以看出注射药物A后皮肤疱疹面积的中位数在65至70之间,而注射药物B后皮肤疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.(2)表3:由于χ2>10.828,所以在犯错误的概率不超过0.001的前提下认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.一、选择题(每小题4分,共20分)1.下列关系属线性负相关的是()(A)父母的身高与子女身高的关系(B)农作物产量与施肥量的关系(C)吸烟与健康的关系(D)数学成绩与物理成绩的关系【解析】选C.A、B、D都是正相关的.而C中吸烟与健康是负相关的.2.设有两个独立事件A和B同时不发生的概率是p,A发生B不发生与A不发生B发生的概率相同,则事件A发生的概率为()(A)2p(B)(C)1-(D)1-【解析】选C.据题意设事件A发生的概率为a,事件B发生的概率为b,则有由②知a=b,代入①即得a=1-.3.下面是2×2列联表:则表中a,b的值分别为()(A)94,72(B)52,50(C)52,74(D)74,52【解析】选C.∵a+21=73,∴a=52.又a+22=b,∴b=74.4.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线为()(A)y=x+1(B)y=x+2(C)y=2x+1(D)y=x-1【解题提示】回归直线过样本点的中心(),可求出验证.【解析】选A.∴y=x+1过点()5.(2011·南昌模拟)若由一个2×2列联表中的数据计算得χ2=4.103,那么在犯错误的概率不超过多少的前提下认为两个变量有关系()(A)0.05(B)0.025(C)0.01(D)0.001【解析】选A.χ2=4.103>3.841,所以在犯错误的概率不超过0.05的前提下认为两个变量有关系.二、填空题(每小题4分,共12分)6.如图所示,有5组(x,y)数据,去掉一组数据后,剩下的4组数据具有较强的线性相关关系,去掉的这组数据为_____.【解析】A、B、C、E近似在一条直线上.答案:D(3,10)7.甲、乙两个袋中均装有红、白两种颜色的小球.这些小球除颜色外完全相同,其中甲袋装有4个红球、2个白球,乙袋装有1个红球、5个白球.现分别从甲、乙两袋中各随机抽取出一个球,则取出的两球都是红球的概率为______(答案用分数表示).【解析】从甲中所取球为红球的概率为,从乙袋中所取球为红球的概率为,所以所求概率为.答案:8.(2011·宁波十校联考)已知x,y之间的一组数据如下表:对于表中数据,现给出如下拟合直线:①y=x+1、②y=2x-1、③、④,则根据最小二乘法的思想得拟合程度最好的直线是______(填序号).【解析】由题意知∴选③.答案:③三、解答题(每小题9分,共18分)9.对某校学生进行心理障碍测试得到如下列联表:试说明在这三种心理障碍中哪一种与性别关系最大?【解题提示】利用公式分别求出三个随机变量,然后根据临界值做出判断.【解析】对于上述三种心理障碍分别构造三个随机变量由表中数据可得所以没有充分证据支持结论焦虑与性别有关,在犯错误的概率不超过0.025的前提下认为说谎与性别有关,没有充分证据支持结论懒惰与性别有关.故说谎与性别关系最大.10.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度活鱼养殖基地与水产养殖技术研发合作合同范本
- 2025年度旅游景观点出租房租赁合同
- 武汉市2025年度房屋租赁押金退还规范合同
- 2025年度新能源开发合同解除协议书范本
- 电梯厂水电安装合同范本
- 亲子农庄装修贷款协议书
- 全款汽车转让合同范例
- 买卖交易正规合同范例
- 个人林地出租合同范例
- hr常用合同范例
- 2025年全国高考体育单招政治时事填空练习50题(含答案)
- 2024年医疗器械经营质量管理规范培训课件
- 中华人民共和国学前教育法-知识培训
- 2024年计算机二级WPS考试题库380题(含答案)
- 2021年度药店培训计划一览表
- 使用rhIL-11才能更加合理地防治血小板减少 指南(全文)
- 节能评估报告编制要求 具体规定
- 基于智能巡检机器人与PLC系统联动控制设计和实现电子信息工程专业
- 毕业设计(论文)VFP小说租阅管理系统
- 河南省内影响工程选址的主要活动断裂资料汇编(最终版)
- (完整版)幼儿园教师优质课评分表
评论
0/150
提交评论