




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
选择性必修三第八章成对数据的统计分析知识点清单一、本章思维导图§8.1成对数据的统计相关性知识点一相关关系1.相关关系的定义:两个变量有关系,但没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.思考相关关系是函数关系吗?答案不是.函数关系是唯一确定的关系.2.相关关系的分类(1)按变量间的增减性分为正相关和负相关.①正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势;②负相关:当一个变量的值增加时,另一个变量的相应值呈现减少的趋势.(2)按变量间是否有线性特征分为线性相关和非线性相关(曲线相关).①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关;②非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称这两个变量非线性相关或曲线相关.知识点二相关关系的刻画1.散点图:为了直观描述成对样本数据的变化特征,把每对成对样本数据都用直角坐标系中的点表示出来,由这些点组成的统计图,叫做散点图.2.样本相关系数(1)我们常用样本相关系数r来确切地反映成对样本数据(xi,yi)的相关程度,其中r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)\r(\i\su(i=1,n,)yi-\x\to(y)2)).(2)样本相关系数r的取值范围为[-1,1].①若r>0时,成对样本数据正相关;②若r<0时,成对样本数据负相关;③当|r|越接近1时,成对样本数据的线性相关程度越强;④当|r|越接近0时,成对样本数据的线性相关程度越弱.§8.2一元线性回归模型及其应用1.一元线性回归模型:称为因变量或响应变量,称为自变量或解释变量,为截距参数,为斜率参数,是与之间的随机误差.2.经验回归方程:(1)相关概念:经验回归直线:经验回归方程也称经验回归函数或经验回归公式,图形称为经验回归直线.最小二乘估计:求经验回归方程的方法叫做最小二乘法,求得的叫做的最小二乘估计.残差:对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.(2)(3)决定系数:越大,表示残差平方和越小,即模型的拟合效果越好;越小,表示残差平方和越大,即模型的拟合效果越差;3.方法技巧经验回归方程的求法及应用
在散点图中,样本点大致分布在一条直线附近,利用公式求出,可写出经验回归方程,利用经验回归模型进行研究,可近似地利用经验回归方程来预测。4.方法技巧一元线性回归模型拟合问题的求解策略
在一元线性回归模型中,R2与相关系数r都能刻画模型拟合数据的效果.|r|越大,R2就越大,用模型拟合数据的效果就越好.§8.3列联表与独立性检验知识点一分类变量为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.知识点二2×2列联表1.2×2列联表给出了成对分类变量数据的交叉分类频数.2.定义一对分类变量X和Y,我们整理数据如下表所示:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d像这种形式的数据统计表称为2×2列联表.知识点三独立性检验1.定义:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验.2.χ2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.3.独立性检验解决实际问题的主要环节(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.(3)根据检验规则得出推断结论.(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.思考独立性检验与反证法的思想类似,那么独立性检验是反证法吗?答案不是.因为反证法不会出错,而独立性检验依据的是小概率事件几乎不发生.二、本章考点归纳成对数据的相关关系考点分析一元线性回归模型及其应用分类变量与列联表ADDINCNKISM.UserStyle 考点1.变量间相关关系的判断例1下表是我国某城市在2017年1月份至10月份各月最低温与最高温的数据一览表月份12345678910最高温59911172427303121最低温-12-31-271719232510已知该城市的各月最低温与最高温具有线性相关关系,根据该一览表,则下列结论错误的是A.最低温与最高温为正相关B.每月最高温与最低温的平均值前8个月逐月增加C.月温差(最高温减最低温)的最大值出现在1月D.1月至4月的月温差(最高温减最低温)相对于7月至10月,波动性更大【答案】B【分析】计算出温差,观察数据,分析数据得到答案【详解】月份12345678910最高温59911172427303121最低温-12-31-271719232510温差171281310787611将最高温度、最低温度、温差列表如图,由表格前三行可知最低温大致随最高温增大而增大,A正确;由表格可知每月最高温与最低温的平均值在前个月不是逐月增加,B错;由表格可知,月温差(最高温减最低温)的最大值出现在月,C正确;由表格可知月至月的月温差(最高温减最低温)相对于月至月,波动性更大,D正确,故选:B.例2研究表明某地的山高()与该山的年平均气温()具有相关关系,根据所采集的数据得到线性回归方程,则下列说法错误的是(
)A.年平均气温为时该山高估计为B.该山高为处的年平均气温估计为C.该地的山高与该山的年平均气温的正负相关性与回归直线的斜率的估计值有关D.该地的山高与该山的年平均气温成负相关关系【答案】B【分析】取求出可得判断A,取,求出判断B,由线性回归方程的回归系数判断C与D,可得答案.【详解】解:由线性回归方程,取,可得,可得年平均气温为时该山高估计为,A正确;取,可得,可得该山高为处的年平均气温估计为,B不正确;该地的山高与该山的年平均气温的正负相关性与回归直线的斜率的估计值有关,C正确;由回归直线的斜率为负,可得该地的山高与该山的年平均气温成负相关关系,故D正确;故选:B.【点睛】本题考查线性回归方程的应用,考查相关量的计算,属于基础题型.反思感悟两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响. 考点2.样本相关系数的性质例3变量x与y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),其相关系数记为.变量u与v相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),其相关系数记为.试判断,与0三者之间的大小关系.【答案】【分析】根据相关系数的性质,结合正、负相关的定义进行判断即可.【详解】由数据(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),可以看出来变量y随的增大而增大,所以变量x与y之间是正相关,所以.由数据(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),可以看出来变量v随u的增大而减小,所以变量x与y之间是负相关,所以,因此.反思感悟样本相关系数的性质(1)r的绝对值越接近0,相关性越弱.(2)r的绝对值越接近1,相关性越强. 考点3.样本相关系数的计算及应用例4垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某省为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据,其中和分别表示第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得:,,,,.(1)求这20个县年垃圾产生总量的平均值;(2)请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合.(当时,与的相关关系较强,否则相关关系较弱.)参考公式:相关系数.【答案】(1)(2)理由见解析【分析】(1)根据直接计算可得;(2)根据所给数据计算出相关系数,即可说明.【详解】(1)依题意这个县年垃圾产生总量的平均值为(吨).(2)依题意,因为与的相关系数接近,所以与之间具有较强的线性相关关系,可用线性回归模型进行拟合.反思感悟线性相关强弱的判断方法(1)散点图:散点图只是粗略作出判断,其图象越接近直线,相关性越强.(2)样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关性越强.考点4.求经验回归方程例5曲靖一中2023届高二年级春节学期4月份组织了一次月考,A同学为了探究学生的数学学习情况是否对物理学习情况存在影响,A同学在某班随机抽取10名同学的数学与物理的成绩(表示数学成绩,表示物理成绩)如下:、、、、、、、、、.参考数据:,,相关系数,,(1)计算样本中变量与的相关系数,根据计算结果判断样本中物理成绩与数学成绩的相关情况;(2)建立变量与之间的经验回归方程(精确到小数点后的的两位数),该班B同学的数学成绩是140分,A同学可以估计B同学的物理成绩大约是多少?(3)用(1)(2)中的结果估计该班、估计全年级学生物理成绩与数学成绩的关联情况是否可靠?为什么?【答案】(1);物理成绩与数学成绩呈现正相关而且是强线性相关关系(2);成绩约为108左右(3)不可靠,理由见解析【分析】(1)利用相关指数公式求解;(2)利用最小二乘法求解;(3)根据抽样的代表性判断.(1)解:,.,.比较题目所给参考数据进行估算,取,,则或.因为,非常接近1,所以物理成绩与数学成绩呈现正相关而且是强线性相关关系.(2)因为,.所以变量与之间的经验回归方程:.时,.所以,该班B同学的数学成绩是140时,A同学可以估计同学的物理成绩约为108左右.(3)用此样本估计估计全年级学生物理与数学的关系不可靠,原因是:样本容量太小,并且样本具有随机性,此样本的数据太“集中”,样本的代表性不强.尤其是该样本取自于一个班级,用于估计全年级的情况时,代表性就更差了.例62023年高考进入倒计时,为了帮助学子们在紧张的备考中放松身心,某重点高中通过开展形式多样的减压游戏,确保同学们以稳定心态,良好地状态迎战高考,游戏规则如下:盒子中初始装有2个白球和1个红球各一个,每次有放回的任取一个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球都是红球,则记该轮为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个白球,然后接着进行下一轮抽球,如此不断继续下去,直至成功.(1)如果某同学进行该抽球游戏时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量,求的分布列和数学期望;(2)为验证抽球试验成功的概率不超过,假设有1000名学生独立的进行该抽球试验,记表示成功时抽球试验的轮次数,表示对应的人数,部分统计数据如下:1234512062332015求关于的回归方程,并通过回归方程预测成功的总人数(取整数部分);(3)证明:.附:经验回归方程系数:,;参考数据:,,(其中,).【答案】(1)分布列见解析,;(2),270;(3)证明见解析.【分析】(1)求出X的所有可能值,再求出各个值对应的概率,列出分布列并求出期望作答.(2)利用给定的数据结合最小二乘法公式求出回归方程,再预测成功的总人数作答.(3)求出在前n轮就成功和不成功的概率,再利用对立事件概率公式推理作答.【详解】(1)依题意,X的取值可能为1,2,3,则;;,所以X的分布列为:X123P所以数学期望为.(2)令,则,依题意,,于是,则,所以所求的回归方程为:,估计t=6时,;估计t=7时,;估计t=8时,;估计t=9时,;估计t≥10时,,从而,所以预测成功的总人数为270.(3)依题意,在前n轮就成功的概率为,又因为在前n轮没有成功的概率为,则,所以.例7禽流感一直在威胁我们的生活,某疾病控制中心为了研究禽流感病毒繁殖个数(个)随时间(天)变化的规律,收集数据如下:天数123456繁殖个数612254995190作出散点图可看出样本点分布在一条指数型函数的周围.保留小数点后两位数的参考数据:,,,,,,,,其中(1)求出关于的回归方程(保留小数点后两位数字);(2)已知,估算第四天的残差.参考公式:【答案】(1);(2)0.58【详解】分析:第一问首先利用相应的公式,对其式子进行变形,利用线性回归分析取解决非线性回归分析的问题,注意公式的正确使用,二是要明确残差的定义,残差是确切值域估计值的差,所以将变量代入回归方程,求得对应的值,作差即可得结果.详解:(1)因为,令,则,,,,所以关于的回归方程为;(2)当时,,,,所以第四天的残差估计为0.58.点睛:该题考查的是有关回归分析的问题,要明确利用线性回归分析作为桥梁解决非线性回归方程的问题的方法,再者要明确残差的定义,认真运算即可得结果.考点5.线性回归分析例7某数学老师身高,他爷爷、父亲和儿子的身高分别是,和.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为.【答案】185【详解】设父亲身高为xcm,儿子身高为ycm,则x173170176y170176182=173,=176,==1,=-=176-1×173=3,∴=x+3,当x=182时,=185.例8已知如下四个命题:①在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于,表示回归效果越好;②在回归直线方程中,当解释变量每增加一个单位时,预报变量平均增加个单位;③两个变量相关性越强,则相关系数的绝对值就越接近于;④对分类变量与,对它们的随机变量的观测值来说,越小,则“与有关系”的把握程度越大.其中正确命题的序号是.【答案】②③【分析】①根据相关指数的性质进行判断;②根据回归方程的性质进行判断;③根据相关系数的性质进行判断;④根据随机变量的观测值k的关系进行判断.【详解】①在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于1,表示回归效果越好,所以①错误;②在回归直线方程=0.8x−12中,当解释变量x每增加一个单位时,预报变量平均增加0.8个单位,正确;③两个变量相关性越强,则相关系数的绝对值就越接近于1,正确;④对分类变量X与Y,对它们的随机变量K2的观测值k来说,k越小,则“X与Y有关系”的把握程度越小,所以④错误;故正确命题的序号是②③.【点睛】该题考查的是有关统计的问题,涉及到的知识点有线性回归分析,两个变量之间相关关系强弱的判断,独立性检验,属于简单题目.例9如图是M市某爱国主义教育基地宣传栏中标题为“2015~2022年基地接待青少年人次”的统计图.根据该统计图提供的信息解决下列问题.①参考数据:012390330②参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘法公式分别为:.(1)求M市爱国主义教育基地所统计的8年中接待青少年人次的平均值和中位数;(2)由统计图可看出,从2019年开始,M市爱国主义教育基地接待青少年的人次呈直线上升趋势,请你用线性回归分析的方法预测2024年基地接待青少年的人次.【答案】(1)平均值为:;中位数为:(2)1365【分析】(1)根据统计图数据计算平均数及中位数即可;(2)利用最小二乘法计算回归方程并预测数据即可.【详解】(1)由图表数据可知:平均值为:,中位数为:.(2)由图表数据得:,则,所以线性回归方程,所以在2024年时,所以,预测2024年基地接待青少年的人次为.考点6.非线性回归例10某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用表示活动推出的天数,表示每天使用扫码支付的人次(单位:十人次),统计数据如表1所示:表1:1234567611213466101196根据以上数据,绘制了散点图.(1)根据散点图判断,在推广期内,与(均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的回归方程类型?(给出判断即可,不必说明理由).(2)根据(1)的判断结果及表1中的数据,建立关于的回归方程,并预测活动推出第8天使用扫码支付的人次.(3)推广期结束后,为更好的服务乘客,车队随机调查了100人次的乘车支付方式,得到如下结果:表2支付方式现金乘车卡扫码人次106030已知该线路公交车票价2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据调查结果发现:使用扫码支付的乘客中有5名乘客享受7折优惠,有10名乘客享受8折优惠,有15名乘客享受9折优惠.预计该车队每辆车每个月有1万人次乘车,根据所给数据,以事件发生的频率作为相应事件发生的概率,在不考虑其他因素的条件下,按照上述收费标准,试估计该车队一辆车一年的总收入.参考数据:62.141.54253550.123.47其中.参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:.【答案】(1)适宜作为扫码支付的人数关子活动推出天数的回归方程类型;(2)见解析(3)(元).【分析】(1)由于散点图呈指数型增长,则更适宜;(2)将非线性的回归方程,利用对数的运算性质转化为线性的,再利用最小二乘法求解即可得出回归方程,并代值,即可得出第8天使用扫码支付的人次;(3)分别计算出每个月三种支付方式的收入,即可得出该车队一辆车一年的总收入.【详解】(1)根据散点图判断,适宜作为扫码支付的人数关子活动推出天数的回归方程类型.(2)∵,两边同时取常用对数得:;设,∴,∵,,,∴,把代入,得:∴,∴,∴把代入上式:∴;∴活动推出第8天使用扫码支付的人次为,∴关于的回归方程为,,活动推出第8天使用扫码支付的人次为3470.(3)由题意可知:一个月中使用现金的乘客有1000人,共收入元;使用乘车卡的乘客有6000人,共收入元;使用扫码支付的乘客有3000人,其中:享受7折优惠的有500人,共收入元,享受8折优惠的有1000人,共收入元,享受9折优惠的有1500人,共收入元,所以,一辆车一个月的收入为:(元),所以,一辆车一年的收入为:(元).【点睛】本题主要考查了求非线性回归方程并作出预测,属于中档题.反思感悟非线性回归问题的处理方法(1)指数函数型y=ebx+a①函数y=ebx+a的图象,如图所示;②处理方法:两边取对数得lny=lnebx+a,即lny=bx+a.令z=lny,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出a,b.(2)对数函数型y=blnx+a①函数y=blnx+a的图象,如图所示;②处理方法:设x′=lnx,原方程可化为y=bx′+a,再根据线性回归模型的方法求出a,b.(3)y=bx2+a型处理方法:设x′=x2,原方程可化为y=bx′+a,再根据线性回归模型的方法求出a,b.考点7.等高堆积条形图的应用例11(多选)2020年12月26日太原地铁2号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁2号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:根据图中信息,下列结论正确的是(
)A.样本中男性比女性更关注地铁2号线开通B.样本中多数女性是35岁及以上C.样本中35岁以下的男性人数比35岁及以上的女性人数多D.样本中35岁及以上的人对地铁2号线的开通关注度更高【答案】ABD【分析】根据等高条形图数据分析即可依次判断.【详解】设等高条形图对应列联表如下:35岁及以上35岁以下总计男性女性总计根据第1个等高条形图可知,35岁及以上男性比35岁及以上女性多,即岁以下男性比”岁以下女性多,即.根据第2个等高条形图可知,男性中35岁及以上的比35岁以下的多,即;女性中35岁及以上的比35岁以下的多,即,对于A,男性人数为,女性人数为,因为,所以,所以A正确;对于B,岁及以上女性人数为岁以下女性人数为,因为,所以B正确;对于C,岁以下男性人数为岁及以上女性人数为,无法从图中直接判断与的大小关系,所以C不一定正确;对于D,35岁及以上的人数为岁以下的人数为,因为,所以,所以D正确.故选:ABD.反思感悟等高堆积条形图的优劣点(1)优点:较直观地展示了eq\f(a,a+b)与eq\f(c,c+d)的差异性.(2)劣点:不能给出推断“两个分类变量有关系”犯错误的概率.考点8.有关“相关的检验”例12某网购平台为了解某市居民在该平台的消费情况,从该市使用其平台且每周平均消费额超过100元的人员中随机抽取了100名,并绘制如图所示频率分布直方图,已知中间三组的人数可构成等差数列.(1)求的值;(2)分析人员对100名调查对象的性别进行统计发现,消费金额不低于300元的男性有20人,低于300元的男性有25人,根据统计数据完成下列列联表,并判断是否有的把握认为消费金额与性别有关?(3)分析人员对抽取对象每周的消费金额与年龄进一步分析,发现他们线性相关,得到回归方程.已知100名使用者的平均年龄为38岁,试判断一名年龄为25岁的年轻人每周的平均消费金额为多少.(同一组数据用该区间的中点值代替)列联表
男性女性合计消费金额消费金额合计临界值表:0.0500.0100.0013.8416.63510.828,其中【答案】(1),(2)详见解析(3)395元【分析】(1)根据频率分布直方图可得,结合可得的值.(2)根据表格数据可得,再根据临界值表可得有的把握认为消费金额与性别有关.(3)由频率分布直方图可得调查对象的周平均消费,从而得到,利用线性回归方程可计算年龄为25岁的年轻人每周的平均消费金额.【详解】(1)由频率分布直方图可知,,由中间三组的人数成等差数列可知,可解得,(2)周平均消费不低于300元的频率为,因此100人中,周平均消费不低于300元的人数为人.所以列联表为男性女性合计消费金额204060消费金额251540合计4555100所以有的把握认为消费金额与性别有关.(3)调查对象的周平均消费为,由题意,∴.∴该名年龄为25岁的年轻人每周的平均消费金额为395元.【点睛】(1)频率分布直方图中,各矩形的面积之和为1,注意直方图中,各矩形的高是;(2)两类变量是否相关,应先计算的值,再与临界值比较后可判断是否相关.(3)线性回归方程对应的直线必经过.例13某花圃为提高某品种花苗质量,开展技术创新活动,在A,B实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在A,B试验地随机抽选各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为优质花苗.(1)求图中a的值,并求综合评分的中位数;(2)用样本估计总体,以频率作为概率,若在A,B两块实验地随机抽取3棵花苗,求所抽取的花苗中的优质花苗数的分布列和数学期望;(3)填写下面的列联表,并判断是否有90%的把握认为优质花苗与培育方法有关.优质花苗非优质花苗合计甲培育法20乙培育法10合计附:下面的临界值表仅供参考.0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.828(参考公式:,其中.)【答案】(1),82.5;(2)分布列见解析,;(3)列联表见解析,有90%的把握认为优质花苗与培育方法有关系.【解析】(1)根据各段的频率之和为1,可得,然后假设中位数,并根据在中位数的左右两边的频率均为,简单计算,可得结果.(2)假设所抽取的花苗为优质花苗的颗数为X,可知,然后计算相对应颗数的概率,画出分布列,最后根据期望的计算公式,可得结果.(3)先计算出优质花苗的频率,然后可得优质花苗的颗数,进一步得出其他的数据,最后计算,根据表格进行比较,可得结果.【详解】(1)由,解得.令得分中位数为x,由,解得.故综合评分的中位数为82.5.(2)由(1)与频率分布直方图,优质花苗的频率为,即概率为,设所抽取的花苗为优质花苗的颗数为X,则,;;;.其分布列为:X0123P所以,所抽取的花苗为优质花苗的数学期望.(3)结合(1)与频率分布直方图,优质花苗的频率为,则样本中,优质花苗的颗数为60棵,列联表如下表所示:优质花苗非优质花苗合计甲培育法203050乙培育法401050合计6040100可得.所以,有90%的把握认为优质花苗与培育方法有关系.【点睛】本题考查频率分布直方图的应用,考查了分布列以及二项分布,还考查了统计量的计算,重在于掌握公式,考验对数据的处理,属基础题.反思感悟用χ2进行“相关的检验”步骤(1)零假设:即先假设两变量间没关系.(2)计算χ2:套用χ2的公式求得χ2值.(3)查临界值:结合所给小概率值α查得相应的临界值xα.(4)下结论:比较χ2与xα的大小,并作出结论.考点9.有关“无关的检验”例14为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按分组,绘制频率分布直方图如图所示,实验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只,假设小白鼠注射疫苗后是否产生抗体相互独立.抗体指标值合计小于60不小于60有抗体没有抗体合计(1)填写下面的2×2列联表,判断能否有95%的把握认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注射疫苗,结果又有20只小自鼠产生抗体.(i)用频率估计概率,求一只小白鼠注射2次疫苗后产生抗体的概率;(ii)以(i)中确定的概率作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记2个人注射2次疫苗后产生抗体的数量为随机变量X,求X的概率分布.参考公式:(其中为样本容量)0.500.400.250.150.1000.0500.0250.4550.7081.3232.0722.7063.8415.024【答案】(1)列联表见解析,有(2)(i);(ii)分布列见解析【分析】(1)根据频率分布直方图求出各个组的人数,并填写出列联表,计算出卡方,与3.841比较后得到结论;(2)(i)设出事件,利用对立事件概率公式和条件概率进行求解;
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度旧家电回收及再利用合同
- 2025年度旅游景区专业保安服务合同
- 2025年度科技园区物业用房移交及创新企业孵化服务合同
- 二零二五年度海洋资源开发合作经营分成协议
- 二零二五年度专业洗衣保姆雇佣服务协议
- 二零二五年度腾讯游戏与体育组织合作举办电竞赛事合同
- 2025年度火锅加盟店员工培训及服务标准合同
- 二零二五年度建筑公司劳务人员工资发放及调整协议
- 2025年度高端制造业个人厂房租赁协议
- 乌鲁木齐首期场地处理工程施工组织设计
- GB∕T 8081-2018 天然生胶 技术分级橡胶(TSR)规格导则
- 教学课件个人理财-2
- 最新人音版音乐二年级下册全册教案
- 航空航天概论(课堂PPT)
- 影视旅游作品对游客出游动机及行为意向的影响研究
- 【图文】煤矿井下常见的失爆现象
- 我的寒假生活模板
- 完整版三措两案范文
- 贸易公司程序文件
- 计算书平原微丘区二级公路设计
- 常用洪水预报模型介绍
评论
0/150
提交评论