版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题22成对数据的统计问题成对数据的统计问题主要通过成对样本数据(二维数据)研究两个变量之间的关系,学习成对数据的数据处理方法,并根据样本估计总体的思想,通过成对样本数据的统计特征推断两个变量(二维总体)的统计特征,具体体现在了解样本相关系数的统计含义,了解一元线性回归模型和2×2成对数据的统计问题主要通过成对样本数据(二维数据)研究两个变量之间的关系,学习成对数据的数据处理方法,并根据样本估计总体的思想,通过成对样本数据的统计特征推断两个变量(二维总体)的统计特征,具体体现在了解样本相关系数的统计含义,了解一元线性回归模型和2×2列联表及独立性检验,会应用这些方法解决简单的实际问题。本专题的探究一主要包含成对数据相关性的判断依据—样本相关系数的理解,一元线性回归模型和可以转化为一元线性回归模型的计算,以及利用这个模型进行预测。探究二主要是考查一对分类变量是否具有关联性,而独立性检验为我们提供了解决这类问题的办法,可借助例2梳理独立性检验的步骤.探究三是概率与统计案例的综合应用,常涉及相互独立事件同时发生的概率、频率分布直方图的识别与应用、数字特征、独立性检验,回归方程等基础知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识,综合性强,要善于把问题分解成我们熟悉的问题进而利用所学知识进行求解。——合肥八中高级教师方旭探究1:成对数据的分析【典例剖析】例1.(2022·浙江省模拟)创新是民族的灵魂,某大型企业对其产品进行研发与创新,根据市场调研与模拟,得到研发投入x(亿元)与研发创新的直接收益y(亿元)的数据统计如下:x2346810132122232425y1322314250565868.56867.56666当0<x≤17时,建立了y与z的两个回归模型:模型=1\*GB3①:y=4.1x+11.8;模型=2\*GB3②:y=21.3x-14.4;当x>17时,确定y与x满足的线性回归方程为:y=-0.7x+a(1)根据下列表格中的数据,比较当0<x≤17时模型=1\*GB3①、=2\*GB3②的决定系数R2,并选择拟合精度更高、更可靠的模型,预测该企业对产品创新改造的投入为17亿元时的直接收益.回归模型模型=1\*GB3①模型=2\*GB3②回归方程yyi=1182.479.2(附:刻画回归效果的决定系数R2=1-i=1n(2)为鼓励科技创新,当研发的投入不少于20亿元时,国家给予公司补贴收益10亿元,以回归方程为预测依据,比较研发改造投入17亿元与20亿元时公司实际收益的大小.(附:b=i=1(3)研发改造后,该公司F产品的效率X大幅提高,X服从正态分布N(0.52,0.012),公司对研发团队的奖励方案如下:若F产品的效率不超过50%,不予奖励;若F产品的效率超过50%但不超过53%,每件F产品奖励2万元;若F产品的效率超过53%(附:随机变量ξ服从正态分布N(μ,σ2),则选题意图:选题意图:成对数据的统计相关性及一元线性回归模型,常以解答题的形式考查简单的实际问题,难度一般.试题具有图表丰富、数据与阅读信息量大的特点,考查数据分析、数学运算、数学建模等核心素养.例1综合考查模型的选择与应用及正态分布,对分析问题的能力、运算能力要求较高.思维引导:第(1)问计算R2的值,选择合适的模型;第(2)问利用回归方程进行预测;第(3)问利用正态分布的特点求出奖励Y分别取0、2、5时的概率,从而求出E【解析】(1)由表格中的数据,有182.4>79.2,即182.4i=17(yi-y)2>79.2i=17(yi-y)2,
所以模型=1\*GB3①的R2小于模型=2\*GB3②,说明回归模型=2\*GB3②刻画的拟合效果更好,
所以当x=17亿元时,研发改造直接收益的预测值为
y=21.3×17-14.4≈21.3×4.1-14.4=72.93(亿元),
(2)由已知可得:x-20=1+2+3+4+55=3⇒x=23,
y-60=8.5+8+7.5+6+65=7.2⇒y=67.2,
所以a=y+0.7x=67.2+0.7×23=83.3,
所以当x>17亿元时,y与x满足的线性回归方程为y=-0.7x+83.3,
当x=20亿元时,研发改造直接收益的预测值为y=-0.7×20+83.3=69.3;
当x=20亿元时,实际收益的预测值为69.3+10=79.3亿元>72.93
Y
0
2
5
P
0.0228
0.8185
0.1587所以每件F产品获得奖励的期望值为:
E(Y)=0×0.0228+2×0.8185+5×0.1587=2.4305(万元).
【变式训练】练11(2022·福建省模拟·多选)某班级学生开展课外数学探究活动,将一杯冷水从冰箱中取出后静置,在25℃的室温下测量水温y(单位:℃)随时间x(单位:min)的变化关系,在测量了15个数据后,根据这些实验数据(xi,y现需要选择合适的回归方程进行回归分析,则根据散点图,合适的回归方程类型有(
)A.y=25-c1e-c2【解析】散点图的特点是单调递增,增长速度越来越慢,且水温y< 25.
对A选项,符合散点图的特点;
对B选项,y=25+c1x+c2≥25不符合散点图的特点;
对C选项,符合散点图的特点;
对D练12(2022·湖北省武汉市联考)2018年9月10日,全国教育大会在北京召开,习近平总书记在会上提出“培养德智体美劳全面发展的社会主义建设者和接班人”.某学校贯彻大会精神,为学生开设了一门模具加工课,经过一段时间的学习,拟举行一次模具加工大赛,学生小明、小红打算报名参加大赛.(1)赛前,小明进行了一段时间的强化训练,加工完成一个模具的平均速度y(秒)与训练天数x(天)有关,经统计得到如下表数据:x(天)1234567y(秒)990990450320300240210经研究发现,可用y=a+bx作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过50天训练后,加工完成一个模具的平均速度(2)小明和小红拟先举行一次模拟赛,每局比赛各加工一个模具,先加工完成模具的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为35,已知在前3局中小明胜2局,小红胜1局.若每局不存在平局,请你估计小明最终赢得比赛的概率,参考数据:(其中i=1ti=118450.370.55参考公式:对于一组数据(u1,v1),(u2,v2【解析】(1)由题意,y=17(990+990+450+320+300+240+210)=500,
令t=1x,设y关于t的线性回归方程为y=bt+a,则
b=i=17tiyi-7t⋅yi=17ti2-7t2=1845-7×0.37×5000.55=1000,
则a=500-1000×0.37=130,
∴y=1000t+130,又t=1x,
∴y关于x的回归方程为y=1000x+130,
故x=50时,y=150,
∴经过50天训练后,加工完成一个模具的平均速度y约为150秒;
【规律方法】1.判断相关关系的两种方法=1\*GB3①散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有相关关系;如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.=2\*GB3②决定系数法:利用决定系数判定,R2越趋近1,拟合效果越好,相关性越强.2.求经验回归方程:=1\*GB3①利用公式b=i=1nxiyi-nxy=2\*GB3②经验回归方程的拟合效果,可以利用相关系数|r|判断,当|r|R2判断,R2越大,拟合效果越好.3.非线性经验回归方程转化为线性经验回归方程:①若y=a+bx②若满足对数式:y=a+blnx③若满足指数式:y=c1ec2x,两边取对数探究2:独立性检验【典例剖析】例2.(2022·湖北省联考)为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按[0,20),[20,40),[40,60),[60,80),[80,100]分组,绘制频率分布直方图如图所示.试验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只.
假设小白鼠注射疫苗后是否产生抗体相互独立.
(1)填写下面的2×2列联表,并根据列联表及α=0.05的独立性检验,判断能否认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.
单位:只指标值抗体小于60不小于60合计有抗体没有抗体合计
(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注射疫苗,结果又有20只小白鼠产生抗体.
(i)用频率估计概率,求一只小白鼠注射2次疫苗后产生抗体的概率p;
(ii)以(i)中确定的概率p作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记n个人注射2次疫苗后产生抗体的数量为随机变量X.试验后统计数据显示,当X=99时,P(X)取最大值,求参加人体接种试验的人数n及E(X).
参考公式:χ2=n(ad-bc)P(0.500.400.250.150.1000.0500.025k0.4550.7081.3232.0722.7063.8415.024选题意图选题意图:独立性检验可以单独考查,也可与概率、随机变量的分布列、期望等交汇考查,通过对统计案例的分析,掌握独立性检验的方法,体会独立性检验的基本思想在解决实际问题中的应用,借助例2梳理独立性检验的步骤.思维引导:第(1)问分析频率分布直方图中的数据,填写2×2列联表,计算χ2的值,从而判断犯错概率不大于0.05;第(=1\*romani)问利用正难则反的思想,先求2次疫苗后均未产生抗体的概率,再求其对立事件的概率;第(=2\*romanii)问中,Χ~Bn,0.9,将PΧ=9最大,转化为PΧ=9≥PΧ=8,PΧ=9≥P【解析】(1)由频率分布直方图,知200只小白鼠按指标值分布为:
在[0,20)内有0.0025×20×200=10(只);
在[20,40)内有0.00625×20×200=25(只):
在[40,60)内有0.00875×20×200=35(只):
在[60,80)内有0.025×20×200=100(只):
在[80,100]内有0.0075×20×200=30(只).
由题意,有抗体且指标值小于60的有50只;而指标值小于60的小白鼠共有10+25+35=70只,所以指标值小于60且没有抗体的小白鼠有20只,同理,指标值不小于60且没有抗体的小白鼠有20只,故列联表如下:
单位:只抗体指标值合计小于60不小于60有抗体50110160没有抗体202040合计70130200
零假设为H0:注射疫苗后小白鼠产生抗体与指标值不小于60无关联.
根据列联表中数据,得χ2=200×(50×20-20×110)2160×40×70×130≈4.945>3.841=x0.05.
根据α=0.05的独立性检验,推断H0不成立,即认为注射疫苗后小白鼠产生抗体与指标值不小于60有关,此推断犯错误的概率不大于0.05.
(2)(i)令事件A=“小白鼠第一次注射疫苗产生抗体”,事件B=“小白鼠第二次注射疫苗
产生抗体”,事件C=“小白鼠注射2次疫苗后产生抗体”.
记事件A,B,C发生的概率分别为P(A),P(B),P(C),
则P(A)=160200=0.8,P(B)=2040=0.5,P(C)=1-P(A)P(B)=1-0.2×0.5=0.9.
所以一只小白鼠注射2次疫苗后产生抗体的概率p=0.9.
(ii)由题意,知随机变量=1\*GB3①当接种人数为109时,EX=np=109×0.9=98.1;=2\*GB3②当接种人数为110时,E(X)=np=110×0.9=99.【变式训练】练21(2022·湖北省黄石市月考·多选)为了增强学生体育锻炼的积极性,某中学需要了解性别因素与学生对体育锻炼的喜好是否有影响,为此对学生是否喜欢体育锻炼的情况进行普查.得到下表:性别合计男性女性喜欢280p280+p不喜欢q120120+q合计280+q120+p400+p+q附:K2=nP0.150.100.050.0250.0100.00lk2.0722.7063.8415.0246.63510.828已知男生喜欢该项运动的人数占男生人数的710,女生喜欢该项运动的人数占女生人数的35A.列联表中q的值为120,p的值为180
B.随机对一名学生进行调查,此学生有90%的可能喜欢该项运动
C.有99%的把握认为学生的性别与其对该项运动的喜好有关系
D.没有【解析】男生喜欢该项运动的人数占男生人数的280280+q=710,解得q=120,
女生喜欢该项运动的人数占女生人数的p120+p=35,解得p=180,故A正确;性别合计男性女性喜欢280180460不喜欢120120240合计400300700所以χ2=700(280×120-120×180)2400×300×460×240≈7.609>6.635,
所以有99%的把握认为学生的性别与其对该项运动的喜好有关系,故C正确;
而χ2练22(2022·山东省潍坊市模拟)根据以往的经验,某工程施工期间的降水量X(单位:mm)对工期的影响如下表:降水量X[0,300)[300,600)[600,900)[900,+∞)工期延误天数Y0258历史气象资料表明:该工程施工期间降水量X小于300,600,900的概率分别为0.3,0.7,0.9.(1)求工期延误天数Y的均值与方差;(2)求在降水量X至少是300的条件下,工期延误不超过5天的概率;(3)由于该工程在7~8月施工,故当气温较高时,工人可能无法按时完成当日计划工作量.已知在某个40天的施工周期内,有30天的最高气温不低于35℃,这其中仅有12天完成了当日的工作量;剩余10天中,有8天完成了当日的工作量.依据小概率值α=0.005的χ2附:χ2=n【解析】(1)由已知条件和概率的加法公式有:P(X<300)=0.3,P(300≤X<600)=P(X<600)-P(X<300)=0.4,
P(600≤X<900)=P(X<900)-P(X<600)=0.2,P(X≥900)=1-P(X<900)=0.1,
所以Y的分布列为:y0258p0.30.40.20.1
于是,E(Y)=0×0.3+2×0.4+5×0.2+8×0.1=2.6,
D(Y)=(0-2.6)2×0.3+(2-2.6)2×0.4+(5-2.6)2×0.2+(8-2.6)2×0.1=6.24.
故工期延误天数Y的均值为2.6,方差为6.24;
(2)由对立事件的概率公式可得P(X≥300)=1-P(X<300)=0.7,
又P(300≤X<900)=P(X<900)-P(X<300)=0.6,
由条件概率得P(Y≤5|X≥300)=P(300≤X<900)P(X≥300)=0.60.7=67,
故在降水量X至少是300mm的条件下,工期延误不超过5【规律方法】2×2列联表中,如果两个变量没有关系,则应满足ad-bc≈0.|ad-2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表:(2)根据公式χ2=n(3)通过比较χ2与临界值的大小关系来作统计推断.探究3:概率与统计的综合问题【典例剖析】例3.(2022·江西省景德镇市模拟)十三届全国人大四次会议3月11日表决通过了《关于国民经济和社会发展第十四个五年规划和2035年远景目标纲要的决议》,纲要指出:“加强原创性引领性科技攻关”.某企业集中科研骨干,攻克系列“卡脖子”技术,已成功实现离子注入机全谱系产品国产化,包括中束流、大束流、高能特种应用及第三代半导体等离子注入机,工艺段覆盖至28nm,为我国芯片制造产业链补上重要一环,为全球芯片制造企业提供离子注入机一站式解决方案.此次技术的突破可以说为国产芯片的制造做出了重大贡献,该企业使用新技术对某款芯片进行试生产,该款芯片的性能以某项指标值k70≤k<100性能指标值k90≤k<10085≤k<9080≤k<8575≤k<8070≤k<75等级ABCDE为了解该款芯片的生产效益,该企业从试生产的产品进行随机抽样并测量了每件产品的指标值,若以组距为5画频率分布直方图时,发现Y(设“频率组距=Y”)满足:(1)试确定n的所有取值,并求a;(2)从样本性能指标值不小于85的产品中釆用分层抽样的方法抽取5件产品,求样本中等级A产品与等级B产品的件数.然后从这5件产品中一次性随机抽取2件产品,并求出2件都是A级品的概率.选题意图选题意图:概率统计试题具有应用性、情境性、综合性的特点,试题注重基本概念的理解,着眼于知识在理解的基础上应用,考查常规的、熟悉的知识内容.例3难度一般,考查概率与统计的综合应用,考查学生数据分析、数学运算的核心素养.思维引导:第(1)问分析数据,利用频率之和为1,求出a;第(2)问考查古典概型求概率,列举出所有的样本点,从而求出事件“所求2件都是A级品”的概率.【解析】(1)根据题意,70≤k<100,按组距为5可分成6个区间,
分别是70,75、75,80、80,85、85,90、90,95、95,100,
因为70≤k<100,由5n≤k<5n+1,n∈N*,可知n的取值集合为14,15,16,17,18,19,
每个小区间对应的频率值为5Y=2n-2560,n∈14,15,16,175a⋅220-n,n∈18,19.
所以,3+5+7+960+5a×22+2=30a+25=1,解得a=150.
(2)等级A产品的频率为5×150×22+2=35,等级B产品的频率为2×17-2560=320,
所以,等级A产品和等级B产品的频率之比为35:320=4:1,
所以,从样本性能指标值不小于85的产品中釆用分层抽样的方法抽取5件产品,
等级A产品的件数为4,分别记为a1、a2、a3、a4,等级B产品的件数为1,记为b,
从这5件产品中任意抽取【变式训练】练31(2022·广东省东莞市月考)足球是一项大众喜爱的运动.2022卡塔尔世界杯揭幕战将在2022年11月21日打响,决赛定于12月18日晚进行,全程为期28天.
(1)为了解喜爱足球运动是否与性别有关,随机抽取了男性和女性各100名观众进行调查,得到2×2列联表如下:喜爱足球运动不喜爱足球运动合计男性6040100女性2080100合计80120200依据小概率值α=0.001的独立性检验,能否认为喜爱足球运动与性别有关?(2)校足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将球传出,每次传球时,传球者都等可能的将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第1次触球者,第n次触球者是甲的概率记为Pn,即P1=1.
(i)求P3(直接写出结果即可);
(ii)证明:数列{α0.1000.0500.0250.0100.001x2.7063.8415.0246.63510.828【解析】(1)假设H0:喜爱足球运动与性别独立,即喜爱足球运动与性别无关,
X2=200×(60×80-20×40)280×120×100×100≈33.3>10.828,
根据小概
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年广东省清远市公开招聘警务辅助人员辅警笔试自考题2卷含答案
- 2024年江苏省宿迁市公开招聘警务辅助人员辅警笔试自考题2卷含答案
- 2023年福建省漳州市公开招聘警务辅助人员辅警笔试自考题1卷含答案
- 2023年山东省莱芜市公开招聘警务辅助人员辅警笔试自考题2卷含答案
- 2021年四川省达州市公开招聘警务辅助人员辅警笔试自考题1卷含答案
- 《眼内炎患者的疾病》课件
- 2024年财产分配协议书:离婚股权分割条款
- 2024版塔吊设备交易协议模板版B版
- 2024版居间合同最高收费标准
- 2024版工程款按进度付款的合同
- 2024年大学试题(管理类)-公共部门决策的理论与方法笔试历年真题荟萃含答案
- 在美术课堂中融入心理健康教育
- 2024年上海外服招聘笔试参考题库附带答案详解
- DLT 1051-2019电力技术监督导则
- 中国AED布局与投放专家共识护理课件
- 山东省枣庄市滕州市2023-2024学年高二上学期期末考试数学试卷
- 语文七年级下字帖打印版
- 无菌注射剂生产线清洁验证方案
- 2024年健康照护师理论试题
- 寒假小学生心理健康教育
- 健康体检授权委托书
评论
0/150
提交评论