版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第3节成对数据的统计分析课程标准要求1.会作两个相关变量的数据的散点图,能根据最小二乘原理建立经验回归方程并进行预测,了解样本相关系数的统计含义和残差分析.2.了解独立性检验的基本思想,22列联表的统计意义,能对两个分类变量进行独立性检验.必备知识课前回顾 回归教材 夯实四基关键能力课堂突破 类分考点 落实四翼必备知识课前回顾 回归教材 夯实四基知识梳理1.成对数据的统计相关性(1)变量的相关关系两个变量有关系,但又没有确切到可由其中的一个去 另一个的程度,这种关系称为相关关系.(2)散点图每一个序号下的成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图.我们把这样的统计图叫做
2、.精确地决定散点图(3)正相关与负相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现 的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现 的趋势,则称这两个变量负相关.(4)线性相关与曲线相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在 附近,我们就称这两个变量线性相关.一般地,如果两个变量具有 ,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.增加减少一条直线相关性我们称r为变量x和变量y的样本相关系数.样本相关系数r的取值范围为 .当r0时,称成对样本数据 ,这时,当其中一个数据的值变小时,另一个数据的值通常也 ;当
3、其中一个数据的值变大时,另一个数据的值通常也 .当r0时,称成对样本数据 ,这时,当其中一个数据的值变小时,另一个数据的值通常会 ;当其中一个数据的值变大时,另一个数据的值通常会 .-1,1 正相关变小变大负相关变大变小释疑样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度:当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.一元线性回归模型因变量响应变量自变量解释变量随机误差最小经验回归方程经验回归函数经验回归公式经验回归直线最小二乘估计释疑如果在残差的散点图中,残差比较均匀地分布在横轴两边,说明残差比较符合一元线性回归模型的
4、假定,是均值为0、方差为2的随机变量的观测值.残差越小越好越差3.分类变量与列联表(1)我们经常会使用一种特殊的随机变量,以区别不同的 ,这类随机变量称为分类变量.(2)按研究问题的需要,将数据分类统计,并做成表格加以保存.这种形式的数据统计表称为 ,关于分类变量X和Y的抽样数据的22列联表如下:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d现象或性质22列联表4.独立性检验(1)独立性检验的概念利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验,读作“卡方独立性检验”,简称 .(3)独立性检验基于小概率值的检验规则当2x时,我们就推断H0不成
5、立,即认为X和Y不独立,该推断犯错误的概率不超过 ;当23.841,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.答案:5%5.已知变量x和y的统计数据如表所示.x34567y2.5344.56答案:6.55关键能力课堂突破 类分考点 落实四翼考点一 成对数据的统计相关性判断1.对变量x,y有观测数据(xi,yi)(i=1,2,10),得散点图如图,对变量u,v有观测数据(ui,vi)(i=1,2,10),得散点图如图.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关
6、C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关C解析:由散点图可得两组数据均线性相关,且图的经验回归方程斜率为负,图的经验回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.故选C.2.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计数据如表所示.月份123456人均销售额658347利润率/%12.610.418.53.08.116.3根据表中数据,下列说法正确的是( )A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系A解析:画出利润率与人均销售额的散
7、点图,如图.由图可知利润率与人均销售额成正相关关系.故选A.AD4.变量X与Y相应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1). r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )A.r2r10B.0r2r1C.r200;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r20,则正相关;若r400空气质量好空气质量不好.解题策略1.在22列联表中,如果两个变量没有关系,则应满足ad-bc0.|a
8、d-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成22列联表.(3)比较2与临界值的大小关系,作统计推断.角度二 独立性检验的综合应用例1-2 (2021河南洛阳统考)某共享单车经营企业欲向甲市投放单车,为制定适宜的经营策略,该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷、整理分析及开座谈会三个阶段.在随机问卷阶段,A,B两个调查小组分赴全市不同区域发放问卷并及时收回;在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15
9、至45岁的人群,按比例随机抽取了300份,进行数据统计,具体情况如表所示.组别年龄A组统计结果B组统计结果经常使用单车偶尔使用单车经常使用单车偶尔使用单车15,25)27人13人40人20人25,35)23人17人35人25人35,4520人20人35人25人(1)先用分层随机抽样的方法从上述300人中按“年龄是否达到35岁”抽出一个容量为60人的样本,再用分层随机抽样的方法将“年龄达到35岁”的被抽个体分配到“经常使用单车”和“偶尔使用单车”中去,求这60人中“年龄达到35岁且偶尔使用单车”的人数;(1)先用分层随机抽样的方法从上述300人中按“年龄是否达到35岁”抽出一个容量为60人的样本
10、,再用分层随机抽样的方法将“年龄达到35岁”的被抽个体分配到“经常使用单车”和“偶尔使用单车”中去,为听取对发展共享单车的建议,调查小组专门组织所抽取的“年龄达到35岁且偶尔使用单车”的人员召开座谈会.会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠券).已知参加座谈会的人员中有且只有4人来自A组,求A组这4人中得到礼品的人数X的分布列和数学期望.例1-2 (2021河南洛阳统考)某共享单车经营企业欲向甲市投放单车,为制定适宜的经营策略,该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷、整理分析及开座谈会三个阶段.在随机问卷阶段,A,B两个调查小组分赴全市不
11、同区域发放问卷并及时收回;在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15至45岁的人群,按比例随机抽取了300份,进行数据统计,具体情况如表所示.组别年龄A组统计结果B组统计结果经常使用单车偶尔使用单车经常使用单车偶尔使用单车15,25)27人13人40人20人25,35)23人17人35人25人35,4520人20人35人25人例1-2 (2021河南洛阳统考)某共享单车经营企业欲向甲市投放单车,为制定适宜的经营策略,该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷、整理分析及开座谈会三个阶段.在随机问卷阶段,A,B两个调查小组分赴全市不同区域发放问卷并及时收
12、回;在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15至45岁的人群,按比例随机抽取了300份,进行数据统计,具体情况如表所示.组别年龄A组统计结果B组统计结果经常使用单车偶尔使用单车经常使用单车偶尔使用单车15,25)27人13人40人20人25,35)23人17人35人25人35,4520人20人35人25人(2)从统计数据可直观得出“经常使用共享单车与年龄达到m岁有关”的结论.在用独立性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,年龄m应取25还是35?请通过比较2的大小加以说明.针对训练 (2021山东青岛高三二模)现对某市工薪阶层对于“楼市限购令”的态度进行调查,随
13、机抽调了50人,他们月收入(单位:百元)的频数分布及对“楼市限购令”赞成人数如表所示.月收入25,35)35,45)45,55)55,65)65,75)75,85频数510151055赞成人数4812521(1)根据以上统计数据完成22列联表,并问能否有97.5%的把握认为“某市工薪阶层对于楼市限购令的态度与月收入以6 500元为分界点有关”?态度月收入合计不低于65百元低于65百元赞成不赞成合计(2021山东青岛高三二模)现对某市工薪阶层对于“楼市限购令”的态度进行调查,随机抽调了50人,他们月收入(单位:百元)的频数分布及对“楼市限购令”赞成人数如表所示.月收入25,35)35,45)45
14、,55)55,65)65,75)75,85频数510151055赞成人数4812521(2)若对月收入在55,65)和65,75)的被调查人中各随机选取两人进行追踪调查,求在选中的4人中有人不赞成的条件下,赞成“楼市限购令”的人数的分布列及数学期望.0.0500.0250.0100.0050.001x3.8415.0246.6357.87910.828考点三 一元线性回归模型及残差分析角度一 线性回归分析例2-1 (2021云南昆明高三三模)我国脱贫攻坚战取得全面胜利,现行标准下农村贫困人口全部脱贫,消除了绝对贫困.某村40户贫困家庭在扶贫工作组的帮助下于2017年全面脱贫,该工作组为了了解脱
15、贫家庭的收入、消费支出、食品支出的关系,在这些脱贫家庭中利用简单随机抽样方法抽取了8户,调查统计这8户家庭每户2019年的年收入x,消费支出y,食品支出z(单位:千元),整理数据(xi,yi)(i=1,2,8)得到下面的折线图,由数据(yi,zi)(i=1,2,8)得到下表.家庭(i)12345678消费支出(y)2730333537404244食品支出(z)910111312111212例2-1 (2021云南昆明高三三模)我国脱贫攻坚战取得全面胜利,现行标准下农村贫困人口全部脱贫,消除了绝对贫困.某村40户贫困家庭在扶贫工作组的帮助下于2017年全面脱贫,该工作组为了了解脱贫家庭的收入、消
16、费支出、食品支出的关系,在这些脱贫家庭中利用简单随机抽样方法抽取了8户,调查统计这8户家庭每户2019年的年收入x,消费支出y,食品支出z(单位:千元),整理数据(xi,yi)(i=1,2,8)得到下面的折线图,由数据(yi,zi)(i=1,2,8)得到下表.家庭(i)12345678消费支出(y)2730333537404244食品支出(z)910111312111212(2)恩格尔系数,是食品支出额占家庭消费支出总额的比重.通常一个家庭收入越少,家庭收入中(或总支出中)用来购买食物的比重越大;一个家庭收入越多,家庭收入中(或总支出中)用来购买食物的比重越小,所以该系数是衡量居民生活水平的有
17、效指标.根据联合国粮农组织提出的标准,恩格尔系数在59%以上为贫困,50%59%为温饱,40%50%为小康,30%40%为富裕,低于30%为最富裕.根据上述样本数据,请估计该村脱贫家庭中达到最富裕的家庭户数.解题策略2.回归分析的两种策略(1)利用经验回归方程进行预测:把经验回归方程看作一次函数,求函数值.角度二 非线性回归分析例2-2 (2021安徽宿州高三三模)某电影院统计了某部电影上映高峰后连续10场的观众人数,其中每场观众人数y(单位:百人)与场次x的统计数据如表:x12345678910y2.7721.921.361.121.090.740.680.620.55通过散点图可以发现y与
18、x之间具有相关性,且满足关系式y=aebx,设=ln y.(1)利用表格中的前8组数据求样本相关系数r,并判断是否有99%的把握认为x与之间具有线性相关关系(当样本相关系数满足|r|0.789时,则有99%的把握认为两个变量具有线性相关关系);例2-2 (2021安徽宿州高三三模)某电影院统计了某部电影上映高峰后连续10场的观众人数,其中每场观众人数y(单位:百人)与场次x的统计数据如表:x12345678910y2.7721.921.361.121.090.740.680.620.55通过散点图可以发现y与x之间具有相关性,且满足关系式y=aebx,设=ln y.(2)利用x与的相关性及表格
19、中的前8组数据求出y与x之间的经验回归方程;(结果保留两位小数)例2-2 (2021安徽宿州高三三模)某电影院统计了某部电影上映高峰后连续10场的观众人数,其中每场观众人数y(单位:百人)与场次x的统计数据如表:x12345678910y2.7721.921.361.121.090.740.680.620.55通过散点图可以发现y与x之间具有相关性,且满足关系式y=aebx,设=ln y.(3)如果每场观众人数不足0.7(单位:百人),称为“非满场”.从表格中的10组数据中随机选出8组,设表示“非满场”的数据组数,求的分布列及数学期望.解题策略求非线性经验回归方程的步骤(1)确定变量,作出散点
20、图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出经验回归方程.(4)分析拟合效果,通过计算决定系数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性经验回归方程.角度三 残差分析例2-3 BMI指数是用体重公斤数除以身高米数的平方得出的数值,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.某中小学生成长与发展机构从某市的320名高中男体育特长生中随机选取8名,其身高和体重的数据如表所示:编号12345678身高x/cm166167160173178169158173体重y/kg5758536166575066(1)根
21、据最小二乘法的思想与公式可求得经验回归方程为=0.8x-75.9,请利用已经求得的经验回归方程,完善残差表,并求解释变量(身高)对于响应变量(体重)变化的贡献率R2;(保留两位有效数字)例2-3 BMI指数是用体重公斤数除以身高米数的平方得出的数值,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.某中小学生成长与发展机构从某市的320名高中男体育特长生中随机选取8名,其身高和体重的数据如表所示:编号12345678身高x/cm166167160173178169158173体重y/kg5758536166575066(2)通过残差分析,对于残差的最大(绝对值)的那组数据,需要确认在样本点
22、的采集中是否有人为的错误.已知通过重新采集发现,该组数据的体重应该为58 kg.请重新根据最小二乘法的思想与公式,求出男体育特长生的身高与体重的经验回归方程.解题策略决定系数R2对回归模型的检验(2)在线性回归模型中,R2表示解释变量对于响应变量变化的贡献率,R2越接近于1,表示回归的效果越好.针对训练某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(单位:万元)和销售量y(单位:万台)的数据如表所示.年份2011201220132014201520162017广告费支出x1246111319销售量y1.93.24.04.45.25.35.4
23、(1)若用线性回归模型拟合y与x的关系,求出y关于x的经验回归方程;某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(单位:万元)和销售量y(单位:万台)的数据如表所示.年份2011201220132014201520162017广告费支出x1246111319销售量y1.93.24.04.45.25.35.4某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(单位:万元)和销售量y(单位:万台)的数据如表所示.年份2011201220132014201520162017广告费支出x12461
24、11319销售量y1.93.24.04.45.25.35.4(3)已知利润z与x,y的关系为z=200y-x.根据(2)的结果回答下列问题:广告费x=20时,销售量及利润的预报值是多少?某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(单位:万元)和销售量y(单位:万台)的数据如表所示.年份2011201220132014201520162017广告费支出x1246111319销售量y1.93.24.04.45.25.35.4(3)已知利润z与x,y的关系为z=200y-x.根据(2)的结果回答下列问题:广告费x为何值时,利润的预报值最大?(
25、精确到0.01)考点四 成对数据分析中的探究创新题例3 (2021福建南平高三二模)近年来,我国加大5G基站的建设力度,基站已覆盖所有地级市,并逐步延伸到乡村.(1)现抽样调查某市所辖的A地和B地5G基站的覆盖情况,各取100个村,调查情况如表.已覆盖未覆盖A地2080B地2575视样本的频率为总体的概率,假设从A地和B地所有村中各随机抽取2个村,求这4个村中A地5G已覆盖的村比B地多的概率;思路导引 (1)利用二项分布、彼此互斥和相互独立事件的含义及概率计算公式,即可解得;例3 (2021福建南平高三二模)近年来,我国加大5G基站的建设力度,基站已覆盖所有地级市,并逐步延伸到乡村.(2)该市
26、2020年已建成的5G基站数y与月份x的数据如表,x123456789101112y2833404285477019051 1511 4231 7212 1092 6013 381思路导引 (2)利用换元,设u=ln y,则u=ln a+bx,可得u与x是线性相关关系,再根据最小二乘法求经验回归方程.反思提升 本题考查二项分布、互斥事件、相互独立事件及回归分析等基础知识,求解时应注意概率模型、回归分析模型的建立与应用,本例可以对数学建模、数据分析、逻辑推理与数学运算的数学学科素养的提升有极大的帮助.针对训练 用户满意度合计满意不满意甲企业用户75乙企业用户20合计(1)将22列联表补充完整,并判断能否有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024版通讯器材购销合同3篇
- 2025年度大型活动场地租赁及服务合同4篇
- 2025年PVC管道产品检测与质量保证服务合同范本3篇
- 2025年消防给水系统设备及工程安全防护合同3篇
- 2025年度餐饮股份合作人力资源合作协议3篇
- 2024版跨国投资风险共保协议版B版
- 二零二五版国有控股企业股权置换与混合所有制改革合同3篇
- 2025年度消防安全通道维护外包服务合同3篇
- 2024移动支付技术服务合同
- 2024版暂定协议总价协议样本版B版
- 常用静脉药物溶媒的选择
- 2023-2024学年度人教版一年级语文上册寒假作业
- 当代西方文学理论知到智慧树章节测试课后答案2024年秋武汉科技大学
- 2024年预制混凝土制品购销协议3篇
- 2024-2030年中国高端私人会所市场竞争格局及投资经营管理分析报告
- GA/T 1003-2024银行自助服务亭技术规范
- GB/T 18488-2024电动汽车用驱动电机系统
- 门诊特定病种待遇认定申请表
- 混合离子交换器使用说明书正本
- 工伤保险待遇及案例分析PPT课件
- 自控工程识图
评论
0/150
提交评论