版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3节变量间的相关关系与统计案例Ⅰ.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.Ⅱ.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.Ⅲ.了解独立性检验(只要求2×2列联表)的根本思想、方法及其简单应用.Ⅳ.了解回归分析的根本思想、方法及其简单应用.整合·主干知识1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在从左上角到右下角的区域内,两个变量的相关关系为负相关.质疑探究1:相关关系与函数关系有何异同点?提示:(1)相同点:两者均是指两个变量的关系.(2)不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.回归方程与回归分析(1)线性相关关系与回归直线如果散点图中点的分布从整体上看大致在______________附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程①最小二乘法:求回归直线使得样本数据的点到回归直线的_____________最小的方法叫做最小二乘法.一条直线距离的平方和相关关系r的绝对值越接近于1,说明两个变量的线性相关性越强.r的绝对值越接近于0,说明两个变量之间相关性越弱.通常|r|大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验(1)分类变量变量的不同“值〞表示个体所属的____________,像这样的变量称为分类变量.不同类别(2)列联表列出两个分类变量的_________,称为列联表.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d频数表(3)独立性检验利用随机变量K2来判断“两个分类变量有关系〞的方法称为独立性检验.(4)独立性检验的步骤①计算随机变量K2的观测值k,查表确定临界值k0:②如果k≥k0,就推断“X与Y有关系〞,这种推断犯错误的概率不超过P(K2≥k0);否那么,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系〞.P(K2≥k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828质疑探究2:K2≥3.841和K2≥6.635分别说明了什么问题?提示:独立性检验得出的结论带有概率性质,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值,3.841和6.635就是两个常用的临界值,一般认为当K2≥3.841时,那么有95%的把握说事件A与B有关;当K2≥6.635时,那么有99%的把握说事件A与B有关.1.下面四个散点图中点的分布状态,可以直观上判断两个变量之间具有线性相关关系的是()A.①② B.③C.②③ D.②③④解析:散点图①中的点无规律分布,范围很广,说明两个变量之间的相关程度很小;②中所有的点都在同一条直线上,是函数关系;③中点的分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;④中的点也分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系.应选B.答案:B2.(2021·枣庄模拟)下面是2×2列联表:那么表中a,b的值分别为()A.94,72 B.52,50C.52,74 D.74,52解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.应选C.答案:Cy1y2总计x1a2173x2222547总计b461203.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归直线方程为y=0.85x-85.71,那么以下结论中不正确的选项是()A.y与x具有正的线性相关关系答案:D4.x、y的取值如下表:x0134y2.24.34.86.7答案:2.65.在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算K2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是______的(有关,无关).解析:由观测值k=27.63与临界值比较,我们有99.9%的把握说打鼾与患心脏病有关.答案:有关聚集·热点题型[典例赏析1]下面是水稻产量与施化肥量的一组观测数据:施化肥量:15202530354045水稻产量:320330360410460470480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?相关关系的判断[思路索引]以水稻产量为纵轴,以施化肥量为x轴,建系描点观察点的分布情况.[解析](1)散点图如图:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长. [拓展提高]利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系,如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系,如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.[变式训练]1.(2021·镇江联考)如下图,有5组(x,y)数据,去掉______组数据后,剩下的4组数据具有较强的线性相关关系.解析:A、B、C、E大致在一条直线上,而D较远.答案:D线性回归方程[变式训练]2.(2021·南昌模拟)以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据.(1)求线性回归方程;(2)据(1)的结果估计当房屋面积为150m2时的销售价格.房屋面积x/m211511080135105销售价格y/万元24.821.618.429.222[典例赏析3](2021·石家庄模拟)为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查.得到了如下的统计结果:表1:男生上网时间与频数分布表独立性检验上网时间(分钟)[30,40)[40,50)[50,60)[60,70)[70,80]人数525302515表2:女生上网时间与频数分布表上网时间(分钟)[30,40)[40,50)[50,60)[60,70)[70,80]人数1020402010(1)从这200名学生中任抽1人,求上网时间在[50,60)间的概率.(2)完成下面的2×2列联表,并答复能否有90%的把握认为“大学生上网时间与性别有关〞?上网时间少于60分钟上网时间不少于60分钟合计男生女生合计[思路索引](1)根据古典概型求概率.(2)列2×2列联表,计算K2确定把握度.P(K2≥k0)0.1000.0500.0250.0100.005k02.7063.8415.0246.6357.879(2)上网时间少于60分钟上网时间不少于60分钟合计男生6040100女生7030100合计13070200[拓展提高]解决独立性检验的应用问题,首先要根据题目条件列出两个变量的2×2列联表,通过计算随机变量K2的观测值k,依据临界值与犯错误的概率得出结论.注意观测值的临界值与概率间的对应关系.[提醒]准确计算K2的值是正确判断的前提.[变式训练]3.(2021·东北三校联考)某学生对其亲属30人的饮食习惯进行了一次调查,并用以下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)甲(50岁以下)乙(50岁以上)12015667323679534245858618764758532809(1)根据以上数据完成以下2×2列联表:主食蔬菜主食肉类合计50岁以下50岁以上合计(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析.解析:(1)2×2列联表如下:主食蔬菜主食肉类合计50岁以下481250岁以上16218合计201030[备课札记]____________________________________________________________________________________________________提升·学科素养
(理)概率、统计案例问题的标准答题(注:对应文数热点突破之四十五)(2021·福建高考)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)〞和“25周岁以下〞分为两组,再将两组工人的日平均生产件数分成5组:[50,60)、[60,70)、[70,80)、[80,90)、[90,100]分别加以统计,得到如下图的频率分布直方图.(1)从样本中日平均生产件数缺乏60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组〞工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手〞,请你根据条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关〞?P(K2≥k)0.1000.0500.0100.001k2.7063.8416.63510.828[审题视点]由频率分布直方图列举根本领件,结合古典概型,求概率.利用独立性检验公式计算K2.[总分值展示]解:(1)由得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数缺乏60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组〞中的生产能手60×0.25=15(人),“25周岁以下组〞中的生产能手40×0.375=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100(2)列2×2列联表,其中的数字应先由频率分布直方图算出后再列表.(2021·张掖市三诊)随着工业化以及城市车辆的增加,城市的空气污染越来越严重,空气质量指数AQI一直居高不下,对人体的呼吸系统造成了严重的影响.现调查了某市500名居民的工作场所和呼吸系统健康,得到2×2列联表如下:室外工作室内工作合计有呼吸系统疾病150无呼吸系统疾病100合计200(1)补全2×2列联表;(2)你是否有95%的把握认为感染呼吸系统疾病与工作场所有关;(3)现采用分层抽样从室内工作的居民中抽取一个容量为6的样本,将该样本看成一个总体,从中随机的抽取两人,求两人都有呼吸系统疾病的概率.参考公式与临界值表:解:(1)2×2列联表如下:P(K2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828室外工作室内工作合计有呼吸系统疾病150200350无呼吸系统疾病50100150合计2003005001.二条规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,相关关系是非随机变量与随机变量的关系.(2)当K2≥3.8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 我的家乡-安徽
- 2024年小学科学实验室教学工作计划
- XX区发改局2024年统战工作计划
- 团课课件上海世博会简介
- 广西贵港桂平市2024年八年级上学期《数学》期中以及参考答案
- 鞍山市铁西区2023年八年级下学期《数学》期中试题与参考答案
- 五年级数学(小数四则混合运算)计算题专项练习及答案
- 三年级数学(上)计算题专项练习附答案
- 糜烂性毒剂中毒
- 《测量系统的组成》课件
- 第四章 营养与烹饪 第二节厨具的认识与使用 课件 七年级劳动与技术课
- 《走进中国高铁》课件
- 脊柱内镜技术
- 《钳工工艺学》课件
- 三年级数学上册易错题集锦(附答案)
- 穴位注射-针灸学ppt
- 造价咨询公司规章制度及管理办法
- 国家开放大学《机械制造基础》形考任务1-4参考答案
- 私董会保密协议
- 高级流行病学与医学统计学智慧树知到课后章节答案2023年下浙江中医药大学
- 刑法学(上册)(第二版) 课件 第5、6章 犯罪客体、犯罪客观方面
评论
0/150
提交评论