版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五节变量间的相关关系、统计案例第九章算法初步、统计与统计案例考纲要求1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解下列两种常用的统计方法,并能应用这些方法解决一些实际问题.(1)独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(2)回归分析:了解回归分析的基本思想、方法及其简单应用.课前自修知识梳理1.散点图.(1)将变量所对应的点描出来,就组成了变量之间的一个图,这种图为变量之间的________.(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势可用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.2.相关关系.(1)从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为________;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为________.散点图正相关负相关(2)线性相关:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做________.(3)若两个变量x和y的散点图中,所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关是__________的.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.3.回归直线.(1)最小二乘法:如果有n个点:(x1,y1),(x2,y2),…,(xn,yn)可以用下面的表达式来刻画这些点与回归直线的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2,使得上式达到最小值的就是我们要求的直线,这种方法称为最小二乘法.回归直线非线性相关(1)当r>0时,表明两个变量________;(2)当r<0时,表明两个变量________;(3)r的绝对值越接近1,表明两个变量的线性相关性________;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.当|r|∈[0.3,0.75)时,相关性一般.当|r|∈[0,0.25]时,相关性较弱.正相关负相关越强
5.残差分析.
(1)线性回归模型:y=bx+a+e中,a,b称为模型的未知参数;e称为随机误差.
(2)残差平方和:对于样本点(xi,yi)(i=1,2,…,n),Q=称为残差平方和,Q值越小,说明线性回归模型的拟合效果越好.
(3)相关指数:用相关指数R2来刻画回归的效果,公式是R2=1-.R2的值越大,说明残差平方和越小,也就是说模型拟合效果________.越好6.独立性检验.(1)若变量的不同“值”表示个体所属的不同类型,则这类变量称为分类变量.(2)列出两个分类变量的频数表,称为列联表.(3)利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的____________________.独立性检验2×2列联表独立性检验公式K2=__________________________________.y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d基础自测1.下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.其中正确的命题为(
)A.①③④
B.②④⑤C.③④⑤
D.②③⑤答案:C2.用独立性检验来考察两个变量x与y是否有关系,当统计量K2的值(
)A.越大,“x与y是有关系的”成立可能性越小B.越大,“x与y是有关系的”成立可能性越大C.越小,“x与y是没有关系的”成立可能性越小D.与“x与y有关系”成立的可能性无关答案:B3.(2012·湛江市二模)通过随机询问110名大学生是否爱好某项运动,得到如下的列联表:由上表算得k≈7.8,因此得到的正确结论是(
)男女总计爱好402060不爱好203050总计6050110A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”解析:根据K2的临界值表和独立性检验的概念知,选项C正确.答案:C(2011·辽宁卷)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由题意得
2-1=[0.254(x+1)+0.321]-[0.254x+0.321]=0.254,即家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案:0.254考点探究考点一利用散点图判断两个变量的相关关系【例1】
(1)观察下列各图形:其中两个变量x,y具有相关关系的图形是(
)A.①②
B.①④C.①②④
D.②③④(2)下表是某地的年降雨量
y(单位:mm)与年平均气温x(单位:℃)的数据资料,两者是(
)年平均气温x/℃12.5112.8412.8413.6913.3312.7413.05年降雨量y/mm748542507813574701432A.正相关关系B.负相关关系C.非线性相关关系D.不具有相关关系点评:(1)在散点图中,如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.(2)散点图的最大优点就是直观,并且制作散点图也较为方便,因此散点图在判断两个变量是否相关的过程中起着重要作用.散点图是判断两个变量是否相关的方法之一,至于相关性的强弱还要利用相关系数来判断.解析:(1)相关关系有两种情况:所有点看上去都在一条直线附近波动,是线性相关;若所有点看上去都在某条曲线(不是一条直线)附近波动,是非线性相关.由图可以看出,①②是线性相关,④是非线性相关的.只有③是不相关的.故选C.(2)以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如图所示.由图可以看出某地的年降雨量(mm)与年平均气温(℃)不具有相关关系.故选D.答案:(1)C
(2)D变式探究1.(1)有五组变量:①汽车的重量和汽车每消耗1升汽油所行使的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和身体健康情况;④圆的半径与面积;⑤汽车的重量和每公里耗油量.其中两个变量成正相关的是(
)A.①③
B.②④C.②⑤
D.④⑤(2)有10名同学高一(x)和高二(y)的数学成绩如下:则两个变量x和y(
) A.没有相关关系B.有正相关关系C.有负相关关系D.无法判断高一成绩x74717268767367706574高二成绩y76757170767965776272解析:(1)由正相关与负相关的概念知②⑤是正相关,①③是负相关,④为函数关系.故选C.(2)以高一成绩为x轴,高二成绩为y轴,画出散点图如图,可以看出,这些点在一条直线附近波动,且y随着x增加而增加,所以x与y有正相关关系.故选B.答案:(1)C
(2)B考点二求回归直线方程【例2】
某工厂某产品产量与单位成本成线性相关关系,数据如下:根据以上数据求线性回归方程.月份产量x/千件单位成本y/(元/件)x2xy127341462372921634711628443739219546916276656825340合计21426791481点评:(1)最小二乘法是一种有效地求回归方程的方法,它保证了各点与此直线在整体上最接近,最能反映样本观测数据的规律.(2)用最小二乘法求回归直线方程的步骤:①判断是否线性相关,可用散点图判断,也可以用残差分析、相关指数判断;②如果是线性相关,先计算的值,再代入公式的值;③写出直线回归方程.变式探究如表,其提供了某厂节能降耗技术改造生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对应数据.
(1)请画出表中数据的散点图;(2)请根据表中提供的数据,用最小二乘法求出y关于x的回归方程=.x3456y2.5344.5解析:(1)依题设所给数据,可得散点图如图.考点三利用回归直线方程对总体进行估计【例3】营养学家为研究食物中蛋白质含量对婴幼儿生长的影响,调查了一批年龄在两个月到三岁的婴幼儿,将他们按食物中蛋白质含量的高低分为高蛋白食物组和低蛋白食物组两组,并测量身高,得到下面的数据:高蛋白食物组:年龄0.20.50.8111.41.8222.52.532.7身高5454.363666973828380.39193.29494低蛋白食物组:身高与年龄近似有线性关系,检验:不同食物的婴幼儿的身高有无差异;若存在,这种差异有何特点.年龄0.40.7111.5222.42.831.31.80.23身高52556163.46668.567.972767465695177对低蛋白食物组,设年龄为x,身高为y,同样可得线性回归方程=51.226+8.686x,通过对斜率、截距进行比较,可以看出不同食物对婴儿的身高有显著的差异,且高蛋白食物组同龄婴幼儿身高明显高些.点评:线性回归分析的主要作用是通过对两个变量已有数据的分析,来预测这两个变量的变化趋势,一般步骤是:①进行线性相关性检验;②如果具有线性相关性,求出线性回归方程;③将观测值代入回归方程进行预测.变式探究3.某班5名学生的数学和物理成绩如下表:(1)画出散点图;(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.学生ABCDE
数学成绩x/分8876736663物理成绩y/分7865716461解析:(1)散点图如图.考点四独立性检验序号123456789数学成绩957580949265678498序号101112131415161718数学成绩716793647877905783【例4】
某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表所示序号123456789物理成绩906372879171588293序号101112131415161718物理成绩817782488569916184若单科成绩85分以上(含85分),则该科成绩为优秀.(1)根据上表完成下面的2×2列联表(单位:人).数学成绩优秀数学成绩不优秀
合计物理成绩优秀物理成绩不优秀合
计20(2)根据题(1)中表格的数据计算,有多大的把握,认为学生的数学成绩与物理成绩之间有关系?(3)若从这20个人中抽出1人来了解有关情况,求抽到的学生数学成绩与物理成绩至少有一门不优秀的概率.参考数据①假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:则随机变量K2=,其中n=a+b+c+d为样本容量;y1y2合计x1aba+bx2cdc+d合计a+cb+da+b+c+d②独立检验随机变量K2的临界值参考表:P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828解析:(1)2×2列联表为(单位:人):数学成绩优秀数学成绩不优秀合计物理成绩优秀
5
27物理成绩不优秀
1
1213合计
6
1420(2)提出假设H0:学生数学成绩与物理成绩之间没有关系.根据列联表可以求得K
2=≈8.802>7.879.当H0成立时,P(K2>7.879)=0.005.所以我们有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.(3)由(1)可知数学成绩与物理成绩都优秀的学生的人数为5人,则数学成绩与物理成绩至少有一门不优秀的学生人数为15人.故从20名学生中抽出1名,抽到的学生数学成绩与物理成绩至少有一门不优秀的概率为=.点评:独立性检验的一般步骤:(1)列出2×2列联表,假设两个变量无关系;(2)根据公式K2=计算K2的值;(3)比较K2与临界值的大小关系作出统计推断.变式探究(2012·罗定中学模拟)某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,可以有____________%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.超重不超重合计偏高415不偏高31215合计71320附:独立性检验临界值表:
独立性检验随机变量K2值的计算公式:P(K2≥k0)0.0250.0100.0050.001k05.0246.6357.87910.828解析:K2=≈5.934>5.024,由K2的临界值表可知,有97.5%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.答案:97.5课时升华1.对两个变量的线性关系情况的判断有两个方法:一是根据散点图,这种方法是从图形上粗略地观察,比较直观、简单易行,但往往对相关程度刻画得不够准确;二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强,相关系数就是描述相关性强弱的,相关性有正相关和负相关,强相关和弱相关.2.建立回归模型的步骤:(1)确定研究对象,明确解释变量和预报变量;(2)画出散点图,观察它们之间的关系(如是否具有线性相关关系);(3)由经验确定回归方程的类型,主要是线性回归模型;(4)用最小二乘法求线性回归方程;(5)最后是相关性检验,若存在异常,则检查数据是否有误,或模型是否合适.3.利用独立性检验可以考查两个分类变量是否有关系,并能较为准确地给出这种判断的可信度.具体做法是根据公式,计算随机变量的观测值k,k值越大,说明“两个变量有关系”的可能性越大.感悟高考品味高考1.(2012·湖南卷)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是(
)A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg解析:根据回归方程的概念和性质知选项A,B,C三项均正确,选项D错误,线性回归方程只能预测学生的体重.选项D应改为“若该大学某女生身高为170cm,则估计其体重大约为58.79kg”.答案:D2.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:(1)由表中数据直观分析,收看新闻节目的观众是否与年龄有关?(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众年龄为20至40岁的概率.文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100解析:(1)有关.收看新闻节目多为年龄大的.(2)应抽取的人数为:5×=3(人).(3)由(2)知,抽取的5名观众中,有2名观众年龄处于20至40岁,3名观众的年龄大于40岁.记大于40岁的人为a1,a2,a3,20至40岁的人为b1,b2,则从5人中抽取2人的基本事件有(a1,a2),(a1,a3),(a2,a3),(b1,b2),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),共10个,其中恰有1人为20至40岁的基本事件有(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),共6个,因此所求的概率P==.=高考预测1.(2012·江门市一模)有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据如下表:
根据以上数据,用线性回归的方法,求得销售额y与平均气温x之间线性回归方程y=x+的系数=-2.4,则预测平均气温
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025语文教研组工作计划
- 火灾安全评估与服务合同
- 制造业疫情应急演练方案
- 2025交通事故致人死亡赔偿协议书14篇
- 借款借贷合同协议书七篇
- 补水美容病因介绍
- 内蒙古通辽市(2024年-2025年小学六年级语文)统编版能力评测(下学期)试卷及答案
- 全国赛课一等奖初中统编版七年级道德与法治上册单元思考与行动《追求美好人生》精美课件
- (2024年)艺术学校建设项目可行性研究报告
- 【中职专用】中职对口高考-机电与机制类专业-核心课-模拟试卷1(河南适用)(答案版)
- 装饰装修工程售后服务具体措施
- 糖皮质激素类药物临床应用指导原则(2023年)
- 世界的海陆分布、世界的地形复习提纲
- 门诊挂号系统实验报告
- 53工厂质量保证能力要求00C-005
- 百家宴活动方案
- 高一英语期末考试试卷分析
- 基于STM32单片机的智能浇花系统设计
- 汽车订购合同范本经典版
- 双梁抓斗桥式起重机大修施工方案【完整版】
- T-CAAMTB 97.9-2022 电动中重卡共享换电车辆及换电站建设技术规范 第9部分:换电电池包通信协议要求
评论
0/150
提交评论