成对数据的统计相关性课件-高二下学期数学人教A版选择性_第1页
成对数据的统计相关性课件-高二下学期数学人教A版选择性_第2页
成对数据的统计相关性课件-高二下学期数学人教A版选择性_第3页
成对数据的统计相关性课件-高二下学期数学人教A版选择性_第4页
成对数据的统计相关性课件-高二下学期数学人教A版选择性_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.1.1变量间的相关关系8.1.2样本相关系数8.1成对数据的统计相关性一、变量的相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(在相关关系中,变量y的值不能随变量x的值的确定而唯一确定。)①子女身高y与父亲身高x之间的关系②商品销售收入y与广告支出x之间的关系③空气污染指数y与汽车保有量x之间的关系④粮食亩产量y与施肥量x之间的关系二、变量的相关关系判定散点图:成对数据都可用直角坐标系中的点表示,有这些点构成的统计图案例探究:刻画人体脂肪含量和年龄的相关关系探究:在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如表所示.

表中每个编号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据.编号1234567891011121314年龄2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6思考:根据以上数据,你能直观刻画并推断人体的脂肪含量与年龄之间存在怎样的关系吗?散点图脂肪含量与年龄之间存在相关关系从整体上看,(1)当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,则称两个变量正相关;(2)当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.(3)如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.线性相关三、变量的相关关系的类型(4)如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.非线性相关(曲线相关)(5)散点杂乱无章,无规律可言,无相关性散点杂乱无章,无规律可言,无相关性观察散点图中成对样本数据的分布规律,可大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等.散点图是描述成对数据之间关系的一种直观方法.线性相关非线性相关(曲线相关)存在正相关或负相关总结x10151720252832y11.31.822.62.73.3解:(1)散点图如右图所示:(2)由图可知,所有数据点接近直线排列,因此,认为y与x有线性相关关系,且为正相关.例1.某公司的利润y(单位:千万元)与销售总额x(单位位:千万元)之间有如下表对应数据:(1)画出散点图;(2)判断y与x是否具有线性相关关系X30252015100535Y0.511.522.533.5·······例2以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:房屋面积(平方米)

617011511080135105销售价格(万元)

12.215.324.821.618.429.222画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关,是否为线性相关?由散点图可见,两者之间具有正相关关系。是线性相关我们称r为变量x和变量y的样本相关系数.样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征。

样本相关系数r定量度量线性相关强弱的量值。

四、样本相关系数r(线性相关的判定可利用散点图定性的直观判定,也可利用相关系数r定量的判定。)样本相关系数r的取值范围样本相关系数r的取值范围为[-1,1]当|r|=1时

,向量

共线。

即存在实数,使得

成对样本数据(xi,yi)都落在直线

即此时两个变量之间满足一种线性(函数)关系,即满足完全线性相关.①r的正负:反映成对样本数据的变化趋势样本(线性)相关系数r的性质②r的范围:−1≤r≤1③|r|的大小:反映成对样本数据线性相关的程度(即散点集中于某条直线的程度):|r|越接近1:线性相关程度越强;|r|越接近0:线性相关程度越弱.r=0时,只表明成对样本数据间无线性相关关系,但不排除它们有其他相关关系.④r=1函数关系(样本容量越大,用样本相关系数r估计两个变量的线性相关关系的效果越好。

相关系数r只定量判定线性相关关系)年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6

参考数据:例1根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度解:先画出散点图,如右图所示观察散点图,可以看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关.

由样本相关系数𝑟≈0.97,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强。脂肪含量与年龄变化趋势相同.参考数据:例1根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度散点图可以从直观上判断成对样本数据的相关性,通过样本相关系数则可以从定量的角度刻画成对样本数据相关的正负性和线性相关程度.解:第n年12345678910居民年收入/亿元32.231.132.935.837.138394344.646A商品销售额/万元25.030.034.037.039.041.042.044.048.051.0画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.居民年收入/亿元504540352030253035404550·······55A商品销售额/万元···例2有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.从散点图看,A商品销售额与居民年收入的样本数据呈现线性相关关系.例题点拨例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表所示.体重与身高、臂展与身高分别具有怎样的相关性?解:先画出散点图,如图所示.从散点图看,两个散点图都呈现出线性相关.通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正线性相关.r1≈0.34∵r2>r1,∴臂展与身高的相关程度更高.r2≈0.78【注】在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断.实际理解与运用P104-3.根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:两个变量的样本相关系数是否为1?若不是,请你解释其中的原因.析:计算可得r≈0.9997由此可得,弹簧伸长长度x和相应所受外力F几乎完全正线性相关,样本数据没有完全正线性相关,跟测量存在误差、弹簧制造工艺等因素有关.实际理解与运用P104-4.某地区的环境条件适合天鹅栖息繁衍.有人发现了一个有趣的现象:该地区有5个村庄,其中3个村庄附近栖息的天鹅较多,婴儿出生率也较高;2个村庄附近栖息的天鹅较少,婴儿的出生率也较低.有人认为婴儿出生率和天鹅数之间存在相关关系,并得出一个结论:天鹅能够带来孩子.

你同意这个结论吗?为什么?从5对统计数据看,婴儿出生率和天

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论