样本相关系数课件_第1页
样本相关系数课件_第2页
样本相关系数课件_第3页
样本相关系数课件_第4页
样本相关系数课件_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章成对数据的统计分析8.1.2样本相关系数李思

这两组成对变量都是线性正相关,你能判断哪一组的线性相关性更强吗?通过散点图可以推断两个变量之间是否存在相关关系、是正相关还是负相关、是线性相关是非线性相关,但这些推断是定性的推断.从定量的角度刻画成对样本数据的线性相关程度,进而推断两个变量的线性相关程度。样本相关数r根据散点图特征,初步构造统计量:年龄/岁脂肪含量/%中心化成对样本数据:将数据以

为零点进行平移,得到平移后的数据为:

通过绘图分析可得,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多,如图(1)所示;

如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多,如图(2)所示.利用散点

的横纵坐标是否同号,可以构造一个量:一般情形下,

表明成对样本数据正相关;

表明成对样本数据负相关.

问题:你认为

的大小一定能度量出成对样本数据的相关程度吗?在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位由米改为厘米,单位的改变不会改变体重与身高之间的相关程度。为了消除单位的影响,进一步做“标准化”处理:为简单起见,把上述“标准化”处理后的成对数据分别记为:仿照Lxy的构造,可以得到样本相关系数:样本相关系数r是一个描述成对样本数据的数字特征,它反映了两个随机变量之间的线性相关程度.r的符号反映了相关关系的正负性.|r|的大小反映了两个变量线性相关的程度,即散点集中于一条直线的程度.我们称r为变量x和变量y的样本线性相关系数,简称样本相关系数.当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.

样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征.样本相关系数r的正负能反映出成对变量的什么关系?标准化处理后的成对样本数据:设其第一分量为设其第二分量为

新知探究

样本相关系数r的取值范围:样本相关系数r的取值范围为[-1,1]相关系数的性质:①当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.②|r|≤1;③当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.注意:若0.75≤|r|≤1,则认为y与x的线性相关程度很强;

若0.3≤|r|<0.75,则认为y与x的线性相关程度一般;若|r|≤0.25,则认为y与x的线性相关程度较弱)图(1)中成对样本数据的正线性相关程度很强.图(2)中成对样本数据的负线性相关程度比较强.图(3)中对样本数据的线性相关程度很弱.图(4)中成对样本数据的线性相关程度极弱.练习1判断正误(正确的打“√”,错误的打“×”)(1)相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.(

)(2)散点图越接近某一条直线,线性相关程度越强,样本相关系数越大.()(3)散点图可以直观地分析出两个变量是否具有相关性.(

)(4)若变量x,y满足函数关系,则这两个变量线性相关.(

)×√×√练习2已知求得甲、乙、丙3组不同的数据的样本相关系数分别为0.81,-0.98,0.63,其中________(填甲、乙或丙)组数据的线性相关程度最强.乙

例1根据表8.1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.解:由样本数据可得由此可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.编号1234567891011121314年龄/岁2327394145495053545657586061脂肪含量/%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6

变式1

在一次试验中,测得(x,y)的4组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的样本相关系数为(

)A.1 B.-2C.0 D.-1√解:由样本数据可得√变式3

两个变量x,y的样本相关系数r1=0.7859,两个变量u,v的样本相关系数r2=-0.9568,则下列判断正确的是(

)CA.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强解析由样本相关系数r1=0.7859>0知x与y正相关,由样本相关系数r2=-0.9568<0知u,v负相关.又|r1|<|r2|,∴变量u与v的线性相关性比x与y的线性相关性强.

例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如表所示.体重与身高、臂展与身高分别具有怎样的相关性?解:根据样本数据画出体重与身高、臂展与身高的散点图,分别如图(1)和(2)所示,两个散点图都呈现出线性相关的特征.

题型一:相关系数的计算

21232527293235711212466115325

21232527293235711212466115325

课本103页1.已知变量x和变量y的3对随机观测数据(2,2),(3,-1),(5,-7),计算成对样本数据的样本相关系数.能据此推断这两个变量线性相关吗?为什么?解:由样本数据可得虽然样本相关系数为-1,三个样本点在一条直线上,但是由于样本量太小,据此推断两个变量完全线性相关并不可靠.例2

假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:x23456y2.23.85.56.57.0所以y与x之间具有正相关关系.

练习2.随机抽取7家超市,得到其广告支出与销售额数据如下:解:由样本数据可得正线性相关,相关性较强,销售额与广告支出的变化趋势相同.超市ABCDEFG广告支出/万元1246101420销售额/万元19324440525354请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.课堂小结:1.样本相关系数:2.相关系数的性质:①当r>0时,称成对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论