版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.1.2样本(线性)相关系数【引例】下面两幅散点图中,哪幅图的线性相关程度更高?【思考】散点图只能定性分析,有没有什么方法能够定量分析线性相关程度的呢?对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),‧‧‧,(xn,yn),其中x1,x2,‧‧‧,xn和y1,y2,‧‧‧,yn的均值分别为和.将数据以
为零点进行平移,得到平移后的成对数据为并绘制散点图.1.中心化年龄/岁脂肪含量/%中心化通过绘图分析可得,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多,如图(1)所示;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多,如图(2)所示.利用散点的横、纵坐标是否同号,可以构造一个量一般情形下,Lxy>0表明成对样本数据正相关;Lxy<0表明成对样本数据负相关.在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位由米改为厘米,单位的改变不会改变体重与身高之间的相关程度。我们发现,
的大小与数据的度量单位有关,所以不能直接用它度量成对样本数据线性相关程度的大小。【思考】Lxy的大小是否一定能说明成对样本数据的相关程度不同?因为Lxy的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小.为了消除度量单位的影响,需要对数据作进一步的“标准化”处理(将数据化为均值为0,方差为1).我们用2.标准化【思考】对于标准化后的散点图中,什么情况表示线性相关程度最高?样本相关系数:样本相关系数r是一个描述成对样本数据的数字特征,它反映了两个随机变量之间的线性相关程度.r的符号反映了相关关系的正负性.|r|的大小反映了两个变量线性相关的程度,即散点集中于一条直线的程度.样本相关系数:相关系数的性质:①当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.②|r|≤1;③当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.注意:若0.75≤|r|≤1,则认为y与x的线性相关程度很强;
若0.3≤|r|<0.75,则认为y与x的线性相关程度一般;若|r|≤0.3,则认为y与x的线性相关程度较弱图(1)中成对样本数据的正线性相关程度很强.图(2)中成对样本数据的负线性相关程度比较强.图(3)中对样本数据的线性相关程度很弱.图(4)中成对样本数据的线性相关程度极弱.【思考】中心化后数据形态不改变,但标准化后会相对变化,那为何可用标准化后的数据表示原数据的线性相关程度?二者有无区别?练习1判断正误(正确的打“√”,错误的打“×”)(1)相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.(
)(2)散点图越接近某一条直线,线性相关程度越强,样本相关系数越大.()(3)散点图可以直观地分析出两个变量是否具有相关性.(
)(4)若变量x,y满足函数关系,则这两个变量线性相关.(
)×√×√练习2已知求得甲、乙、丙3组不同的数据的样本相关系数分别为0.81,-0.98,0.63,其中________(填甲、乙或丙)组数据的线性相关程度最强.乙
例1根据表8.1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.解:由样本数据可得由此可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.编号1234567891011121314年龄/岁2327394145495053545657586061脂肪含量/%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6
例1根据表8.1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.编号1234567891011121314年龄/岁2327394145495053545657586061脂肪含量/%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6解:由样本数据可得由此可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.
变式1
在一次试验中,测得(x,y)的4组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的样本相关系数为_______.解:由样本数据可得【练】以下是收集到的新房屋的销售价格y(万元)和房屋的大小x(m2)的数据.房屋大小x/m211511080135105销售价格y/万元24.821.618.429.222(1)画出数据的散点图;【例2】(1)对四组成对样本数据进行统计,获得以下散点图,关于其样本相关系数的比较,正确的是A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3√【练】甲、乙、丙、丁四位同学各自对a,b两变量的线性相关性做试验,并分别求得样本相关系数r如下表:则____同学的试验结果体现a,b两变量有更强的线性相关性.
甲乙丙丁r-0.82-0.78-0.69-0.85丁线性相关强弱的判断方法(1)散点图:散点图只是粗略作出判断,其图象越接近直线,线性相关性越强.(2)样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关性越强.小结:1.样本相关系数:2.相关系数的性质:①当r>0时,称成对样本数据正相关;当r<0时,称成
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园主题工作计划
- 建筑工程公司文员岗位职责(3篇)
- 福建省百校联考2024-2025学年高三年级上册10月测评英语试卷(含答案)
- 消防安全常记心间的广播稿(34篇)
- 新教材高考地理二轮复习综合题专项训练二原因分析类含答案
- 测量初步与简单机械运动(原卷版)-2023年中考物理二轮复习专练
- 山东省德州禹城市2024-2025学年五年级上学期期中考试科学试题
- 河北省保定市阜平县2024-2025学年八年级上学期期中生物学试题(含答案)
- 2024-2025学年福建省漳州市十校联盟高二上学期期中质量检测联考数学试卷(含答案)
- 物质的共存检验鉴别和除杂(专项训练)-2022年中考化学二轮复习
- 【物料】活动物料手册共80页课件
- 园林制图课件透视
- 第五章电能计量装置的接线检查第二节电量的抄读及退补电量的计算
- 汉语拼音发音口型及配图[新版]
- 注塑IPQC培训教材
- 现场技术服务确认单
- 恶性心律失常及常见心律失常识别与急诊处理
- 沪教版七年级上册数学复习知识点考点总结归纳提纲
- 砂石项目盈利能力分析报告(范文)
- 第13课 规划每一天
- 2022年医院文书档案保管期限
评论
0/150
提交评论