版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章成对数据的统计分析8.1.2样本相关系数李思
这两组成对变量都是线性正相关,你能判断哪一组的线性相关性更强吗?通过散点图可以推断两个变量之间是否存在相关关系、是正相关还是负相关、是线性相关是非线性相关,但这些推断是定性的推断.从定量的角度刻画成对样本数据的线性相关程度,进而推断两个变量的线性相关程度。样本相关数r根据散点图特征,初步构造统计量:年龄/岁脂肪含量/%中心化成对样本数据:将数据以
为零点进行平移,得到平移后的数据为:
通过绘图分析可得,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多,如图(1)所示;
如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多,如图(2)所示.利用散点
的横纵坐标是否同号,可以构造一个量:一般情形下,
表明成对样本数据正相关;
表明成对样本数据负相关.
问题:你认为
的大小一定能度量出成对样本数据的相关程度吗?在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位由米改为厘米,单位的改变不会改变体重与身高之间的相关程度。为了消除单位的影响,进一步做“标准化”处理:为简单起见,把上述“标准化”处理后的成对数据分别记为:仿照Lxy的构造,可以得到样本相关系数:样本相关系数r是一个描述成对样本数据的数字特征,它反映了两个随机变量之间的线性相关程度.r的符号反映了相关关系的正负性.|r|的大小反映了两个变量线性相关的程度,即散点集中于一条直线的程度.我们称r为变量x和变量y的样本线性相关系数,简称样本相关系数.当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.
样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征.样本相关系数r的正负能反映出成对变量的什么关系?标准化处理后的成对样本数据:设其第一分量为设其第二分量为
新知探究
样本相关系数r的取值范围:样本相关系数r的取值范围为[-1,1]相关系数的性质:①当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.②|r|≤1;③当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.注意:若0.75≤|r|≤1,则认为y与x的线性相关程度很强;
若0.3≤|r|<0.75,则认为y与x的线性相关程度一般;若|r|≤0.25,则认为y与x的线性相关程度较弱)图(1)中成对样本数据的正线性相关程度很强.图(2)中成对样本数据的负线性相关程度比较强.图(3)中对样本数据的线性相关程度很弱.图(4)中成对样本数据的线性相关程度极弱.练习1判断正误(正确的打“√”,错误的打“×”)(1)相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.(
)(2)散点图越接近某一条直线,线性相关程度越强,样本相关系数越大.()(3)散点图可以直观地分析出两个变量是否具有相关性.(
)(4)若变量x,y满足函数关系,则这两个变量线性相关.(
)×√×√练习2已知求得甲、乙、丙3组不同的数据的样本相关系数分别为0.81,-0.98,0.63,其中________(填甲、乙或丙)组数据的线性相关程度最强.乙
例1根据表8.1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.解:由样本数据可得由此可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.编号1234567891011121314年龄/岁2327394145495053545657586061脂肪含量/%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6
变式1
在一次试验中,测得(x,y)的4组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的样本相关系数为(
)A.1 B.-2C.0 D.-1√解:由样本数据可得√变式3
两个变量x,y的样本相关系数r1=0.7859,两个变量u,v的样本相关系数r2=-0.9568,则下列判断正确的是(
)CA.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强解析由样本相关系数r1=0.7859>0知x与y正相关,由样本相关系数r2=-0.9568<0知u,v负相关.又|r1|<|r2|,∴变量u与v的线性相关性比x与y的线性相关性强.
例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如表所示.体重与身高、臂展与身高分别具有怎样的相关性?解:根据样本数据画出体重与身高、臂展与身高的散点图,分别如图(1)和(2)所示,两个散点图都呈现出线性相关的特征.
题型一:相关系数的计算
21232527293235711212466115325
21232527293235711212466115325
课本103页1.已知变量x和变量y的3对随机观测数据(2,2),(3,-1),(5,-7),计算成对样本数据的样本相关系数.能据此推断这两个变量线性相关吗?为什么?解:由样本数据可得虽然样本相关系数为-1,三个样本点在一条直线上,但是由于样本量太小,据此推断两个变量完全线性相关并不可靠.例2
假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:x23456y2.23.85.56.57.0所以y与x之间具有正相关关系.
练习2.随机抽取7家超市,得到其广告支出与销售额数据如下:解:由样本数据可得正线性相关,相关性较强,销售额与广告支出的变化趋势相同.超市ABCDEFG广告支出/万元1246101420销售额/万元19324440525354请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.课堂小结:1.样本相关系数:2.相关系数的性质:①当r>0时,称成对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 云南警官学院《柳琴戏艺术概论》2023-2024学年第一学期期末试卷
- 配电设施运行安全与事故预防制度
- 餐厅业绩月度总结模板
- 业务操作-房地产经纪人《业务操作》真题汇编3
- 全球旅游业年度总结模板
- 三育人先进个人主要事迹
- 二零二五年饭店员工劳动合同及员工培训经费保障合同2篇
- 人教版三年级数学下册第四单元两位数乘两位数综合卷(含答案)
- 二零二五版小学教师岗位绩效评价与激励机制合同3篇
- 烟台南山学院《工程管理专业概论》2023-2024学年第一学期期末试卷
- 爱的五种语言--课件
- 农村共建房屋协议书(2篇)
- 公路工程施工现场安全检查手册
- 公司组织架构图(可编辑模版)
- 陕西省铜川市各县区乡镇行政村村庄村名居民村民委员会明细
- 礼品(礼金)上交登记台账
- 北师大版七年级数学上册教案(全册完整版)教学设计含教学反思
- 2023高中物理步步高大一轮 第五章 第1讲 万有引力定律及应用
- 青少年软件编程(Scratch)练习题及答案
- 浙江省公务员考试面试真题答案及解析精选
- 系统性红斑狼疮-第九版内科学
评论
0/150
提交评论