




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1直线相关直线相关2直线相关的掌握要点直线相关的掌握要点 直线相关描述了什么问题?直线相关描述了什么问题? 直线相关分析的具体步骤是什么?直线相关分析的具体步骤是什么? 直线相关分析对资料有什么要求?直线相关分析对资料有什么要求? 如何对这些要求进行检查或检验?如何对这些要求进行检查或检验? 仅用样本直线相关系数能否说明相关程度?仅用样本直线相关系数能否说明相关程度? 总体相关系数非常接近总体相关系数非常接近1,能否说明,能否说明Y=X?3线性相关线性相关 例:考察身高与体重的伴随关系例:考察身高与体重的伴随关系 体重身高4线性相关线性相关 图中图中不是每个身材较高的对象必有较重不是每个身材较
2、高的对象必有较重的体重,但大多数对象的体重的体重,但大多数对象的体重Y与其身与其身高高X的变化呈一种伴随增大或减小的直的变化呈一种伴随增大或减小的直线变化趋势,这种现象称为直线相关线变化趋势,这种现象称为直线相关 。 刻画两个随机变量之间线性相关程度刻画两个随机变量之间线性相关程度称为线性相关称为线性相关(linear correlation)5线性相关线性相关 称称X和和Y伴随同时上升或伴随下降为线性伴随同时上升或伴随下降为线性正相关正相关(Linear Positive Correlation) X与与Y的反方向伴随直线变化趋势称为线的反方向伴随直线变化趋势称为线性负相关性负相关(line
3、ar negative correlation) X和和Y无任何直线伴随变化趋势,则称为无任何直线伴随变化趋势,则称为零相关零相关 (零线性相关零线性相关) 。6线性相关系数线性相关系数 直线相关系数直线相关系数(linear correlation coeffiecient) ,简称相关系数。,简称相关系数。 相关系数是描述两个变量之间线性相相关系数是描述两个变量之间线性相关的程度和相关方向的统计指标。关的程度和相关方向的统计指标。 7线性相关系数线性相关系数 描述全体研究对象的两个变量之间描述全体研究对象的两个变量之间线性相关性的相关系数称为总体相线性相关性的相关系数称为总体相关系数,记为
4、关系数,记为 。 描述样本资料的两个变量之间的线描述样本资料的两个变量之间的线性相关性的相关系数为样本相关系性相关性的相关系数为样本相关系数,简称相关系数,记为数,简称相关系数,记为r。8样本相关系数的计算样本相关系数的计算 一般而言,总体相关系数一般而言,总体相关系数 是未知的,是未知的,通常用样本相关系数通常用样本相关系数r进行估计。样本相进行估计。样本相关系数关系数r按下式计算:按下式计算: 上述相关系数又称为上述相关系数又称为Pearson相关系数相关系数22()()()()XX YYrXXYY9相关系数性质相关系数性质 无量纲无量纲 取值范围为取值范围为1 1 ,1 r 1 0表示正
5、相关;表示正相关; t0.05/2,n-2时,拒绝时,拒绝H0 : 0 可以认为两个变量呈线性相关可以认为两个变量呈线性相关( 0) 。221rtnr18实例分析(续)实例分析(续) H0: 0 H1: 0 0.05 临界值临界值t0.05/2,15-2=2.16, |t| t0.05/2,15-2 故拒绝故拒绝H0 : 0 ,可以认为凝血酶浓,可以认为凝血酶浓度度y及凝血时间及凝血时间x呈线性负相关呈线性负相关( 0) 。2220.926 1528.8711 ( 0.926)r ntr 19相关系数的相关系数的95%可信区间计算可信区间计算 由于由于0的样本相关系数的样本相关系数r呈偏态分呈
6、偏态分布,故需作布,故需作z变换变换 ,方法如下:,方法如下: 其中其中111ln N(,)21 3zrzrn11ln21z20相关系数的相关系数的95%可信区间计算可信区间计算 z 的的95%可信区间为可信区间为 反变换后反变换后 的的95%可信区间为可信区间为 1.96/3zn2(1.96/3)2(1.96/3) 11 znznee21实例实例 的的95%可信区间计算可信区间计算 Z变换:变换: z 的的95%可信区间为可信区间为1111 ( 0.926)lnln1.632121 ( 0.926)rzr 1.63 1.96/ 1532.20 1.64 22 Z的反变换的反变换 的下限为的下
7、限为 的上限为的上限为 凝血酶浓度凝血酶浓度y及凝血时间及凝血时间x 的总体相关的总体相关系数系数 的的95%可信区间为可信区间为(-0.976,-0.787)实例实例 的的95%可信区间计算可信区间计算2 (-2.20)2 (-2.20)e1=-0.976e1 L2 (-1.06)2 (-1.06)e1=-0.787e1 U23线性相关与直线回归的异同性回归系数很大,相关性很弱回归系数很大,相关性很弱回归系数很小,相关性较强回归系数很小,相关性较强24线性相关与直线回归的异同性线性相关与直线回归的异同性 回归系数回归系数 刻画了刻画了X变化一个单位,变化一个单位,Y平平均变化多少单位,与相关
8、性没有直接联系。均变化多少单位,与相关性没有直接联系。即:回归系数可以很大,相关性可以很弱。即:回归系数可以很大,相关性可以很弱。 相关系数相关系数 刻画了刻画了X与与Y的相关程度,即:的相关程度,即:X与与Y伴随变化的同步程度,但相关系数伴随变化的同步程度,但相关系数与与X伴随伴随Y同步变化幅度没有之间联系。同步变化幅度没有之间联系。即:回归系数可以很小,即:回归系数可以很小, 但同步变化的但同步变化的一致程度很高(相关程度可以很强一致程度很高(相关程度可以很强)。25直线相关分析对资料的要求直线相关分析对资料的要求由概率论的条件概率公式,得到检验由概率论的条件概率公式,得到检验X和和Y服从
9、双正态分布的方法如下:服从双正态分布的方法如下:以以X为为自变量,自变量,Y为应变量作直线回归。为应变量作直线回归。计算其残差计算其残差检验残差和自变量检验残差和自变量X是否均服从正态分是否均服从正态分布,并且残差与布,并且残差与x没有明显的伴随趋势。没有明显的伴随趋势。1. 如果残差和如果残差和X均服从正态分布且无伴随均服从正态分布且无伴随趋势,即可推断趋势,即可推断X和和Y服从双正态分布。服从双正态分布。26直线回归与直线相关分析的注意点直线回归与直线相关分析的注意点 直线回归的任何结果都不能推断直线回归的任何结果都不能推断x与与Y的的因果关系。因果关系。 x与与Y相关分析的结果不能推断为
10、相关分析的结果不能推断为x与与Y相等关系或两个变量的一致性。相等关系或两个变量的一致性。 一般而言,相关系数检验的无效假设为一般而言,相关系数检验的无效假设为 =0,所以,所以P和样本相关系数和样本相关系数r的大小都的大小都不能推断总体相关系数不能推断总体相关系数 的大小,只有的大小,只有通过通过95%可信区间才能估计可信区间才能估计 的范围。的范围。27直线相关和直线回归小结直线相关和直线回归小结 直线相关是刻画两个变量之间的相直线相关是刻画两个变量之间的相关程度。关程度。 直线回归是刻画自变量直线回归是刻画自变量x与应变量与应变量Y的总体均数的总体均数 y的线性对应关系。的线性对应关系。
11、在直线相关分析中,两个变量都是在直线相关分析中,两个变量都是随机变量,且要求服从双正态分布。随机变量,且要求服从双正态分布。28直线相关和直线回归小结直线相关和直线回归小结 在直线回归分析中,应变量在直线回归分析中,应变量Y是随机变是随机变量,量,x可以是非随机变量也可以是随机可以是非随机变量也可以是随机变量,但即使从研究背景上考察,变量,但即使从研究背景上考察,x是是随机变量,在直线回归模型,随机变量,在直线回归模型,x的变量的变量值视为普通变量的取值。值视为普通变量的取值。 直线回归要求固定自变量直线回归要求固定自变量x,Y服从正态服从正态分布或残差服从正态分布,并且自变量分布或残差服从正
12、态分布,并且自变量X与残差无明显的伴随变化趋势。与残差无明显的伴随变化趋势。29您对直线相关的要点理解吗?您对直线相关的要点理解吗? 直线相关描述了什么问题?直线相关描述了什么问题? 直线相关分析的具体步骤是什么?直线相关分析的具体步骤是什么? 直线相关分析对资料有什么要求?直线相关分析对资料有什么要求? 如何对这些要求进行检查或检验?如何对这些要求进行检查或检验? 仅用样本直线相关系数能否说明相关程度?仅用样本直线相关系数能否说明相关程度? 总体相关系数非常接近总体相关系数非常接近1,能否说明,能否说明Y=X?30思考题思考题 某医生对一个患者进行连续观察其心跳次某医生对一个患者进行连续观察其心跳次数和体温,每小时观察一次,记录该对象数和体温,每小时观察一次,记录该对象的心跳次数和体温,共观察了的心跳次数和体温,共观察了72小时,为小时,为了了解心跳次数与体温的关系,假定散点了了解心跳次数与体温的关系,假定散点图显示:这些观察值的点呈直线带状态。图显示:这些观察值的点呈直线带状态。请问:能否作直线回归分析?或直线相关请问:能否作直线回归分析?或直线相关分析?为什么?分析?为什么?31Stata实现 一、用Stata软件计算相关系数 绘制散点图 graph x y 计算Pearson相关系数,假设检验p值 pwcorr x y ,sig star(.05)32参考文献参考
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 回弹计企业县域市场拓展与下沉战略研究报告
- 踝关节不稳的康复
- 脑损伤后的康复
- 流程执行培训课件
- 桥梁监理工作对工程质量的影响
- 广告创意设计进度的有效控制措施
- PEP小学英语三年级下册课外拓展计划
- 亚克力发光字制作流程的技术创新
- 航空业ISO9001:2025版质量管理体系计划
- 小学亲子健康活动计划
- 2024年中华人民共和国企业所得税年度纳税申报表(带公式)20240301更新
- 3货物接取送达运输协议
- 海洋牧场原理与技术智慧树知到期末考试答案章节答案2024年鲁东大学
- 商业综合体物业管理服务标准
- 公司个人现实表现材料
- 2024年浙江杭州市林水局所属事业单位招聘拟聘人员招聘历年高频考题难、易错点模拟试题(共500题)附带答案详解
- 再生资源行业培训课件
- DB35T 2094-2022 公路工程竣(交)工验收质量检测技术规程
- STEM教育理念下大班科学活动的指导策略研究
- 对于慢性骨髓炎的护理
- 地下室手机信号解决方案
评论
0/150
提交评论