版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一、简单相关分析 又称直线相关、线性相关二、偏(净)相关分析三、等级相关分析第四章 相关分析第1页,共30页。一、相关分析的功用 研究随机变量间的关系密切程度二、相关分析的应用 已经广泛应用于各行各业 如:身高与体重的关系; 越冬温度与病虫害发生的关系; 农作物施肥与增产的关系等。第一节 简单相关分析第2页,共30页。表5.1 为说明两变量之间的线性关系而假设的三组(x,y)观察值组别 变量观 察 值 平均数 平方之和 第一组 x17 7 1 6 5 3 8 9 3 1y15 9 6 1 3 1 9 4 6 8 第二组 x29 8 7 7 6 5 3 3 1 1y29 9 8 6 6 5 4
2、3 1 1第三组 x31 1 3 3 5 6 7 7 8 9y39 9 8 6 6 5 4 3 1 1三、简单相关的散点图表示第一节 简单相关分析第3页,共30页。第一节 两随机变量之间的线性关系表5.1 为说明两变量之间的线性关系而假设的三组(x,y)观察值组别 变量观 察 值 平均数 平方之和 第一组 x17 7 1 6 5 3 8 9 3 1y15 9 6 1 3 1 9 4 6 8 第二组 x29 8 7 7 6 5 3 3 1 1y29 9 8 6 6 5 4 3 1 1第三组 x31 1 3 3 5 6 7 7 8 9y39 9 8 6 6 5 4 3 1 1 第一组数据 第二组数
3、据 第三组数据 a b c 图5.1 三组假设数据的散点图第4页,共30页。第一节 两随机变量之间的线性关系 第一组数据 第二组数据 第三组数据 a b c 图5.1 三组假设数据的散点图 在第三组数据中,随着x3数值的增大, y3值有减少的趋势,有负的线形相关关系。 在第二组数据中,随着x2数值的增大, y2值有增加的趋势,有正的线形相关关系。 在第一组数据的散点图中,各点的位置很分散, x1和y1之间没有明显的关系。 第5页,共30页。相关系数是描述线性相关程度和方向的统计量Pearson相关系数:相关系数四、简单相关系数第6页,共30页。第一节 简单相关分析四、简单相关系数相关系数的定义
4、域:1,1相关系数是相关性大小的度量,是没有单位的量相关系数 为低度相关相关系数 为中度相关相关系数 为高度相关第7页,共30页。四、简单相关系数性质正相关:0 r 1完全正相关: r = 1负相关:-1 r 0完全负相关: r = -1不相关:r = 0第一节 简单相关分析第8页,共30页。表5.1 为说明两变量之间的线性关系而假设的三组(x,y)观察值组别 变量观 察 值 平均数 平方之和 第一组 x17 7 1 6 5 3 8 9 3 1y15 9 6 1 3 1 9 4 6 8 第二组 x29 8 7 7 6 5 3 3 1 1y29 9 8 6 6 5 4 3 1 1第三组 x31
5、1 3 3 5 6 7 7 8 9y39 9 8 6 6 5 4 3 1 1如果上例中的是样本数据,则它们的相关系数分别为:练习:求三组数的相关系数第9页,共30页。 如第2组数据的相关系数 r2 =0.9772;所以 x2 与 y2之间有正的高度相关关系; 如第3组数据的相关系数 r3 = 0.9642;所以 x3与y3 之间有负的高度相关关系。 如第1组数据的相关系数 r1 =0.0261;所以 x1 与 y1之间就几乎没有线性相关关系;练习:求三组数的相关系数第10页,共30页。五、相关系数显著性检验第一步: 统计假设:H0:0,HA:01、用统计量t检验当要使用一个样本的相关系数r对相
6、应的总体相关系数 进行估计,可以由两种统计量 t 和 r 来实现总体相关系数是否为零的假设。第一节 简单相关分析第11页,共30页。相关系数显著性检验第二步:计算统计量tdf = n-2抽样误差:第12页,共30页。相关系数显著性检验第三步:统计推断 1、|t|t0.05 推断相关不显著 2、t0.05|t| t0.01 3.356推断变量x2和y2相关达极显著计算第14页,共30页。2、统计量r显著性检验第一步:作统计假设第二步:计算统计量r,根据df =n-2,查相关系数显著性检验表,从而获得r0.05和r0.01 。第三步:作统计推断 1、|r|r0.05 推断相关不显著; 2、r0.0
7、5=|r|= r0.01 推断相关达极显著。第一节 简单相关分析第15页,共30页。实例:相关系数显著性检验根据自由度df=8,查相关系数显著性检验表,从而获得 r0.05 = 0.632 r0.01 = 0.765作统计推断 今|r|=0.97721 r0.01 推断x2和y2相关达极显著计算得:第16页,共30页。相关系数显著性检验t和r检验是等价的,在水平下相关系数显著性检验第17页,共30页。六、相关矩阵多个变量间的简单相关,设有n个变量x1xn,其相关系数可以写成矩阵的形式:第18页,共30页。第二节 偏(净)相关分析一级偏相关二级偏相关 最高级偏相关偏相关:用数学方法固定其余的变量
8、,消除其余变量的影响,只研究指定两个变量间的纯相关关系。 弥补了简单相关不能真实地反映两个变量间的相关关系。第19页,共30页。一级偏相关df = n-3第二节 偏(净)相关分析第20页,共30页。二级偏相关df = n-4第二节 偏(净)相关分析第21页,共30页。最高级偏相关df = n-m将m个变量中的m-2个变量固定,只研究另外两个变量的相关相关矩阵第二节 偏(净)相关分析第22页,共30页。第二步:计算统计量第一步:统计假设 H0:ij.0,HA:ij.0n为观测数据组数,m为相关变量总个数第二节 偏(净)相关分析第23页,共30页。第三步:统计推断 1、|tr|t0.05 推断相关
9、不显著 2、t0.05|tr|t0.01 推断相关达显著 3、|tr|t0.01 推断相关达极显著第二节 偏(净)相关分析第24页,共30页。对于定性数据,特别是等级数据或有次序的数据,就不能用简单相关来进行描述。次序在数列中代表了某个具体变量值的位置、等级或秩,因此,这类相关分析通常被称为非参数相关分析、等级相关分析或秩相关分析,其计算的相关系数被称为非参数相关系数、等级相关系数或秩相关系数。根据计算方法不同,非相关系数主要有Spearman、Kendall tau-b等级相关系数。第三节 等级相关分析第25页,共30页。其中,Rx和Ry表示分别表示x变量和y变量经过排序后的秩(次序), 和 分别表示Rx和Ry的平均值。第三节 等级相关分析1、Spearman相关系数第26页,共30页。其中,P和Q表示分别表示同序对子数和异序对子数,Tx为在x变量上是同序但在y变量上不是同序的对子数,Ty为在y变量上是同序但在x变量上不是同序的对子数。第三节 等级相关分析2、Kendall tau-b相系关数第27页,共30页。某公司随机调查了10个人的学历和收入情况。第三节 等级相关分析示例其中,学历1为小学,2为初中,3为高中,4为大学,5为研究生。试分析学历和收入有没有关系。序号学历收入序号学历收入1545006435002436007120003230008126
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论