




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章相关分析 一 相关分析的概念 研究变量间密切程度的一种常用统计方法1 线性相关分析 研究两个变量间线性关系的程度 用相关系数r来描述 详见下面 2 偏相关分析 它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性 如控制年龄和工作经验的影响 估计工资收入与受教育水平之间的相关关系3 相似性测度 两个或若干个变量 两个或两组观测量之间的关系有时也可以用相似性或不相似性来描述 相似性测度用大值表示很相似 而不相似性用距离或不相似性来描述 大值表示相差甚远 二 线性相关分析 研究两个变量间线性关系的程度 相关系数是描述这种线性关系程度和方向的统计量 用r表示 如果变量Y与X间是函数关系 则r 1或r 1 如果变量Y与X间是统计关系 则 10 如果x y变化的方向相反 如吸烟与肺功能的关系 则称为负相关 r0 8存在高度相关 0 5 r 0 8显著相关 0 3 r 0 5低度相关 r 0 3关系极弱 认为微相关 线性相关分析 续 相关系数的计算有三种 Pearson Spearman和KendallPearson相关系数 对定距变量的数据进行计算 Spearman和Kendall相关系数 对分类变量的数据或变量值的分布明显非正态或分布不明时 计算时先对离散数据进行排序或对定距变量值排 求 秩 一 Pearson相关 直线相关 直线相关 linearcorrelation 又称简单相关 simplecorrelation 用于双变量正态分布 bivariatenormaldistribution 资料 其性质可由图9 6散点图直观的说明 目的 研究两个变量X Y数量上的 线性 依存 或相关 关系 相关系数的意义与计算 1 意义 相关系数 correlationcoefficient 又称Pearson积差相关系数 用以符号r表示样本相关系数 符号表示其总体相关系数来说明具有直线关系的两变量间相关的密切程度与相关方向 相关系数没有单位 其值为 1 r 1 r值为正表示正相关 r值为负表示负相关 r的绝对值等于1为完全相关 r 0为零相关 2 计算 样本相关系数的计算公式为 适用条件 1 两变量均应由测量得到的连续变量 2 两变量所来自的总体都应是正态分布 或接近正态的单峰对称分布 3 变量必须是成对的数据 4 两变量间为线性关系 3 相关分析应用中应注意的问题 样本相关系数接近零并不意味着两个变量间一定无相关性 一个变量的值人为选定时莫作相关分析出现异常值时慎作相关分析相关未必真有内在联系相关分析时 小样本资料经检验只能推断两变量间有无直线关系 而不能推断其相关的密切程度 要推断两变量间相关的程度 样本含量必须足够大 尤应注意 若两变量间相关系数具有统计学意义 但较小时 下结论要慎重 二 Spearman等级相关 变量间的秩相关 1 秩次和秩和 秩 即按数据大小排定的次序号 又称秩次号 编秩就是将观察值按顺序由小到大排列 并用序号代替原始变量值本身 用秩次号代替原始数据后 所得某些秩次号之和 即按某种顺序排列的序号之和 称为秩和 设有以下两组数据 A组4 76 42 63 25 2B组1 72 63 62 33 7 两组各有5个变量值 现在依从小到大的顺序将它们排列起来 并标明秩次 结果如下 A组2 63 24 75 26 4B组1 72 32 63 63 7秩次12345678910 原始值中有两个 2 6 分属A B组 它们的秩次应是3和4 然而它们的数值本来是同样大小的 哪组取 3 哪组取 4 呢 我们计算它们的平均数 3 4 2 3 5 作为 2 6 的秩次 称为 平均秩次 这样才公平合理 这样两组所得的秩次及秩和如下 A组3 558910 35 5B组123 567 19 5 上面A组和B组中各有五个原始值 按顺序排列 最小值设为1 再按绝对值大小对余下的变量逐个排序 最大值为两组变量个数之和10 依次可得1 2 3 5 3 5 5 6 7 8 9 10 这10个序号即是秩次 A组秩和就是等于3 5 5 8 9 10 39 5 B组秩和就是等于1 2 3 5 6 7 19 5 从两组的原始变量值也可以初步看出 A组偏大 B组偏小 现在得出的秩和也是A组大于B组 与由变量值所观察到的一致 2 怎样编秩 编秩就是将观察值按顺序由小到大排列 并用序号代替原始变量值本身 不同的实验设计类型 有不同的编秩规则 3 Spearman秩相关 概念及适用条件 1 概念两变量是等级测量数据 且总体不一定呈正态分布 样本容量也不一定大于30 这样两变量的相关 称为等级相关 斯皮尔曼相关 2 适用条件 两变量的资料为等级测量数据 且具有线性关系 连续变量的测量数据 按其大小排成等级 亦可用等级相关计算 不要求总体呈正态分布 2 计算方法 式中 D为两变量每对数据的等级之差 N表示样本容量 计算步骤 1 计算两变量等级之差D 2 计算D2 3 计算 D2 4 代入公式 求得rR例求10名学生的语文成绩与阅读能力成绩之间的等级相关系数 表5 310名学生的语文成绩与阅读能力成绩相关计算表 解 将有关数据代入公式 5 4 得 如果求相关的是连续变量 计算时先把两组数据分别按大小排成等级 最大值取为1等 其它类推 若出现相同的等级分数时 可用它们所占等级位置的平均数作为它们的等级 三 Kendall 肯德尔 和谐系数1 概念及适用条件 1 概念当多个变量值以等级顺序表示时 这几个变量之间的一致性程度 称为肯德尔和谐系数或肯德尔W系数 2 适用条件适用于两列以上等级变量 如了解几个评定者对同一组学生成绩等级评定的一致性程度等 2 计算方法它以符号W表示 公式为 计算步骤 略例某评价小组7人依据已确定的4项内容对某教师打分 将分数转换为等级后的结果见表 求这7人对该教师评价意见的一致性程度 表7人评价某教师意见资料表 解 将上述数据代入公式得 实际上 当出现相同等级时 应校正W系数 其校正公式为 四 相关分析的SPSS操作 菜单 Analyze Correlate Bivariate调用此过程可对变量进行相关关系的分析 计算有关的统计指标 以判断变量之间相互关系的密切程度 调用该过程命令时允许同时输入两变量或两个以上变量 但系统输出的是变量间两两相关的相关系数 三 偏相关系数 线性相关分析计算两个变量间的相关关系 分析两个变量间线性关系的程度 往往因为第三个变量的作用 使相关系数不能真正反映两个变量间的线性程度 如身高 体重与肺活量之间的关系 如果使用Pearson相关计算其相关系数 可以得出肺活量与身高和体重均存在较强的线性关系 但实际上 如果对体重相同的人 分析身高和肺活量 是否身高越高 肺活量就越大呢 不是的 原因是身高与体重有线性关系 体重与肺活量存在线性关系 因此得出身高和肺活量之间存在着较强的线性关系的错误结论 偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量 分析身高与肺活量之间的相关性 就要控制体重在相关分析中的影响 实际生活中有许多这样的关系 如可以控制年龄和工作经验两个变量的影响 估计工资收入与受教育程度之间的相关关系 可以在控制了销售能力与各种其他经济指标的情况下 研究销售量与广告费用之间的关系等 偏相关系数 续 在多元回归分析中 在消除其他变量影响的条件下 所计算的某两变量之间的相关系数称为偏相关系数 偏相关系数 续 菜单 Analyze Correlate PartialVariables 分析变量Controllingfor 控制变量调用此过程可对变量进行偏相关分析 在偏相关分析中 系统可按用户的要求对两相关变量之外的某一或某些影响相关的其他变量进行控制 输出控制其他变量影响后的相关系数 四 距离分析 是对观测量之间或变量之间相似或不相似程度的一种测度 是一种广义的距离 有关的统计量 不相似性测度 a 对等间隔 定距 数据的不相似性 距离 测度可以使用的统计量有Euclid欧氏距离 欧氏距离平方等 b 对计数数据使用卡方 c 对二值 只有两种取值 数据 使用欧氏距离 欧氏距离平方 尺寸差异 模式差异 方差等相似性测度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 信息咨询合同标准文本 英语
- 免烧砖买卖合同标准文本
- 公路机电合同样本
- 个人资金托管合同标准文本
- 中标多家医院项目合同样本
- 产品股权合同样本
- 企业废料收购合同样本
- 个人档案合同标准文本
- 策划调酒师考试的多元练习试题及答案
- 2025上海市郊区土地流转承包合同(I)
- 基坑工程土方开挖支护与降水监理实施细则
- 江苏徐州市深地科学与工程云龙湖实验室社会招考聘用9人模拟试卷【附答案解析】
- 土方回填施工记录表
- 植物根茎叶课件
- 反生产行为讲稿
- 施工现场消防安全技术交底
- 冀教版二年级语文下册看图写话专项加深练习题含答案
- 焊接工艺评定及焊接工艺技术评定管理标准
- 洗衣房各岗位工作流程
- 基于SWOT分析的义乌市现代物流业发展研究
- 基于自适应滤波对音频信号的处理详解
评论
0/150
提交评论