版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章相关分析1听雨书屋B主要内容主要内容7.1 相关分析简介相关分析简介7.2 两变量相关分析两变量相关分析7.3 偏相关分析偏相关分析7.4 距离分析距离分析2听雨书屋B7.1相关分析简介相关分析简介(1) 函数关系与相关关系 变量之间的关系可以分为两种:一种是函数关系,另一种是相关关系。函数关系是一一对应的确定性关系,比较容易分析和测度。可是在现实世界中,变量间的关系往往并不是简单的确定性关系,也就是说,变量之间有着密切的关系,但又不能由一个或几个变量的值确定另一个变量的值,即当自变量x取某一值时,因变量y的值可能会有多个。这种变量之间的非一一对应的、不确定性的关系,称之为相关关系。 (
2、2) 相关分析基本概念 衡量事物之间,或称变量之间线性相关程度的强弱并用适当的统计指标表示出来,这个过程就是相关分析。相关系数是衡量变量之间相关程度的一个指标,总体的相关系数用表示,样本的相关系数用r表示。 3听雨书屋B 相关关系的种类相关关系的种类1 按涉及的变量分:简单相关和复相关2 按表现形式分: 线性相关和非线性相关3 按变化方向分: 正相关和负相关4 按相关程度分:不相关、低度相关、显著相关、高度相关和完全相关4听雨书屋B主要内容主要内容7.1 相关分析简介相关分析简介7.2 两变量相关分析两变量相关分析7.3 偏相关分析偏相关分析7.4 距离分析距离分析5听雨书屋B7.1二元变量相
3、关分析二元变量相关分析(1) 基本概念 二元变量的相关分析是指通过计算变量间两两相关的相关系数,对两个或两个以上变量之间两两相关的程度进行分析。根据所研究的变量类型不同,又可以分为二元定距变量的相关分析和二元定序变量的相关分析。 (2) 统计原理u二元定距变量的相关分析 :定距变量又称为间隔(interval)变量(即连续属性变量),变量值之间可以比较大小,可以用加减法计算出差异的大小。 Pearson简单相关系数及t统计量 12211()()()()niiinniiiixxyyrxxyy221r ntr6听雨书屋B7.1二元变量相关分析二元变量相关分析u定序变量的相关性分析 :定序变量又称为
4、有序(ordinal)变量、顺序变量、等级变量,它取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等)。定序变量的相关系数用斯皮尔曼(Spearman)相关系数和肯德尔(Kendalls )相关系数来衡量。 Spearman相关系数及Z统计量21261(1)niiDrn n 1Zr nKendalls等级相关系数 及Z统计量2()(1)UVn n9 (1)2(25)n nZn7听雨书屋B7.2 二元变量相关分析二元变量相关分析(3) 分析步骤第1步 计算相关系数r:利用样本数据计算样本相关系数,样本相关系数反映了两变量间线性相关程度的强弱。相关系数的取值范围界于-1与1之间,即-1r
5、1 l当0r 1,表明变量之间存在正相关关系;l当-1 r0,表明变量之间存在负相关关系;l当|r|=1时,表示其中一个变量的取值完全取决于另一个变量,二者即为函数关系;l当r=0时,说明变量之间不存在线性相关关系,但这并不排除变量之间存在其它非线性相关的可能。 根据经验可将其相关程度分为几种:当|r|0.8时视为高度相关;当0.5|r|0.8时视为中度相关;当0.3 |r|0.5时视为低度相关;当|r|0,说明呈正相关,而相伴概率值Sig.=0.0050.05,因此应拒绝零假设(H0:两变量之间不具相关性),即说明儿子身高是受父亲身高显著性正影响的。 父亲身高儿子身高父亲身高Pearson
6、相关性1.703*显著性(双侧) .011平方与叉积的和84.66740.333协方差7.6973.667N1212儿子身高Pearson 相关性.703*1显著性(双侧).011 平方与叉积的和40.33338.917协方差3.6673.538N1212*. 在 0.05 水平(双侧)上显著相关。12听雨书屋B主要内容主要内容7.1 相关分析简介相关分析简介7.2 两变量相关分析两变量相关分析7.3 偏相关分析偏相关分析7.4 距离分析距离分析13听雨书屋B(1) 基本概念 偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量,这种相关系数称为偏相关系数。偏相关系
7、数的数值和简单相关系数的数值常常是不同的,在计算简单相关系数时,所有其他自变量不予考虑。 (2) 统计原理u 控制一个变量和控制两个变量的偏相关系数分别为:7.3 偏相关分析偏相关分析,22(1)(1)xyxz yzxy zxzyzrr rrrr12211 21221,1,22,(1)(1)xy zxzzyzzxy z zxz zyzzrrrrrr14听雨书屋Bu检验的统计量为:(3)(3)统计分析步骤统计分析步骤第1步 根据公式计算偏相关系数;第2步 对样本来自的两总体是否存在显著性相关进行推断。l提出零假设H0:即两总体的偏相关系数与零无显著性差异;l选择检验统计量:偏相关分析选择的是t统
8、计量;l计算t值及对应的概率p值;l决策:如果相伴概率p值小于给定的显著性水平,则应拒绝零假设,认为两总体的偏相关系数与零有显著性差异;否则,接受原假设。 7.3 偏相关分析偏相关分析22.1nkrtrr15听雨书屋B(4) SPSS实现举例【例7-3】 下表是四川绵阳地区3年生中山柏的数据,分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度4个气候因素中哪些因素有关。 7.3 偏相关分析偏相关分析月份月生长量月平均气温月降雨量月平均日照时数月平均湿度月份月生长量月平均气温月降雨量月平均日照时数月平均湿度10.014.21754.58171824.796.9101.68320.57
9、.410.873.879819.324.5269.5164.68631.51017.484.775914.822194.881.683410.816.119.7137751010.31858.1848251321.1248.7149.67711813.14.979.381616.323.972.2109.5791216.812.666.58216听雨书屋B7.3 偏相关分析偏相关分析第1步 分析:这4个气候因素彼此均有影响,分析时应对生长量与4个气候因素分别求偏相关,如在求生长量与气候因素的相关时控制其他因素的影响。所以需进行偏相关分析;第2步 数据组织:如上表定义4个变量,输入数据即可;第3
10、步 进行偏相关分析:选择菜单“分析相关双变量”,指定分析变量和控制变量,分析变量“hgrow”和“temp”的偏相关系数,并将“rain”、“hsun”、“humi”设为控制变量。如下图所示设置。17听雨书屋B第4步 主要结果及分析。7.3 偏相关分析偏相关分析从中可以看出,月降雨量、月平均日照时数和月平均湿度为控制变量,生长量与月平均气温关系密切,偏相关系数为0.977,双尾检测的相伴概率为0.000(表示趋近于0的正数),明显小于显著性水平0.05。故应拒绝原假设,说明中山柏的生长量与气温间存在显著的相关性。控制变量生长量月平均气温月降雨量 & 月平均日照时数 & 月平均湿
11、度生长量相关性1.000.977显著性(双侧).000df07月平均气温相关性.9771.000显著性(双侧).000.df7018听雨书屋B主要内容主要内容7.1 相关分析简介相关分析简介7.2 两变量相关分析两变量相关分析7.3 偏相关分析偏相关分析7.4 距离分析距离分析19听雨书屋B(1) 基本概念 距离分析是对观测量之间相似或不相似程度的一种测度,是计算一对观测量之间的广义距离。这些相似性或距离测度可以用于其他分析过程,例如因子分析、聚类分析或多维定标分析,有助于分析复杂的数据集。 (2) 统计原理u不相似性测度l对定距数据的不相似性(距离)测度可以使用的统计量有:欧几里得距离、平方
12、欧氏距离、切比雪夫距离、Block距离、明可斯基距离等。l对定序数据,主要使用卡方不相似测度和斐方测度。l对二值(只有两种取值)数据变量之间的距离描述,使用欧氏距离、平方欧氏距离、尺寸差异、模式差异、方差、形或兰斯和威廉斯等距离统计量。7.4 距离分析距离分析20听雨书屋Bu相似性测度l 对于定距数据主要使用皮尔逊相关系数和夹角余弦距离;l 对于二值数据的相似性测度主要包括简单匹配系数、Jaccard相似性指数、Hamann相似性测度等20余种。7.4 距离分析距离分析其中的距离又分为个案(观测记录)之间的距离和变量之间的距离两种。(3) (3) 分析步骤分析步骤 距离分析中不存在假设检验问题
13、,主要是通过SPSS自动计算变量或个案之间的相似性或不相似性距离,根据其计算距离值的大小来确定变量或个案之间的相似性或不相似性的强弱。21听雨书屋B(4) SPSS实现举例【例7-4】 已知我国四城市2004年各月的日照时数如下表所示,请分析各城市日照数是否近似。7.4 距离分析距离分析月份 北京天津 石家庄 大连 月份北京天津 石家庄 大连1194.7 161.7193.8163.57203.2 179.5185.4228.52213.5 185.2219.2195.38187.4 149.8152.11743243.6 166.8220.9223.19198.9 178.7203.4202
14、.74248.2 214.3240.9276.910225.2 194.7220.7228.45253.3221277.9243.411201.4 172.8197.5172.96202182.5213.419012144119.197.916722听雨书屋B第1步 分析:这是考查4个城市的日照时数是否相似的问题,可用距离分析实现。既可以计算其相似性测度,亦可计算其不相似性测度;第2步 数据组织:分别定义的变量:month”(月份)(用字符型变量)、“Beijing”(北京)、“Tianjin”(天津)、“ShiJZ”(石家庄)、“Dalian”(大连)。7.4 距离分析距离分析23听雨书屋B7.4 距离分析距离分析第3步 进行距离分析:选择菜单“分析相关距离”,弹出下图所示的“距离”对话框,将4个变量(“北京”、“天津”、“石家庄”、“大连”)移入“变量”框中进行相似性度量计算;在“计算距离”组中选中“个案间”单选框,进行变量间的距离分析;在“度量标准”单选框组中选中不相似性,求解其不相似性度量。 24听雨书屋B第4步 主要结果及分析。7.4 距离分析距离分析表格的第一行(Euclidean 距离)说明采用的是欧氏距离。这是一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 深度解析(2026)GBT 25668.2-2010镗铣类模块式工具系统 第2部分:TMG21工具系统的型式和尺寸
- 2025重庆大学高端装备机械传动全国重点实验室科研团队劳务派遣技术人员招聘笔试考试参考试题及答案解析
- 2026河北沧州医学高等专科学校高层次人才选聘50人模拟笔试试题及答案解析
- 2025年度12月浙江嘉兴市海宁市交通投资控股集团有限公司下属公司招聘4人模拟笔试试题及答案解析
- 2025河南周口临港开发区事业单位招才引智4人参考笔试题库附答案解析
- 2025重庆大足区教育事业单位面向应届生考核招聘42人参考考试题库及答案解析
- 2026湖南长沙市华益中学春季教师招聘备考考试试题及答案解析
- 2025广西来宾市兴宾区机关后勤服务中心招聘2人参考考试题库及答案解析
- 2025四川长虹新材料科技有限公司招聘产品工程师岗位1人参考考试题库及答案解析
- 2025广西壮族自治区文化和旅游厅幼儿园保育员招聘1人参考考试试题及答案解析
- 中华人民共和国简史学习通超星课后章节答案期末考试题库2023年
- 成都空港产业兴城投资发展有限公司空中客车飞机全生命周期服务项目环境影响报告
- 回族上坟怎么念
- 绳结的各种打法
- 大众滑雪智慧树知到答案章节测试2023年沈阳体育学院
- 建筑施工事故案例PPT
- 核对稿300单元分析响应
- GB/T 26480-2011阀门的检验和试验
- GB 32166.1-2016个体防护装备眼面部防护职业眼面部防护具第1部分:要求
- 第21课《女娲造人》课件(共22张PPT) 部编版语文七年级上册
- 2022-2023学年人教版高中地理选择性必修一课件:5.1 自然地理环境的整体性 (33张)
评论
0/150
提交评论