典型相关分析研_第1页
典型相关分析研_第2页
典型相关分析研_第3页
典型相关分析研_第4页
典型相关分析研_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

典型相关分析研第一页,共二十六页,编辑于2023年,星期日两个随机变量Y与X→ 简单相关系数一个随机变量Y与一组随机变量X1,X2,…,Xp→ 复相关系数(多重相关)一组随机变量Y1,Y2,…,Yq与另一组随机变量X1,X2,…,Xp→ 典型相关系数第二页,共二十六页,编辑于2023年,星期日典型相关是研究两组变量之间相关性的一种统计分析方法。也是一种降维技术。由Hotelling(1935,1936)最早提出,CooleyandLohnes(1971)、Kshirsagar(1972)和Mardia,Kent,andBibby(1979)推动了它的应用。第一节典型相关分析的基本思想第三页,共二十六页,编辑于2023年,星期日典型相关是简单相关、多重相关的推广;或者说简单相关系数、复相关系数是典型相关系数的特例。例:收集了某年某省男生(19~22岁)的资料,欲研究形态指标与机能指标间的相关性。形态指标:身高、坐高、体重、胸围、肩宽、盆骨宽;

机能指标:脉搏、收缩压、舒张压、肺活量。第四页,共二十六页,编辑于2023年,星期日典型相关分析示意图

X1Y1Y2Y3Y4Y5X2X3X4X5X6XYU1U2U3U4U5V1V2V3V4V5CanR1CanR2CanR3CanR4CanR5第五页,共二十六页,编辑于2023年,星期日典型相关分析(canonicalcorrelationanalysis):为了研究两组变量之间的相互关系,分别从两组变量中提取综合变量(为两个变量组中各变量的线性组合),并利用各综合变量之间的相关性来反映两组指标之间整体相关性的一种多元统计分析方法。第六页,共二十六页,编辑于2023年,星期日第二节典型相关分析的数学模型

设有两组变量为X1,X2…,Xp和Y1,Y2,…,Yq,采用主成分思想寻找综合变量对即典型(相关)变量(Ui,Vi):第七页,共二十六页,编辑于2023年,星期日8典型相关变量对与典型相关系数:在典型相关分析中,分别从两组原始变量中提取的能反映两组原始变量间整体相关信息的综合变量称为典型相关变量,典型相关变量是成对出现的,并且是按其反映两组原始变量间整体相关信息量的大小排序的,如U1、V1之间的相关系数最大,则称U1、V1

为第一对典型相关变量,它们之间的相关系数称为第一典型相关系数,类似地有第二对,第三对,…,第i对典型变量和第二、第三,…,第i典型相关系数。第八页,共二十六页,编辑于2023年,星期日典型相关变量的性质:第九页,共二十六页,编辑于2023年,星期日10即:同一组指标的各典型变量(Ui与Uj)(j=1,2,…,i-1)之间互不相关;不同组指标的典型变量(Ui与Vj)(i≠j)之间互不相关;各典型变量Ui与Vj的方差均为1;第十页,共二十六页,编辑于2023年,星期日11第三节典型相关变量及典型相关系数的求法

(了解)1.对各原始指标数据进行标准化。2.求出X,Y的相关矩阵ΣXX,ΣYY及X与Y的相关矩阵ΣXY。3.求出所有非零根,进而求得各典型相关系数,并按大小顺序排列。4.取最大根λ1,进而求得非零解a1′=(a11,a12,…,a1p)

,b1′

=(

b11,b12,…,b1q)5.写出第一对典型相关变量。6.求出第i对典型相关变量。第十一页,共二十六页,编辑于2023年,星期日12第四节典型相关系数的假设检验如果前m个典型相关系数在水准α下有统计学意义,而其余的典型相关系数都不具有统计学意义,则可以认为m对典型相关变量已经把X与Y之间存在的全部相关信息进行了分解并提取出来了。如果第一典型相关系数λ1无统计学意义,则可认为两组指标X与Y之间互不相关,不能进行典型相关分析。在实际应用中,通常只取第一对典型相关变量,因为第一对相关变量的专业意义较为明显,且足以表达两组指标间的相关性。第十二页,共二十六页,编辑于2023年,星期日13第五节应用实例

例21-1为了探讨小学生的生长发育指标与身体素质的相互关系,某市对小学生的体质进行调查。先仅对84例10岁男孩的四项生长发育指标:肺活量、身高、体重、胸围与四项反映身体素质的指标:50m跑、跳高、跳远、实心球掷远进行典型相关分析。编号肺活量X1(L)身高X2(cm)体重X3(kg)胸围X4(cm)50m跑Y1(s)跳高Y2(cm)跳远Y3(m)实心球掷远Y4(m)11210120.123.861.010.2662.012.7321210120.723.459.811.3681.922.7131040121.222.959.010.1671.922.60………………………831580136.632.367.210.3872.664.04842370147.438.873.010.8912.824.38第十三页,共二十六页,编辑于2023年,星期日14SPSS的实现:1.打开例21-1SPSS数据文件2.通过File-New-Date-Syntax打开一个空白文件,再在其中键入下面命令行:include'C:\ProgramFiles\SPSS\canonicalcorrelation.sps'.

cancorrset1=x1tox4/

set2=y1toy4/.3.再点击一个向右的三角形图标(运行目前程序,Runcurrent),就可以得到所需结果了。4.还可以把Syntax1.sps另以其他名字(比如tv.sps)存入一个文件夹。下次使用时就可以通过File-Open-Syntax来打开这个文件了。第十四页,共二十六页,编辑于2023年,星期日151.打开SPSS数据文件SPSS操作第十五页,共二十六页,编辑于2023年,星期日16SPSS操作2.编辑语法第十六页,共二十六页,编辑于2023年,星期日17编辑语法窗口第十七页,共二十六页,编辑于2023年,星期日18结果各典型相关系数依次为:λ1=0.886,λ2=0.279,λ3=0.279,λ4=0.038。并由检验可知,只有第一典型相关系数有统计学意义。因此,只取第一对典型相关变量。第十八页,共二十六页,编辑于2023年,星期日19原始的U典型相关变量原始的第一对典型相关变量为:原始的V典型相关变量原始的第一对典型相关变量为:第十九页,共二十六页,编辑于2023年,星期日20标准化的U典型相关变量标准化的V典型相关变量标准化的的第一对典型相关变量为:第二十页,共二十六页,编辑于2023年,星期日21

由标准化的典型相关变量可得:U1主要受X2和X4的影响,V1则在Y2和Y4上的权重较大。说明个子较为高大的男孩在跳高和实心球掷远这两个项目上的成绩较好。

V第二组原始指标50m跑Y1跳高Y2跳远Y3实心球Y4典型相关0.886身高X2体重X3胸围X4肺活量X1U第一组原始指标0.4360.4800.6610.301第二十一页,共二十六页,编辑于2023年,星期日22对应分析CorrespondenceAnalysis第二十二页,共二十六页,编辑于2023年,星期日23对应分析:简单对应分析:两个分类变量间的类别联系多重对应分析:多个分类变量间的类别联系第二十三页,共二十六页,编辑于2023年,星期日24表1318例COPD患者的COPD分级与中医证候分布COPD分级肺气虚脾气虚肾阳虚阴阳两虚肾阴虚痰浊证血瘀证Ⅰ141220040Ⅱa4925402119Ⅱb261715241720Ⅲ12141675724

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论