生物医学研究的统计方法之二十因子分析_第1页
生物医学研究的统计方法之二十因子分析_第2页
生物医学研究的统计方法之二十因子分析_第3页
生物医学研究的统计方法之二十因子分析_第4页
生物医学研究的统计方法之二十因子分析_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物医学研究的统计方法之二十因子分析第1页/共56页2023/4/191:072主成分分析:以原变量的线性组合将原变量组合成少数几个主成分。因子分析:将原变量分解成几个公因子的线性组合,从而更好地理解原变量的内在关系。第2页/共56页2023/4/191:073回顾:主成分分析的任务将彼此相关的指标变量转化为彼此不相关的指标变量;将个数较多的指标变量转化为个数较少的指标变量。将意义单一的指标变量转化为意义综合的指标变量。第3页/共56页2023/4/191:074主成分分析的基本原理寻找一个适当的线性变换:将彼此相关的变量转变为彼此不相关的新变量;方差较大的几个新变量就能综合反应原多个变量所包含的主要信息;新变量各自带有独特的专业含义。第4页/共56页2023/4/191:075相关性的另一个角度分析:观测指标间存在相关性,是受某些不可观测的潜在因素的影响造成的.如:学生的语文,英语成绩相关,是受其语言能力的影响,学生的数学,物理化学成绩相关,是受其逻辑推理能力的影响。第5页/共56页2023/4/191:076变量的可测性可测变量(measuredvariable):可以直接观察或测量而得到的变量。潜在变量(latentvariable):不能或不易直接观测得到的变量。这种变量往往是根据某种理论假设的,所以也称为理论变量(theoreticalvariable)。第6页/共56页2023/4/191:077仅包含一个潜在因子的探索性因子分析路径图潜在因子其他影响因子第7页/共56页2023/4/191:078可测变量潜在变量第8页/共56页2023/4/191:079数学模型假设原有变量有p个,标准化后分别用表示,且每个变量的均值是0,标准差是1,现将每个原有变量用m(m<p)个因子的线性组合来表示,即:因子模型F称为公共因子,简称因子,其均值为0,标准差为1。因子可理解为高维空间中互相垂直的k个坐标轴;A称为因子载荷矩阵,称为因子载荷,是第i个原始变量在第j个因子上的负荷;称为特殊因子,表示原始变量不能被因子解释的部分。第9页/共56页2023/4/191:0710因子分析数学模型可测变量(measuredvariable)潜在因子(latentvariable),共性因子(commonfactor)因子载荷(factorloading)度量误差(measurementerror),特殊因子(specialfactor)第10页/共56页2023/4/191:0711因子模型矩阵表示第11页/共56页2023/4/191:0712因子模型假设第12页/共56页2023/4/191:0713共性方差和个性方差共性方差(共同度):反映Xi信息中被潜在因子解释的比例个性方差共性方差第13页/共56页2023/4/191:0714共性方差和个性方差第14页/共56页2023/4/191:0715X1方差中的80.5%被潜在因子f所解释;X2方差中的92%被潜在因子f所解释;X3方差中的64.5%被潜在因子f所解释。第15页/共56页2023/4/191:0716因子贡献和因子贡献率因子贡献:因子fj对所有原始指标的贡献因子贡献率():因子fj对所有原始指标的方差贡献率第16页/共56页2023/4/191:0717因子分析的基本步骤1、因子分析的前提条件;因子分析的前提条件是原始变量之间应存在较强的相关关系。

2、因子提取,计算因子负荷;

3、使因子更具有命名可解释性,解释变量间的关系;

4、计算各样本的因子得分。第17页/共56页2023/4/191:0718因子分析的步骤估计因子载荷确定因子个数解释潜在因子的实际意义计算因子得分第18页/共56页2023/4/191:0719估计因子载荷求原始变量相关矩阵;求相关矩阵的特征根(因子的贡献),并排序计算所有特征根对应的所有线形无关的特征向量;特征向量转置,乘以特征根的平方根,即得到因子载荷。第19页/共56页2023/4/191:0720确定因子个数一般原则:累积贡献率(累积方差)达到70~85%;特征根≥1。第20页/共56页2023/4/191:0721解释潜在因子的实际意义解释潜在因子的实际意义,一般以因子载荷的大小为依据。因子载荷大的指标变量受潜在因子支配的作用大。如何判别因子载荷的大小?当因子载荷大于或等于0.5时,可认为该因子f支配对应的指标X。第21页/共56页2023/4/191:0722第22页/共56页2023/4/191:0723特征向量

EigenvectorsPrin1Prin2Prin3Prin4Prin5Prin6x10.522252-.195699-.189953-.2537410.2265680.732908x20.525559-.080164-.167681-.3883900.304015-.667812x30.511208-.181857-.1039860.334729-.758103-.089540x40.345993-.0469780.7416530.4560600.346103-.015969x50.1887830.656595-.4703380.4980210.2526400.013219x60.1853580.6991990.392072-.465521-.3129000.091793第一主成分:C1=0.522252x1+0.525559x2+0.511208x3+0.345993x4+0.188783x5+0.185358x6第23页/共56页2023/4/191:0724主成分分析法因子模型(全分量模型)表达形式由C=Ax反解为x=AC即矩阵A称载荷矩阵,反映各成分对原始变量x各分量的贡献大小。第24页/共56页2023/4/191:0725主成分分析法因子模型(全分量模型)表达--

主成分标准化变换第25页/共56页2023/4/191:0726x=Lclij是xj和ci的相关系数SPSS输出的系数矩阵是L矩阵第26页/共56页2023/4/191:0727实例主成分分析法—

特征值(方差)及其比例第27页/共56页2023/4/191:0728主成分分析分析法—L矩阵注意L矩阵的下标,是列在前,行在后第28页/共56页2023/4/191:0729主成分分析法—L矩阵注意L矩阵的下标,是列在前,行在后第29页/共56页2023/4/191:0730迭代主成分(主因子)分析法

1.

收集原始数据并整理为下表

第30页/共56页2023/4/191:07312.对各指标进行标准化3.求指标间的相关系数矩阵RX4.求指标间的约相关系数矩阵R*

(1)R*的非对角线元素与相关矩阵RX的非对角线元素相等

(2)R*的对角线元素为共性方差第31页/共56页2023/4/191:07325.求出约关系数矩阵R*所有大于零的特征值及相应的特征向量6.写出因子载荷阵A,得出原始指标X的公因子表达式第32页/共56页2023/4/191:0733要求:1.

保留公因子个数q小于指标个数m,原则:

j≥1

前k个公因子累积贡献率≥70%2.

各共性方差接近于1。3.

各原始指标在同一公因子Fj上的因子载荷之间的差别应尽可能大。第33页/共56页2023/4/191:0734林登(Linden)根据他收集的来自139名运动员的比赛数据,对第二次世界大战以来奥林匹克十项全能比赛的得分作了因子分析研究。这十个全能项目为:100米跑(),跳远(),铅球(),跳高(),400米跑(),110米跨栏(),铁饼(),撑杆跳高(),标枪(),1500米跑()。经标准化后所作的因子分析表明,十项得分基本上可归结于他们的短跑速度、爆发性臂力、爆发性腿力和耐力这四个方面,每一方面都称为一个因子。十项得分与这四个因子之间的关系可以描述为如下的因子模型:其中表示四个因子,称为公共因子,称为在因子上的载荷,是的均值,是不能被四个公共因子解释的部分,称之为特殊因子。第34页/共56页2023/4/191:0735第35页/共56页2023/4/191:0736第36页/共56页2023/4/191:0737一、主成分法第37页/共56页2023/4/191:0738第38页/共56页2023/4/191:0739第39页/共56页2023/4/191:0740第40页/共56页2023/4/191:0741第41页/共56页2023/4/191:0742第42页/共56页2023/4/191:0743第43页/共56页2023/4/191:0744第44页/共56页2023/4/191:0745第45页/共56页2023/4/191:0746第46页/共56页2023/4/191:0747因子旋转当各公因子的专业意义难以解释时,可以通过因子旋转来解决。如求得的因子载荷阵A不甚理想,可右乘一个正交阵T,使AT有更好的实际意义,使各原始指标在同一公因子上之间差别尽可能增大。称因子正交旋转。正交旋转可保持各指标的共性方差不变;各公因子互不相关。常用方差最大旋转法等。第47页/共56页2023/4/191:0748假设公因子Fj的解释能力能够以其因子载荷平方的方差来度量,考虑两个因子的平面正交旋转,设因子载荷矩阵为:正交阵记第48页/共56页2023/4/191:0749经过旋转要求两组数据的方差达到最大。即第49页/共56页2023/4/191:0750将V对φ求导,并令其为零,经过计算,其旋转角度可按下面公式求得其中由此就可以得出φ的取值范围。第50页/共56页2023/4/191

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论