Chap主成分分析与因子分析课件_第1页
Chap主成分分析与因子分析课件_第2页
Chap主成分分析与因子分析课件_第3页
Chap主成分分析与因子分析课件_第4页
Chap主成分分析与因子分析课件_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【例20-1】某医院测得20名肝病患者的SGPT(转氨酶)、肝大指数、硫酸锌浊度、AFP(甲胎球蛋白)4项肝功能指标,资料见表20-2,试对20人的肝功能进行排序。病例号转氨酶肝大指数硫酸锌甲胎蛋白病例号转氨酶肝大指数硫酸锌甲胎蛋白1402.00520111803.5014402101.50530121302.00305031203.001350132201.50172042504.50180141601.50356051203.50950152202.5014306101.501250161402.0020207401.001940172202.00141082704.00136018201.00126092803.50116019401.00100101703.00960201202.00200【例20-1】某医院测得20名肝病患者的SGPT(转氨酶)、1一、概念将原来众多具有一定相关性的指标,重新组合成一组新的相互独立的综合指标(主成分)。二、意义在保存主要信息的前提下,简化结构和解决共线问题。

多维→二维,利用找到的综合变量来对观察对象排序。§1

PrincipalcomponentanalysisP280一、概念§1Principalcomponentana2三、方法

n个对象,m个指标:P281表2。原始数据标准化→m个标准化指标的r→

相关矩阵R→特征根λ→特征向量a→主成分F

λ

:主成分的方差,该主成分可解释平均多少原始变量的信息,占总方差的比重为该F的贡献率。前P个F的贡献率之和为累计贡献率。因子载荷:主成分Fi与变量xj的相关系数=a三、方法31.适用性检验:能否作主成分分析与因子分析。(1)KMO统计量:0~1,各指标间相关程度。KMO>0.9效果最理想<0.5不宜分析(2)Bartlett球形检验

:原指标间是否独立,

P>0.05不宜。2.确定F数目:根据实际需要,两法结合。(1)累计贡献率:应>70%or80%

,F偏多。(2)特征值

:≥1的F应保留。偏少。1.适用性检验:能否作主成分分析与因子分析。2.确定F数目4【例20-1】某医院测得20名肝病患者的SGPT(转氨酶)、肝大指数、硫酸锌浊度、AFP(甲胎球蛋白)4项肝功能指标,资料见表20-2,作主成分分析。病例号转氨酶肝大指数硫酸锌甲胎蛋白病例号转氨酶肝大指数硫酸锌甲胎蛋白1402.00520111803.5014402101.50530121302.00305031203.001350132201.50172042504.50180141601.50356051203.50950152202.5014306101.501250161402.0020207401.001940172202.00141082704.00136018201.00126092803.50116019401.00100101703.00960201202.00200【例20-1】某医院测得20名肝病患者的SGPT(转氨酶)、5【SPSS操作】转氨酶(标SGPT)、肝大指数(G)、硫酸锌(Z)、甲胎蛋白(AFP)为变量名,建立4列20行(20名患者)的数据文件L20-1.sav。Analyze→DataReduction(数据简化)→Factor,全部变量入Variables框→Descriptives,√KMOandBartlett’stestofsphericity→Continue→Extraction,√Screeplot→Continue→Scores,√Saveasvariables、√Displayfactorscorecoefficientmatrix→Continue→OK【SPSS操作】转氨酶(标SGPT)、肝大指数(G)、硫酸锌6Chap主成分分析与因子分析课件7KMO统计量=0.346<0.5,4个指标间相关程度差异大,不适于主成分分析和因子分析。化简少,保留F多。球形检验近似χ2=16.224,P=0.013,4个指标不独立,可进行主成分分析。保留F少。KMO统计量=0.346<0.5,4个指标间相关程度差异大,8Chap主成分分析与因子分析课件9InitialEigenvalues(初始特征值)、ExtractionSumsofSquaredLoadings(提取负荷平方和):前2个因子的特征值大于1,Cumulative%(累积)贡献率为70.295%InitialEigenvalues(初始特征值)、Ext10特征值的贡献还可从SPSS的碎石图看出特征值的贡献还可从SPSS的碎石图看出11Chap主成分分析与因子分析课件12Chap主成分分析与因子分析课件13Chap主成分分析与因子分析课件14四、主成分分析的应用综合评价:用德能勤绩评价人。用每个主成分的贡献率λi/m作权重→个体综合评判函数C→对个体进行综合评价。

C=(λ1/m)×fac1+(λ2/m)×fac2+…+(λm/m)×facm

四、主成分分析的应用15§2

factoranalysis

P284一、意义:

多个原始变量之间的相关关系→找出少数几个潜在支配原变量间相关关系的公因子→对不可测因素的探索分析。

§2factoranalysisP28416Chap主成分分析与因子分析课件17二、

样本量n大n>100orn>5m

m为指标个数。二、样本量n18三、

方法1.适用性检验:KMO、Bartlett球形检验

。2.确定因子F数目:根据实际需要。3.考察因子的可解释性:必要时进行旋转变换,使因子负荷(因子的系数)具有实际意义,对公因子的命名和解释更容易。4.计算因子得分

Fj=aj1X1+aj2X2+…+a

jmXm

三、方法19学生编号测验项目常识算术理解填图积木译码1141328142239210141514343531112191324394777920235131224122638619142216233772016262138698910149314699815131446109912102346【例19-1】某小学10名9岁男学生六个项目的智力测验得分如表所示,对常识、算术、理解、填图、积木、译码6项测验指标作因子分析。学生测验项目常识算术理解填图积木译码11420【SPSS操作】建立6列10行的数据文件L19-1.sav:以常识、算术、理解、填图、积木、译码为变量名。Analyze→DataReduction(数据简化)→Factor,全部变量入Variables框→Descriptives,√KMOandBartlett’stestofsphericity→Continue→Extraction,√Screeplot→Continue→Rotation,⊙Varimax(方差最大旋转)→Continue→Scores,√Saveasvariables、√Displayfactorscorecoefficientmatrix→Continue→OK【SPSS操作】21Chap主成分分析与因子分析课件22Chap主成分分析与因子分析课件23特征值大于1的因子只有1个,Cumulative%(累积)贡献率为69.116%

,为使累积贡献率≥80%,调整输出因子的数目:Analyze→DataReduction→Factor→Extraction,⊙Numberoffactors(因子个数),填入2→Continue→OK特征值大于1的因子只有1个,Cumulative%(累积)24Chap主成分分析与因子分析课件25Chap主成分分析与因子分析课件26前2个因子的Cumulative%(累积)贡献率为83.485%前2个因子的Cumulative%(累积)贡献率为83.427Chap主成分分析与因子分析课件28Chap主成分分析与因子分析课件29旋转因子载荷矩阵6个智力测验项目的的因子表达式:Bx1=0.912F1+0.287F2+E1Bx2=0.774F1+0.522F2+E2Bx3=0.922F1+0.116F2+E3Bx4=0.828F1+0.421F2+E4Bx5=0.148F1+0.933F2+E5Bx6=0.382F1+0.678F2+E6旋转因子载荷矩阵30因子得分系数矩阵,个体因子得分:F1=0.357BX1+0.184BX2+0.435BX3+0.256BX4-0.318BX5-0.088BX6F2=-0.136BX1+0.129BX2-0.290BX3+0.017BX4+0.755BX5+0.432BX6因子得分系数矩阵,个体因子得分:311.主成分分析:①综合原始变量的信息和解决共线问题,将主成分存为新变量。②对n无严格要求。③一般不必旋转。④个体的主成分得分可以准确计算。2.因子分析:①找出潜在的支配原变量间相关关系的公因子,用公因子解释原变量之间的关系。②要求n大。③常进行旋转。④个体的因子得分只能估计。

四、主成分分析与因子分析的关系

1.主成分分析:①综合原始变量的信息和解决共线问题,将主成32【例20-1】某医院测得20名肝病患者的SGPT(转氨酶)、肝大指数、硫酸锌浊度、AFP(甲胎球蛋白)4项肝功能指标,资料见表20-2,试对20人的肝功能进行排序。病例号转氨酶肝大指数硫酸锌甲胎蛋白病例号转氨酶肝大指数硫酸锌甲胎蛋白1402.00520111803.5014402101.50530121302.00305031203.001350132201.50172042504.50180141601.50356051203.50950152202.5014306101.501250161402.0020207401.001940172202.00141082704.00136018201.00126092803.50116019401.00100101703.00960201202.00200【例20-1】某医院测得20名肝病患者的SGPT(转氨酶)、33一、概念将原来众多具有一定相关性的指标,重新组合成一组新的相互独立的综合指标(主成分)。二、意义在保存主要信息的前提下,简化结构和解决共线问题。

多维→二维,利用找到的综合变量来对观察对象排序。§1

PrincipalcomponentanalysisP280一、概念§1Principalcomponentana34三、方法

n个对象,m个指标:P281表2。原始数据标准化→m个标准化指标的r→

相关矩阵R→特征根λ→特征向量a→主成分F

λ

:主成分的方差,该主成分可解释平均多少原始变量的信息,占总方差的比重为该F的贡献率。前P个F的贡献率之和为累计贡献率。因子载荷:主成分Fi与变量xj的相关系数=a三、方法351.适用性检验:能否作主成分分析与因子分析。(1)KMO统计量:0~1,各指标间相关程度。KMO>0.9效果最理想<0.5不宜分析(2)Bartlett球形检验

:原指标间是否独立,

P>0.05不宜。2.确定F数目:根据实际需要,两法结合。(1)累计贡献率:应>70%or80%

,F偏多。(2)特征值

:≥1的F应保留。偏少。1.适用性检验:能否作主成分分析与因子分析。2.确定F数目36【例20-1】某医院测得20名肝病患者的SGPT(转氨酶)、肝大指数、硫酸锌浊度、AFP(甲胎球蛋白)4项肝功能指标,资料见表20-2,作主成分分析。病例号转氨酶肝大指数硫酸锌甲胎蛋白病例号转氨酶肝大指数硫酸锌甲胎蛋白1402.00520111803.5014402101.50530121302.00305031203.001350132201.50172042504.50180141601.50356051203.50950152202.5014306101.501250161402.0020207401.001940172202.00141082704.00136018201.00126092803.50116019401.00100101703.00960201202.00200【例20-1】某医院测得20名肝病患者的SGPT(转氨酶)、37【SPSS操作】转氨酶(标SGPT)、肝大指数(G)、硫酸锌(Z)、甲胎蛋白(AFP)为变量名,建立4列20行(20名患者)的数据文件L20-1.sav。Analyze→DataReduction(数据简化)→Factor,全部变量入Variables框→Descriptives,√KMOandBartlett’stestofsphericity→Continue→Extraction,√Screeplot→Continue→Scores,√Saveasvariables、√Displayfactorscorecoefficientmatrix→Continue→OK【SPSS操作】转氨酶(标SGPT)、肝大指数(G)、硫酸锌38Chap主成分分析与因子分析课件39KMO统计量=0.346<0.5,4个指标间相关程度差异大,不适于主成分分析和因子分析。化简少,保留F多。球形检验近似χ2=16.224,P=0.013,4个指标不独立,可进行主成分分析。保留F少。KMO统计量=0.346<0.5,4个指标间相关程度差异大,40Chap主成分分析与因子分析课件41InitialEigenvalues(初始特征值)、ExtractionSumsofSquaredLoadings(提取负荷平方和):前2个因子的特征值大于1,Cumulative%(累积)贡献率为70.295%InitialEigenvalues(初始特征值)、Ext42特征值的贡献还可从SPSS的碎石图看出特征值的贡献还可从SPSS的碎石图看出43Chap主成分分析与因子分析课件44Chap主成分分析与因子分析课件45Chap主成分分析与因子分析课件46四、主成分分析的应用综合评价:用德能勤绩评价人。用每个主成分的贡献率λi/m作权重→个体综合评判函数C→对个体进行综合评价。

C=(λ1/m)×fac1+(λ2/m)×fac2+…+(λm/m)×facm

四、主成分分析的应用47§2

factoranalysis

P284一、意义:

多个原始变量之间的相关关系→找出少数几个潜在支配原变量间相关关系的公因子→对不可测因素的探索分析。

§2factoranalysisP28448Chap主成分分析与因子分析课件49二、

样本量n大n>100orn>5m

m为指标个数。二、样本量n50三、

方法1.适用性检验:KMO、Bartlett球形检验

。2.确定因子F数目:根据实际需要。3.考察因子的可解释性:必要时进行旋转变换,使因子负荷(因子的系数)具有实际意义,对公因子的命名和解释更容易。4.计算因子得分

Fj=aj1X1+aj2X2+…+a

jmXm

三、方法51学生编号测验项目常识算术理解填图积木译码1141328142239210141514343531112191324394777920235131224122638619142216233772016262138698910149314699815131446109912102346【例19-1】某小学10名9岁男学生六个项目的智力测验得分如表所示,对常识、算术、理解、填图、积木、译码6项测验指标作因子分析。学生测验项目常识算术理解填图积木译码11452【SPSS操作】建立6列10行的数据文件L19-1.sav:以常识、算术、理解、填图、积木、译码为变量名。Analyze→DataReduction(数据简化)→Factor,全部变量入Variables框→Descriptives,√KMOandBartlett’stestofsphericity→Continue→Extraction,√Screeplot→Continue→Rotation,⊙Varimax(方差最大旋转)→Continue→Scores,√Saveasvariables、√Displayfactorscorecoefficientmatrix→Continue→OK【SPSS操作】53Chap主成分分析与因子分析课件54Chap

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论