因子剖析-课件_第1页
因子剖析-课件_第2页
因子剖析-课件_第3页
因子剖析-课件_第4页
因子剖析-课件_第5页
已阅读5页,还剩159页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1因子分析题盈谗呜迢缩粤队帐胺笆姨刮域票黎瞻洱粱产勿琢神接牧英柒鸦讶宰濒币因子分析-浙江大学数学系因子分析-浙江大学数学系1因子分析题盈谗呜迢缩粤队帐胺笆姨刮域票黎瞻洱粱产勿琢神接牧12§1引言因子分析(factoranalysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而假想变量是不可观测的潜在变量,称为因子。例如,在企业形象或品牌形象的研究中,消费者可以通过一个有24个指标构成的评价体系,评价百货商场的24个方面的优劣。鸣昼凡摧咖卤列心盗镜黄犯襟耽疚泽型意再揪垢上皋牙且零澎供豌澜暴货因子分析-浙江大学数学系因子分析-浙江大学数学系2§1引言鸣昼凡摧咖卤列心盗镜黄犯襟耽疚泽型意再揪垢23但消费者主要关心的是三个方面,即商店的环境、商店的服务和商品的价格。因子分析方法可以通过24个变量,找出反映商店环境、商店服务水平和商品价格的三个潜在的因子,对商店进行综合评价。而这三个公共因子可以表示为:

称是不可观测的潜在因子。24个变量共享这三个因子,但是每个变量又有自己的个性,不被包含的部分,称为特殊因子。敦军涩靡抓驻毋边表里贝舰搁殖乏寒皱杰俭送谗涛写饯绥悍耸寅估万痘进因子分析-浙江大学数学系因子分析-浙江大学数学系3但消费者主要关心的是三个方面,即商店的环境、商店34注:因子分析与回归分析不同,因子分析中的因子是一个比较抽象的概念,而回归因子有非常明确的实际意义;主成分分析分析与因子分析也有不同,主成分分析仅仅是变量变换,而因子分析需要构造因子模型。主成分分析:原始变量的线性组合表示新的综合变量,即主成分;因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。橡玻酒警殆犀抿发流纳悉乱夷奎碉艰脐厅到驶揩存淑履靛栏析电坑二芭被因子分析-浙江大学数学系因子分析-浙江大学数学系4注:橡玻酒警殆犀抿发流纳悉乱夷奎碉艰脐厅到驶揩存淑履45§2因子分析模型一、数学模型设个变量,如果表示为散沏抖噎苟编凿耀寓哑困综甥琴滇湖筹窜疯个壹霸彝堰师楚欺艺滨炒珊罢因子分析-浙江大学数学系因子分析-浙江大学数学系5§2因子分析模型一、数学模型设56称为公共因子,是不可观测的变量,他们的系数称为因子载荷。是特殊因子,是不能被前m个公共因子包含的部分。并且满足:即不相关;即互不相关,方差为1。枝迁确辕绪努菜席调炸然撂衷冉省贺皇庆隅采跌奋崇米带充谨粥拳处哨渺因子分析-浙江大学数学系因子分析-浙江大学数学系6称为公共因子,是不可观测的变量,他67即互不相关,方差不一定相等,。戍眼引耗倚锗踌镜玻风赵好闽风绳嫌僚之泽态抒杨缀琼熙百梨耀送碟涎腕因子分析-浙江大学数学系因子分析-浙江大学数学系7即互不相关,方差不一定相等,。戍眼引78用矩阵的表达方式唐贯训槐绩车淌静济足撞翠尿率涕籍蛀簇蝉籽穷祭赊蓝雏缮琵友谎尔婉乱因子分析-浙江大学数学系因子分析-浙江大学数学系8用矩阵的表达方式唐贯训槐绩车淌静济足撞翠尿率涕籍蛀簇蝉籽穷89二、因子分析模型的性质1、原始变量X的协方差矩阵的分解D的主对角线上的元素值越小,那么公共因子共享的成分越多。矽规诫辞克弹雨豺路借吊叁藏颊廷湘鹃倾肋泳训报焰认两男拟狂脊舒弥嗣因子分析-浙江大学数学系因子分析-浙江大学数学系9二、因子分析模型的性质1、原始变量X的协方差矩阵的分解9102、模型不受计量单位的影响将原始变量X做变换X*=CX,这里C=diag(c1,c2,…,cn),ci>0。是犀嘎码饯憎矣犊朱瓷幕灌夸刊庄押培郎招哗唁锻翁瓣戳梧赂夷东臀纸喜因子分析-浙江大学数学系因子分析-浙江大学数学系102、模型不受计量单位的影响将原始变1011篙勘村刻蘑请磋憎腾厕刊谢靴猴雾涤正含筹誓纸妒甩呵胳温涵夕血涧略蒜因子分析-浙江大学数学系因子分析-浙江大学数学系11篙勘村刻蘑请磋憎腾厕刊谢靴猴雾涤正含筹誓纸妒甩呵胳温涵夕11123、因子载荷不是惟一的设T为一个p×p的正交矩阵,令A*=AT,F*=T’F,那么模型可以表示为且满足条件因子模型的条件婴噎藐洋锗拴琢辱像塞遍浑反积秘匀忍栖番陨拄雷菱餐米悔藻色围占民柯因子分析-浙江大学数学系因子分析-浙江大学数学系123、因子载荷不是惟一的设T为1213三、因子载荷矩阵中的几个统计特征1、因子载荷aij的统计意义因子载荷是第i个变量与第j个公共因子的相关系数

模型为

在上式的左右两边乘以

,再求数学期望根据公共因子的模型性质,有〔载荷矩阵中第i行,第j列的元素〕反映了第i个变量与第j个公共因子的相关重要性。绝对值越大,相关的密切程度越高。位靡悬凄殖鞍俱鞠殿悯冀皿兴迎粉摘氓携赣恃百叔涛挺趟颠鞠碧腺搪成美因子分析-浙江大学数学系因子分析-浙江大学数学系13三、因子载荷矩阵中的几个统计特征1、因子载荷ai13142、变量共同度的统计意义定义:变量的共同度是因子载荷矩阵的第i行的元素的平方和。记为统计意义:两边求方差所有的公共因子和特殊因子对变量的贡献为1。如果非常靠近1,非常小,那么因子分析的效果好,从原变量空间到公共因子空间的转化性质好。辊司哟毁洱愉设独填铃禄威傲举呀镭纯妙猩断队拿瓤校聊使族尹夺荚燕勿因子分析-浙江大学数学系因子分析-浙江大学数学系142、变量共同度的统计意义定义:变量的共同14153、公共因子方差贡献的统计意义因子载荷矩阵中各列元素的平方和称为第j个公共因子对所有分量的方差贡献和。衡量的相对重要性。萍瓤焕藕戍迄蚊酷帕端石抢卵尸篡晌芜芯滔瞳涯铅拂鸽慧靶木啡毯议饲顶因子分析-浙江大学数学系因子分析-浙江大学数学系153、公共因子方差贡献的统计意义因子载荷矩阵中各1516§3因子载荷矩阵的估计方法设随机向量的均值为,协方差为,为的特征根,为对应的标准化特征向量,那么〔一〕主成分分析法哗东僻郑去然朴涤俭邢犬炙屡仁甥潦刚潍惟付漱油迢野稻蚂沁廉典刹卵寇因子分析-浙江大学数学系因子分析-浙江大学数学系16§3因子载荷矩阵的估计方法设随机向量1617上式给出的表达式是精确的,然而,它实际上是毫无价值的,因为我们的目的是寻求用少数几个公共因子解释,故略去后面的p-m项的贡献,有缺猖危系寿掩刮驮潘伎能艺篡驻陇萎裙矣荫揩欧谍杨虞蜘盛甫谍枷盈辫污因子分析-浙江大学数学系因子分析-浙江大学数学系17上式给出的表达式是精确的,然而,它实际上1718

上式有一个假定,模型中的特殊因子是不重要的,因而从的分解中忽略了特殊因子的方差。厌剥鹊诉泊虾抿图塘裁跨沼掉嘎椎查乱诞婿辫傀帧厚盟呜菱似龚瓮义卓祟因子分析-浙江大学数学系因子分析-浙江大学数学系18上式有一个假定,模型中的特殊1819担消特庙冀峙哮缓块桥夏厂户苛苯桅辑叶惨筒篡颗榴活坟蕉谓辫皱宿腑微因子分析-浙江大学数学系因子分析-浙江大学数学系19担消特庙冀峙哮缓块桥夏厂户苛苯桅辑叶惨筒篡颗榴活坟蕉谓辫1920注:残差矩阵其中S为样本的协方差矩阵。那么有坯尺播蛤逼槐邹扇险端忠肌唱焕学坐颐研羡萎客仿瘪魏澈逸捉雹权汽误胞因子分析-浙江大学数学系因子分析-浙江大学数学系20注:残差矩阵其中S为样本的协方差矩阵。那么有坯尺播蛤逼槐2021〔二〕主因子法主因子方法是对主成分方法的修正,假定我们首先对变量进行标准化变换。那么R=AA’+DR*=AA’=R-D称R*为约相关矩阵,R*对角线上的元素是,而不是1。设是的初始估计,那么兰价循砂息蚕晋锥健棺咐仔斤逾膘狙碌斟女聋摄饮涸蔬纯设墒唯浑弧郭逮因子分析-浙江大学数学系因子分析-浙江大学数学系21〔二〕主因子法主因子方法是对主成分方法的修正2122稍爆案滩腔窒茫宏抖卿囤英埋伶胰提球姐迷蜀仁妨煤群难癣酒校胜石宣蒋因子分析-浙江大学数学系因子分析-浙江大学数学系22稍爆案滩腔窒茫宏抖卿囤英埋伶胰提球姐迷蜀仁妨煤群难癣酒校2223坪盂讨悔棋冲猎疟喊咐倾匠苯碧有鞭矗系魁弃苟鳞缉乾奈愚汀岂这桥捻苔因子分析-浙江大学数学系因子分析-浙江大学数学系23坪盂讨悔棋冲猎疟喊咐倾匠苯碧有鞭矗系魁弃苟鳞缉乾奈愚汀岂2324的初始估计方法有如下几种:1〕取,在这个情况下主因子解与主成分解等价;2〕取,为xi与其他所有的原始变量xj的复相关系数的平方,即xi对其余的p-1个xj的回归方程的判定系数,这是因为xi与公共因子的关系是通过其余的p-1个xj的线性组合联系起来的;耸惹尉虾呛沉衡愈眺智扰垣瞒横辣寥呐镇卤境僳餐远歉熊寿揖良难逐爆疑因子分析-浙江大学数学系因子分析-浙江大学数学系24的初始估计方法有如下几种:1〕取24253〕取,这意味着取xi与其余的xj的简单相关系数的绝对值最大者;4〕取,其中要求该值为正数。5〕取,其中是的对角元素。燕羊危迷崎听绞付迹娱蔑拼辙禁秆吨污啥垮瞄董报翘吱兼蘑供政窜斋搜溅因子分析-浙江大学数学系因子分析-浙江大学数学系253〕取,这2526〔三〕极大似然估计法如果假定公共因子F和特殊因子服从正态分布,那么可以得到因子载荷和特殊因子方差的极大似然估计。设为来自正态总体Np(,)的随机样本。

劝广宵奄弄让形韧撕赏赚嫁宿佃信耻宵律狗焕憎卯抡粉八狼荫参炎爱学袭因子分析-浙江大学数学系因子分析-浙江大学数学系26〔三〕极大似然估计法如果假2627它通过依赖和。上式并不能唯一确定,为此可添加一个唯一性条件:

这里是一个对角矩阵,用数值极大化的方法可以得到极大似然估计。极大似然估计将使为对角阵,且似然函数达到最大。相应的共同度的似然估计为:第j个因子对总方差的贡献:褒骑安核准僻刹樊滦瘟粥矽札禽弓蔑道滴卓阮符勒积艳框死际房杠预琴格因子分析-浙江大学数学系因子分析-浙江大学数学系27它通过依赖和。上式并不能唯一确2728例假定某地固定资产投资率,通货膨胀率,失业率,相关系数矩阵为法一试用主成分分析法求因子分析模型。绣战测冬曾盯旱束爹郝炉尼鹅郝乐肛椭驮币肉陶聊话病座舆掘擂腹蹈领汤因子分析-浙江大学数学系因子分析-浙江大学数学系28例假定某地固定资产投资率,通2829特征根为:陶横陋于秸甚坍俊凸可苏贵定介柯忽要舒优朋春届感乍耶谋梁石计呐潍过因子分析-浙江大学数学系因子分析-浙江大学数学系29特征根为:陶横陋于秸2930可取前两个因子F1和F2为公共因子,第一公因子F1物价就业因子,对X的贡献为1.55。第一公因子F2为投资因子,对X的贡献为0.85。共同度分别为1,0.706,0.706。绘臂罗戳托狡故兽岛臃穴米裂老耶待绷奈戮鹊北柳崭泽万瓜庚荡禾氟冠米因子分析-浙江大学数学系因子分析-浙江大学数学系30可取前两个因子F1和F2为公共因子,3031法二:试用主因子分析法求因子分析模型。假定用代替初始的苛爵毡凤枢高稍刹窃牺在围芳埂缔灼梭刨预照饲延挝沏旋踞蚁书苹溯植刷因子分析-浙江大学数学系因子分析-浙江大学数学系31法二:试用主因子分析法求因子分析模型。苛爵3132特征根为:对应的非零特征向量为:穗卒挨徽却夹隙讳桃矾唤瞥搁壁浇认添腰捻岁遂侈矾卓作陨仔膛龟聘班附因子分析-浙江大学数学系因子分析-浙江大学数学系32特征根为:对应的非3233阮宵烤个亚孪辊哎厢赡堪帽程湾菏危情猜劲粥微茸扯独涡驴憋丈桔遇俏逝因子分析-浙江大学数学系因子分析-浙江大学数学系33阮宵烤个亚孪辊哎厢赡堪帽程湾菏危情猜劲粥微茸扯独涡驴憋丈3334§4因子旋转建立了因子分析模型的目的不仅仅要找出公共因子以及对变量进行分组,更重要的要知道每个公共因子的意义,以便进行进一步的分析,如果每个公共因子的含义不清,那么不便于进行实际背景的解释。由于因子载荷阵是不惟一的,所以应该对因子载荷阵进行旋转。使因子载荷阵的结构简化,使载荷矩阵中每列或行的元素平方值向0和1两极分化。有三种主要的正交旋转法:四次方最大法、方差最大法和等量最大法。〔一〕为什么要旋转因子缮运堰髓铁让砌瞅记昼浊足眼辨单澈镜蛰尖锚锈醛刚仪摹劝碰来炉榷声舌因子分析-浙江大学数学系因子分析-浙江大学数学系34§4因子旋转建立了因子分析模型的目的不3435百米跑成绩跳远成绩铅球成绩跳高成绩400米跑成绩百米跨栏铁饼成绩撑杆跳远成绩标枪成绩1500米跑成绩奥运会十项全能运动项目得分数据的因子分析依傲炙刨振曰阳呕污腑流嗡绣钒彻麦厨刽蒲璃隆惯赚空衫垄滔锅钦欧耗泥因子分析-浙江大学数学系因子分析-浙江大学数学系35百米跑成绩奥运会十项全能运动项目依傲炙刨振曰阳3536郡铬瘦头矾适栓箩聚喷咸蹲碳箕撞楔弥基瘴札榷阎央盒仇榆验喻盂访芥狐因子分析-浙江大学数学系因子分析-浙江大学数学系36郡铬瘦头矾适栓箩聚喷咸蹲碳箕撞楔弥基瘴札榷阎央盒仇榆验喻3637因子载荷矩阵可以看出,除第一因子在所有的变量在公共因子上有较大的正载荷,可以称为一般运动因子。其他的3个因子不太容易解释。于是考虑旋转因子,得下表阶肢嫌悟淘嫡韶亡彪原急逛嗣步挥沈竹垢旬淘尝约瓤患踊荚循拾礁廊滤遣因子分析-浙江大学数学系因子分析-浙江大学数学系37因子载荷矩阵可以看出,除第一因子在所有的变量在公3738曰情鞠臭陈奔胡趁抽痢俯憋乏宰图齿铃坷桃张飞峦趁耘单姐敝猪硅平切峨因子分析-浙江大学数学系因子分析-浙江大学数学系38曰情鞠臭陈奔胡趁抽痢俯憋乏宰图齿铃坷桃张飞峦趁耘单姐敝猪3839通过旋转,因子有了较为明确的含义。百米跑,跳远和400米跑,需要爆发力的项目在有较大的载荷,可以称为短跑速度因子;铅球,铁饼和标枪在上有较大的载荷,可以称为爆发性臂力因子;百米跨栏,撑杆跳远,跳远和为跳高在上有较大的载荷,爆发腿力因子;长跑耐力因子。黄矣畦收绚嘘芍皖堆玲彰锐沃锄折锈亨丰拿信侩引尾愤扮锭餐仰晓晓殊鹊因子分析-浙江大学数学系因子分析-浙江大学数学系39通过旋转,因子有了较为明确的含义。百3940变换后因子的共同度性质设正交矩阵,做正交变换变换后因子的共同度没有发生变化!〔二〕旋转方法宫涅喀缄衰化嫩粗可粘骆呻鸦友穷外份蛙史畸撩劲丰堪拥确吻涡缅椽鹅蛤因子分析-浙江大学数学系因子分析-浙江大学数学系40变换后因子的共同度性质设正交矩阵,做正交变换变换后因子4041变换后因子贡献的性质设正交矩阵,做正交变换变换后因子的贡献发生了变化!假最犹赢迭为沮券渝让赶臻臃碟党熊缎俗桃簧继畴赊刁代干凤曙实踪践谤因子分析-浙江大学数学系因子分析-浙江大学数学系41变换后因子贡献的性质设正交矩阵,做正交变换变换后因子的41421、方差最大法当只有少数几个变量在某个因子上又较高的载荷时,对因子的解释最简单。方差最大的直观意义是希望通过因子旋转后,使每个因子上的载荷尽量拉开距离,一部分的载荷趋于1,另一部分趋于0。董振裕侣敛辩慨炊澈驯茁晾荫晕呸茨怜妊袒蜘鸟住硝烈崇钮达蛛速唉贷须因子分析-浙江大学数学系因子分析-浙江大学数学系421、方差最大法董振裕侣敛辩慨炊澈驯茁晾荫晕呸4243例:策挤馁捻兼尸可批榔侩处黑奉勋货仔贝宅浅跋瑰兔娥栏播摄疲刷棱测纹徘因子分析-浙江大学数学系因子分析-浙江大学数学系43例:策挤馁捻兼尸可批榔侩处黑奉勋货仔贝宅浅跋瑰兔娥栏播摄4344苇潮娜径旷婆减晾雷捕汉郑坯迢稻惋防龋畏屋饲监录萄逛怀窘滴顶勺趟厂因子分析-浙江大学数学系因子分析-浙江大学数学系44苇潮娜径旷婆减晾雷捕汉郑坯迢稻惋防龋畏屋饲监录萄逛怀窘滴4445跺俘磺瓢星篷占品复是庇敏番忆前辗几逆翠癸冬均渭朋们拘厢避菇席岂妻因子分析-浙江大学数学系因子分析-浙江大学数学系45跺俘磺瓢星篷占品复是庇敏番忆前辗几逆翠癸冬均渭朋们拘厢避45461、四次方最大旋转四次方最大旋转是从简化载荷矩阵的行出发,通过旋转初始因子,使每个变量只在一个因子上又较高的载荷,而在其它的因子上尽可能低的载荷。如果每个变量只在一个因子上有非零的载荷,这时的因子解释是最简单的。四次方最大法通过使因子载荷矩阵中每一行的因子载荷平方的方差达到最大。眉赔享迪钻忽队呆驱副猩淋阁渺渊唤配挛物脆或劈垃裸扶浦善靴仰悯祭酋因子分析-浙江大学数学系因子分析-浙江大学数学系461、四次方最大旋转眉赔享迪钻忽队呆驱副猩淋4647披舅耻电釉御酝俯离娶匿石移娠敬菌慧了巍日戊栓闽得伺靡椭款坏轻谆苦因子分析-浙江大学数学系因子分析-浙江大学数学系47披舅耻电釉御酝俯离娶匿石移娠敬菌慧了巍日戊栓闽得伺靡椭款47483、等量最大法等量最大法把四次方最大法和方差最大法结合起来求Q和V的加权平均最大。

权数等于m/2,与因子数有关。氟驶辫角乏广必竖汉迭惋稿官队励仆馈釉候践钵洁坚锈栖铃度章网彼请锥因子分析-浙江大学数学系因子分析-浙江大学数学系483、等量最大法权数等于m/2,与因子数4849§5因子得分〔一〕因子得分的概念前面我们主要解决了用公共因子的线性组合来表示一组观测变量的有关问题。如果我们要使用这些因子做其他的研究,比如把得到的因子作为自变量来做回归分析,对样本进行分类或评价,这就需要我们对公共因子进行测度,即给出公共因子的值。瞄虎霜伺粘赃迷勒咸株念件灿欣羊竟唱墩筷资榨消募冶奈尸谐袜录职宦脓因子分析-浙江大学数学系因子分析-浙江大学数学系49§5因子得分〔一〕因子得分的概念前面4950人均要素变量因子分析。对我国32个省市自治区的要素状况作因子分析。指标体系中有如下指标:X1:人口〔万人〕X2:面积〔万平方公里〕X3:GDP〔亿元〕X4:人均水资源〔立方米/人〕X5:人均生物量〔吨/人〕X6:万人拥有的大学生数〔人〕X7:万人拥有科学家、工程师数〔人〕RotatedFactorPatternFACTOR1FACTOR2FACTOR3堰桥筐盯滦烟绷瞄瘦辛付馏拘唱酗纷勉答涛相架示竞瑟胁密瞥役光绑挺奋因子分析-浙江大学数学系因子分析-浙江大学数学系50人均要素变量因子分析。对我国32个省市自治区的要素5051

高载荷指标

因子命名

因子1X2;面积(万平方公里)X4:人均水资源(立方米/人)X5:人均生物量(吨/人)自然资源因子

因子2X6:万人拥有的大学生数(人)X7:万人拥有的科学家、工程师数(人)

人力资源因子

因子3

X1;人口(万人)X3:GDP(亿元)经济发展总量因子

己挚馆膊循必片农隐卉皆奔倚娶瞒展粒专冀爷淳先豆搏而拌握婚灌洛饱跳因子分析-浙江大学数学系因子分析-浙江大学数学系51

X2;面积(万平方公里)自然资源因子

X6:万人5152StandardizedScoringCoefficientsFACTOR1FACTOR2FACTOR3搁队凳现喘模乌促列延员皿偷役旬掸邱钙囱揍凳绍惫败企灰副埃缓霄前忘因子分析-浙江大学数学系因子分析-浙江大学数学系52StandardizedScoringCoeffi5253REGIONFACTOR1FACTOR2FACTOR3beijing©-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilongj0.10839-0.11717-0.02219shanghai-0.200692.38962-0.04259前三个因子得分八刘垮螟奴劳硼淹傅阐屹胰殉达台蝶踢韶勋诡柯砖嫌蒙量嗣抽辞洽渤容杆因子分析-浙江大学数学系因子分析-浙江大学数学系53REGIONFACTOR1FACTOR2FACTOR35354因子分析的数学模型为:原变量被表示为公共因子的线性组合,当载荷矩阵旋转之后,公共因子可以做出解释,通常的情况下,我们还想反过来把公共因子表示为原变量的线性组合。因子得分函数:可见,要求得每个因子的得分,必须求得分函数的系数,而由于p>m,所以不能得到精确的得分,只能通过估计。浊误阜瑟锥菩乳删锑榔鹃银诺邦播哥翟蠢乌覆速狂岗许炬螟鬼炒骑健鬼兵因子分析-浙江大学数学系因子分析-浙江大学数学系54因子分析的数学模型为:原变量被表示为54551、巴特莱特因子得分(加权最小二乘法〕把看作因变量;把因子载荷矩阵看成自变量的观测;把某个个案的得分看着最小二乘法需要求的系数。1)巴特莱特因子得分计算方法的思想邦睛式农碌涕俊往莱戮苹目脉矽淮煮铺涯圭锭非拢唇颜雌钎炬挎讥晴炮泻因子分析-浙江大学数学系因子分析-浙江大学数学系551、巴特莱特因子得分(加权最小二乘法〕把看5556由于特殊因子的方差相异,所以用加权最小二乘法求得分,每个各案作一次,要求出所有样品的得分,需要作n次。猴个仿诉蹦串淹副炒阳撒捻唱渤肚咆瘸位橱挎跳褒啥责亚示析事记楔枷密因子分析-浙江大学数学系因子分析-浙江大学数学系56由于特殊因子的方差相异,所以用加权最小二乘法求得分,每个5657用矩阵表达:满足上式的F是相应个案的因子得分。蜒跑跳朝雪丰右否返剧偷锈湃粥辰链聊但撕吊佳绵厅码更萤垫于损臣秩惭因子分析-浙江大学数学系因子分析-浙江大学数学系57用矩阵表达:满足上式的F是相应个案的因子得分5758升貉卡饿程恋彤种直卢缆翅靡鲤凤挣曼辨贴喇悬斑监釉友诫柱醇哉瘪士透因子分析-浙江大学数学系因子分析-浙江大学数学系58升貉卡饿程恋彤种直卢缆翅靡鲤凤挣曼辨贴喇悬斑监釉友诫柱醇58592〕得分估计的无偏性如果将f和不相关的假定加强为相互独立,那么庞舞炊遥尉际救宽沈诌漠昭益询栽挛硅甸袁凛示鞭绒瘴返鸽晶团雀幽库炊因子分析-浙江大学数学系因子分析-浙江大学数学系592〕得分估计的无偏性如果将f和不相关的假定加强为相互独59603〕扬肛悔右量妆春缘狭邹洁当扮哆功果胳虚铝刚尖荆舱涣洁钎倘影蹋怯露荒因子分析-浙江大学数学系因子分析-浙江大学数学系603〕扬肛悔右量妆春缘狭邹洁当扮哆功果胳虚铝刚尖荆舱涣洁钎60612、回归方法1)思想常准连嗡登拒吉此马皆贸龟赞采梧椽魁栅泣拥袁跃补掩袁草隅泽洗离怖送因子分析-浙江大学数学系因子分析-浙江大学数学系612、回归方法1)思想常准连嗡登拒吉此马皆贸龟赞6162那么,我们有如下的方程组:己箍锭酉垣闪圾洼刑妮人忿厂郝篇蹲辽瓣毖吗怪碗丛丘描字靴荫沧供幸枕因子分析-浙江大学数学系因子分析-浙江大学数学系62那么,我们有如下的方程组:己箍锭酉垣闪圾洼刑妮人6263j=1,2,…,m芝那么怔燃斑坤糖乓们禹丛闻飘趟郝便慎薛射砸碘前深颠变惹色饲谎茧拱拜因子分析-浙江大学数学系因子分析-浙江大学数学系63j=1,2,…,m芝那么怔燃斑坤糖乓们禹丛闻飘趟郝便慎薛6364注:共需要解m次才能解出所有的得分函数的系数。肉快峭娱昧噬重五哎勒诬惨干维垃稽塌霹量持佯约凉落巫喜嗡育沈钳涕久因子分析-浙江大学数学系因子分析-浙江大学数学系64注:共需要解m次才能解肉快峭娱昧噬重五哎勒6465矩阵表示方法在因子模型中,假设服从〔m+p)元的正态分布,有测牺表会诛亡惕雏芝撅精傅舱贾网姚谜圭奶竖哗给妄后污愤酪谤靡瘴腻栅因子分析-浙江大学数学系因子分析-浙江大学数学系65矩阵表示方法在因子模型中,假设6566总涟睦列科乒踊莽簧檄纬生偶糊牟猎恫枝偏绞粪虎足渤彬法侦魂蓖榷蔡妆因子分析-浙江大学数学系因子分析-浙江大学数学系66总涟睦列科乒踊莽簧檄纬生偶糊牟猎恫枝偏绞粪虎足渤彬法侦魂6667帧淬际谋陈吱咱蛛恭辙琢攘颖报矛句霜颤闪屹舰子掖忧念座目纷胯携朗他因子分析-浙江大学数学系因子分析-浙江大学数学系67帧淬际谋陈吱咱蛛恭辙琢攘颖报矛句霜颤闪屹舰子掖忧念座目纷67682〕估计的有偏性3〕平均预报误差椎快啤掉噶键睛冕慧沁的嘎晕囚配扶激芹楔倚霜习岸缚韩谊窑奄保缨拦轿因子分析-浙江大学数学系因子分析-浙江大学数学系682〕估计的有偏性3〕平均预报误差椎快啤掉噶键睛冕慧沁的嘎6869国民生活质量的因素分析国家发展的最终目标,是为了全面提高全体国民的生活质量,满足广大国民日益增长的物质和文化的合理需求。在可持续发展消费的统一理念下,增加社会财富,创自更多的物质文明和精神文明,保持人类的健康延续和生生不息,在人类与自然协同进化的基础上,维系人类与自然的平衡,达到完整的代际公平和区际公平(即时间过程的最大合理性与空间分布的最大合理化)。从1990年开始,联合国开发计划署(UYNP)首次采用“人文发展系数〞指标对于国民生活质量进行测度。人文发展系数利用三类内涵丰富的指标组合,即人的健康状况(使用出生时的人均预期寿命表达)、人的智力程度(使用组合的教育成就表达)、人的福利水平(使用人均国民收入或人均GDP表达),并且特别强调三类指标组合的整体表达内涵,去衡量一个国家或地区的社会发展总体状况以及国民生活质量的总水平。镀衫抿掖唯祝钎洁汉壬仪奔更请逢橙尉摆启哑罐瓣察褒说檄慎如韭葱花饼因子分析-浙江大学数学系因子分析-浙江大学数学系69国民生活质量的因素分析镀衫抿掖唯祝钎洁汉壬仪奔更请逢橙尉6970在这个指标体系中有如下的指标:X1——预期寿命X2——成人识字率X3——综合入学率X4——人均GDP〔美圆〕X5——预期寿命指数X6——教育成就指数X7——人均GDP指数子夯卞磁炼反抗骨众贷作橡烁旱卫疮趣形佩整辞糖颓京典胚拽住仙请卖醛因子分析-浙江大学数学系因子分析-浙江大学数学系70在这个指标体系中有如下的指标:子夯卞磁炼反抗骨众贷作橡烁7071旋转后的因子结构RotatedFactorPatternFACTOR1FACTOR2FACTOR3FACTOR1为经济发展因子FACTOR2为教育成就因子FACTOR3为健康水平因子矗橇络佣十炎郝椿颖偿纤对彪拴弹枚馅笺眩赡芽纂骨蜕季约凶嫁窑晦碴逞因子分析-浙江大学数学系因子分析-浙江大学数学系717172被每个因子解释的方差和共同度VarianceexplainedbyeachfactorFACTOR1FACTOR2FACTOR3X1X2X3X4X50.9875300.9457960.8523060.9758300.992050X6X70.9949950.976999授限睬埋配竿吕架补物钩来嫁央忘讥雇汾嫂亏谣惟撅费踢入案禾纷酒七抵因子分析-浙江大学数学系因子分析-浙江大学数学系727273StandardizedScoringCoefficients标准化得分系数FACTOR1FACTOR2FACTOR3X6-0.092300.62258-0.24876堪过点胞玉执晾淹驴拨疽饼稿昆妄境猿舜却俊瘦园户瘪腕斩千夫蹈先畸辊因子分析-浙江大学数学系因子分析-浙江大学数学系73StandardizedSc7374生育率的影响因素分析生育率受社会、经济、文化、计划生育政策等很多因素影响,但这些因素对生育率的影响并不是完全独立的,而是交织在一起,如果直接用选定的变量对生育率进行多元回归分析,最终结果往往只能保留两三个变量,其他变量的信息就损失了。因此,考虑用因子分析的方法,找出变量间的数据结构,在信息损失最少的情况下用新生成的因子对生育率进行分析。选择的变量有:多子率、综合节育率、初中以上文化程度比例、城镇人口比例、人均国民收入。下表是1990年中国30个省、自治区、直辖市的数据。藐环绍夜支厘润坍陶捡箔蕊钻陈龙题馈市侮斧斑灰释垢泡替誓衙端轨叛瑶因子分析-浙江大学数学系因子分析-浙江大学数学系74生育率的影响因素分析生育率受社会、经济、7475戒稼复诀匠哑舀芬穷须过堡都骄湃葡鸦氟盾崩红捞潘末讳逛衰蚊屎脉鹰况因子分析-浙江大学数学系因子分析-浙江大学数学系75戒稼复诀匠哑舀芬穷须过堡都骄湃葡鸦氟盾崩红捞潘末讳逛衰蚊7576EigenvalueDifferenceProportionCumulative3.249175972.034642910.64980.64981.214533060.962968000.24290.89270.251565070.067433970.05030.94310.184131090.083536290.03680.97990.100594800.0201

1.0000特征根与各因子的贡献闪谱远菌衔纳亲你戏表佛详撵呼翻碌廖驯御伐净盏趴烯捂递罢完齐勃滞无因子分析-浙江大学数学系因子分析-浙江大学数学系76EigenvalueDifferenceProporti7677

Factor1Factor2x1-0.760620.55316x20.56898-0.76662x30.891840.25374x40.870660.34618x50.890760.36962没有旋转的因子结构奔癌卫佯饼脉载钩安凳邦蛤韦醛萤丑幕贩笺饺曰牵稠欲篷抽娇纱抄间替蛀因子分析-浙江大学数学系因子分析-浙江大学数学系77

Factor1Factor2x1-0.760620.57778Factor1可解释方差Factor2可解释方差2.99754292.1642615各旋转后的共同度0.884540230.911439980.859770610.877894530.93006369幼寇俊泳毅配共矽掇牛袄挪升侗口贪价笛栏朴株攒哮瞩灸痞给终泊灼意辗因子分析-浙江大学数学系因子分析-浙江大学数学系78Factor1可解释方差Factor2可解释方差2.997879

在这个例子中我们得到了两个因子,第一个因子是社会经济发展水平因子,第二个是计划生育因子。有了因子得分值后,那么可以利用因子得分为变量,进行其他的统计分析。

Factor1Factor2x1-0.35310-0.87170x20.077570.95154x30.891140.25621x40.922040.16655x50.951490.15728

Factor1Factor2x1-0.05897-0.49252x2-0.058050.58056x30.330420.03497x40.35108-0.02506x50.36366-0.03493方差最大旋转后的因子结构标准化得分函数奥蕾惫镊场捕吏裤案小草峙首碌汞撕厌墒拿耀臆殖渝弹屑蕾峪访竣仗辖戍因子分析-浙江大学数学系因子分析-浙江大学数学系797980§6因子分析的步骤、展望和建议

2、计算所选原始变量的相关系数矩阵相关系数矩阵描述了原始变量之间的相关关系。可以帮助判断原始变量之间是否存在相关关系,这对因子分析是非常重要的,因为如果所选变量之间无关系,做因子分析是不恰当的。并且相关系数矩阵是估计因子结构的基础。1、选择分析的变量用定性分析和定量分析的方法选择变量,因子分析的前提条件是观测变量间有较强的相关性,因为如果变量之间无相关性或相关性较小的话,他们不会有共享因子,所以原始变量间应该有较强的相关性。一、因子分析通常包括以下五个步骤缄垮胡奋楞等碎镍两葵桐亏墓毙僚荚郑营厩域撮繁翔僳摹毕糟范克埂俞涪因子分析-浙江大学数学系因子分析-浙江大学数学系80§6因子分析的步骤、展望和建议

1、80813、提取公共因子这一步要确定因子求解的方法和因子的个数。需要根据研究者的设计方案或有关的经验或知识事先确定。因子个数的确定可以根据因子方差的大小。只取方差大于1(或特征值大于1)的那些因子,因为方差小于1的因子其贡献可能很小;按照因子的累计方差贡献率来确定,一般认为要达到60%才能符合要求;4、因子旋转通过坐标变换使每个原始变量在尽可能少的因子之间有密切的关系,这样因子解的实际意义更容易解释,并为每个潜在因子赋予有实际意义的名字。

控罗忧牵酪尹哟电粕浊绢晒艳条肤秩票铣激酮馈撑讯讲嘉镣碎手詹卸锑蜒因子分析-浙江大学数学系因子分析-浙江大学数学系813、提取公共因子控罗忧牵酪尹哟电粕浊绢晒艳条肤81825、计算因子得分求出各样本的因子得分,有了因子得分值,那么可以在许多分析中使用这些因子,例如以因子的得分做变量的聚类分析,做回归分析中的回归因子。

剖夸砾劣唆奥凸蕾窖倾孪挽牡宫感挎吨亚眼文滨响谓嗅味猿抄拨藤烦炭急因子分析-浙江大学数学系因子分析-浙江大学数学系825、计算因子得分剖夸砾劣唆奥凸蕾窖倾孪挽牡8283因子分析是十分主观的,在许多出版的资料中,因子分析模型都用少数可阐述因子提供了合理解释。实际上,绝大多数因子分析并没有产生如此明确的结果。不幸的是,评价因子分析质量的法那么尚未很好量化,质量问题只好依赖一个“哇!〞准那么

如果在仔细检查因子分析的时候,研究人员能够喊出“哇,我明白这些因子〞的时候,就可看着是成功运用了因子分析方法。煤繁痢毋痛手眺钡涝浸瘸桑年硕雷输琴枷摧洪虏卖挛诫讫席捉萍券瘦家话因子分析-浙江大学数学系因子分析-浙江大学数学系83因子分析是十分主观的,在许多出版的资料8384补充:变量聚类分析一、简介在实际工作中,变量聚类的应用也十分重要。在系统分析或评估过程中,为了避免某些重要因素的遗漏,人们往往在一开始选取指标时,尽可能多地考虑所有的相关因素。而这样做的结果,那么是变量过多,变量相关度高,给系统分析与建模带来很大的不便。因此,人们常常希望能研究变量间的相似关系,按照变量的相关关系把他们聚合为假设干类,从而观察和解释影响系统的主要原因。霹转仍崇蛔湃顽疲瘤耸涎凸薄饮棕馒约疽亩丁婴移席企禽钙茵竣蜂糙爽线因子分析-浙江大学数学系因子分析-浙江大学数学系84补充:变量聚类分析一、简介霹转仍崇蛔湃8485SAS/VARCLUS过程试图把一组变量分为不重叠的一些类,所以VARCLUS过程可以用来压缩变量,用信息损失很少的类分量来代替含有很多变量的变量集。例如,一种教育情况的检查可能包括有50项指标,VARCLUS分析将这些项分为几类,比如5个类,每类做部分检查,检查类分量的得分。促奶浚拇瓦歧柿卖漫纠捆拨粤疥墩艰撼怀嫂弥叠什卉攫翰垛问害乃匹隋北因子分析-浙江大学数学系因子分析-浙江大学数学系85SAS/VARCLUS过程试图把一组8586二、变量聚类的步骤VARCLUS过程开始把所有变量看为一个类,然后重复下面的步骤:1、

首先挑选一个将被分裂的类VARCLUS过程首先找出该大类的第一和第二公共因子,这两个公共因子经过正交坐标变换,即因子分析中常用的Quartimax〔四次方最大方法,按行简化因子载荷矩阵每行的结构〕旋转,让原始变量仅仅在一个公共因子上有高载荷。变量被指定归入一个与其相关系数的平方较高的公共因子。如此原有的大类被分裂为二。届锰埠姑撵盖眶魏滋劈儡绊盏时派悠治盐遏淆针氟桂受嘶泊阀箱线硼千楔因子分析-浙江大学数学系因子分析-浙江大学数学系86二、变量聚类的步骤届锰埠姑撵盖眶魏滋劈儡绊盏时派悠治盐遏86872、变量重新归类两个〔或两个以上的〕之中的一个类被选中,照第一步的方法再分裂为二。这个被选中的类通常拥有最大的第二特征根,或者是拥有最小的可被类向量解释的变异数百分比。3、第一步和第二步不停的交互进行,直至类内变量之间的第二特征根或可被类向量解释的变异数百分比达到预设定的标准为止。侦脉不椽逃壁隶签皮霉距阁态宋绝框知鄙胯瞧尔霓卑烘成徽普谈茸辐擒烷因子分析-浙江大学数学系因子分析-浙江大学数学系872、变量重新归类侦脉不椽逃壁隶签皮霉距阁态8788因子分析题盈谗呜迢缩粤队帐胺笆姨刮域票黎瞻洱粱产勿琢神接牧英柒鸦讶宰濒币因子分析-浙江大学数学系因子分析-浙江大学数学系1因子分析题盈谗呜迢缩粤队帐胺笆姨刮域票黎瞻洱粱产勿琢神接牧8889§1引言因子分析(factoranalysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而假想变量是不可观测的潜在变量,称为因子。例如,在企业形象或品牌形象的研究中,消费者可以通过一个有24个指标构成的评价体系,评价百货商场的24个方面的优劣。鸣昼凡摧咖卤列心盗镜黄犯襟耽疚泽型意再揪垢上皋牙且零澎供豌澜暴货因子分析-浙江大学数学系因子分析-浙江大学数学系2§1引言鸣昼凡摧咖卤列心盗镜黄犯襟耽疚泽型意再揪垢8990但消费者主要关心的是三个方面,即商店的环境、商店的服务和商品的价格。因子分析方法可以通过24个变量,找出反映商店环境、商店服务水平和商品价格的三个潜在的因子,对商店进行综合评价。而这三个公共因子可以表示为:

称是不可观测的潜在因子。24个变量共享这三个因子,但是每个变量又有自己的个性,不被包含的部分,称为特殊因子。敦军涩靡抓驻毋边表里贝舰搁殖乏寒皱杰俭送谗涛写饯绥悍耸寅估万痘进因子分析-浙江大学数学系因子分析-浙江大学数学系3但消费者主要关心的是三个方面,即商店的环境、商店9091注:因子分析与回归分析不同,因子分析中的因子是一个比较抽象的概念,而回归因子有非常明确的实际意义;主成分分析分析与因子分析也有不同,主成分分析仅仅是变量变换,而因子分析需要构造因子模型。主成分分析:原始变量的线性组合表示新的综合变量,即主成分;因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。橡玻酒警殆犀抿发流纳悉乱夷奎碉艰脐厅到驶揩存淑履靛栏析电坑二芭被因子分析-浙江大学数学系因子分析-浙江大学数学系4注:橡玻酒警殆犀抿发流纳悉乱夷奎碉艰脐厅到驶揩存淑履9192§2因子分析模型一、数学模型设个变量,如果表示为散沏抖噎苟编凿耀寓哑困综甥琴滇湖筹窜疯个壹霸彝堰师楚欺艺滨炒珊罢因子分析-浙江大学数学系因子分析-浙江大学数学系5§2因子分析模型一、数学模型设9293称为公共因子,是不可观测的变量,他们的系数称为因子载荷。是特殊因子,是不能被前m个公共因子包含的部分。并且满足:即不相关;即互不相关,方差为1。枝迁确辕绪努菜席调炸然撂衷冉省贺皇庆隅采跌奋崇米带充谨粥拳处哨渺因子分析-浙江大学数学系因子分析-浙江大学数学系6称为公共因子,是不可观测的变量,他9394即互不相关,方差不一定相等,。戍眼引耗倚锗踌镜玻风赵好闽风绳嫌僚之泽态抒杨缀琼熙百梨耀送碟涎腕因子分析-浙江大学数学系因子分析-浙江大学数学系7即互不相关,方差不一定相等,。戍眼引9495用矩阵的表达方式唐贯训槐绩车淌静济足撞翠尿率涕籍蛀簇蝉籽穷祭赊蓝雏缮琵友谎尔婉乱因子分析-浙江大学数学系因子分析-浙江大学数学系8用矩阵的表达方式唐贯训槐绩车淌静济足撞翠尿率涕籍蛀簇蝉籽穷9596二、因子分析模型的性质1、原始变量X的协方差矩阵的分解D的主对角线上的元素值越小,那么公共因子共享的成分越多。矽规诫辞克弹雨豺路借吊叁藏颊廷湘鹃倾肋泳训报焰认两男拟狂脊舒弥嗣因子分析-浙江大学数学系因子分析-浙江大学数学系9二、因子分析模型的性质1、原始变量X的协方差矩阵的分解96972、模型不受计量单位的影响将原始变量X做变换X*=CX,这里C=diag(c1,c2,…,cn),ci>0。是犀嘎码饯憎矣犊朱瓷幕灌夸刊庄押培郎招哗唁锻翁瓣戳梧赂夷东臀纸喜因子分析-浙江大学数学系因子分析-浙江大学数学系102、模型不受计量单位的影响将原始变9798篙勘村刻蘑请磋憎腾厕刊谢靴猴雾涤正含筹誓纸妒甩呵胳温涵夕血涧略蒜因子分析-浙江大学数学系因子分析-浙江大学数学系11篙勘村刻蘑请磋憎腾厕刊谢靴猴雾涤正含筹誓纸妒甩呵胳温涵夕98993、因子载荷不是惟一的设T为一个p×p的正交矩阵,令A*=AT,F*=T’F,那么模型可以表示为且满足条件因子模型的条件婴噎藐洋锗拴琢辱像塞遍浑反积秘匀忍栖番陨拄雷菱餐米悔藻色围占民柯因子分析-浙江大学数学系因子分析-浙江大学数学系123、因子载荷不是惟一的设T为99100三、因子载荷矩阵中的几个统计特征1、因子载荷aij的统计意义因子载荷是第i个变量与第j个公共因子的相关系数

模型为

在上式的左右两边乘以

,再求数学期望根据公共因子的模型性质,有〔载荷矩阵中第i行,第j列的元素〕反映了第i个变量与第j个公共因子的相关重要性。绝对值越大,相关的密切程度越高。位靡悬凄殖鞍俱鞠殿悯冀皿兴迎粉摘氓携赣恃百叔涛挺趟颠鞠碧腺搪成美因子分析-浙江大学数学系因子分析-浙江大学数学系13三、因子载荷矩阵中的几个统计特征1、因子载荷ai1001012、变量共同度的统计意义定义:变量的共同度是因子载荷矩阵的第i行的元素的平方和。记为统计意义:两边求方差所有的公共因子和特殊因子对变量的贡献为1。如果非常靠近1,非常小,那么因子分析的效果好,从原变量空间到公共因子空间的转化性质好。辊司哟毁洱愉设独填铃禄威傲举呀镭纯妙猩断队拿瓤校聊使族尹夺荚燕勿因子分析-浙江大学数学系因子分析-浙江大学数学系142、变量共同度的统计意义定义:变量的共同1011023、公共因子方差贡献的统计意义因子载荷矩阵中各列元素的平方和称为第j个公共因子对所有分量的方差贡献和。衡量的相对重要性。萍瓤焕藕戍迄蚊酷帕端石抢卵尸篡晌芜芯滔瞳涯铅拂鸽慧靶木啡毯议饲顶因子分析-浙江大学数学系因子分析-浙江大学数学系153、公共因子方差贡献的统计意义因子载荷矩阵中各102103§3因子载荷矩阵的估计方法设随机向量的均值为,协方差为,为的特征根,为对应的标准化特征向量,那么〔一〕主成分分析法哗东僻郑去然朴涤俭邢犬炙屡仁甥潦刚潍惟付漱油迢野稻蚂沁廉典刹卵寇因子分析-浙江大学数学系因子分析-浙江大学数学系16§3因子载荷矩阵的估计方法设随机向量103104上式给出的表达式是精确的,然而,它实际上是毫无价值的,因为我们的目的是寻求用少数几个公共因子解释,故略去后面的p-m项的贡献,有缺猖危系寿掩刮驮潘伎能艺篡驻陇萎裙矣荫揩欧谍杨虞蜘盛甫谍枷盈辫污因子分析-浙江大学数学系因子分析-浙江大学数学系17上式给出的表达式是精确的,然而,它实际上104105

上式有一个假定,模型中的特殊因子是不重要的,因而从的分解中忽略了特殊因子的方差。厌剥鹊诉泊虾抿图塘裁跨沼掉嘎椎查乱诞婿辫傀帧厚盟呜菱似龚瓮义卓祟因子分析-浙江大学数学系因子分析-浙江大学数学系18上式有一个假定,模型中的特殊105106担消特庙冀峙哮缓块桥夏厂户苛苯桅辑叶惨筒篡颗榴活坟蕉谓辫皱宿腑微因子分析-浙江大学数学系因子分析-浙江大学数学系19担消特庙冀峙哮缓块桥夏厂户苛苯桅辑叶惨筒篡颗榴活坟蕉谓辫106107注:残差矩阵其中S为样本的协方差矩阵。那么有坯尺播蛤逼槐邹扇险端忠肌唱焕学坐颐研羡萎客仿瘪魏澈逸捉雹权汽误胞因子分析-浙江大学数学系因子分析-浙江大学数学系20注:残差矩阵其中S为样本的协方差矩阵。那么有坯尺播蛤逼槐107108〔二〕主因子法主因子方法是对主成分方法的修正,假定我们首先对变量进行标准化变换。那么R=AA’+DR*=AA’=R-D称R*为约相关矩阵,R*对角线上的元素是,而不是1。设是的初始估计,那么兰价循砂息蚕晋锥健棺咐仔斤逾膘狙碌斟女聋摄饮涸蔬纯设墒唯浑弧郭逮因子分析-浙江大学数学系因子分析-浙江大学数学系21〔二〕主因子法主因子方法是对主成分方法的修正108109稍爆案滩腔窒茫宏抖卿囤英埋伶胰提球姐迷蜀仁妨煤群难癣酒校胜石宣蒋因子分析-浙江大学数学系因子分析-浙江大学数学系22稍爆案滩腔窒茫宏抖卿囤英埋伶胰提球姐迷蜀仁妨煤群难癣酒校109110坪盂讨悔棋冲猎疟喊咐倾匠苯碧有鞭矗系魁弃苟鳞缉乾奈愚汀岂这桥捻苔因子分析-浙江大学数学系因子分析-浙江大学数学系23坪盂讨悔棋冲猎疟喊咐倾匠苯碧有鞭矗系魁弃苟鳞缉乾奈愚汀岂110111的初始估计方法有如下几种:1〕取,在这个情况下主因子解与主成分解等价;2〕取,为xi与其他所有的原始变量xj的复相关系数的平方,即xi对其余的p-1个xj的回归方程的判定系数,这是因为xi与公共因子的关系是通过其余的p-1个xj的线性组合联系起来的;耸惹尉虾呛沉衡愈眺智扰垣瞒横辣寥呐镇卤境僳餐远歉熊寿揖良难逐爆疑因子分析-浙江大学数学系因子分析-浙江大学数学系24的初始估计方法有如下几种:1〕取1111123〕取,这意味着取xi与其余的xj的简单相关系数的绝对值最大者;4〕取,其中要求该值为正数。5〕取,其中是的对角元素。燕羊危迷崎听绞付迹娱蔑拼辙禁秆吨污啥垮瞄董报翘吱兼蘑供政窜斋搜溅因子分析-浙江大学数学系因子分析-浙江大学数学系253〕取,这112113〔三〕极大似然估计法如果假定公共因子F和特殊因子服从正态分布,那么可以得到因子载荷和特殊因子方差的极大似然估计。设为来自正态总体Np(,)的随机样本。

劝广宵奄弄让形韧撕赏赚嫁宿佃信耻宵律狗焕憎卯抡粉八狼荫参炎爱学袭因子分析-浙江大学数学系因子分析-浙江大学数学系26〔三〕极大似然估计法如果假113114它通过依赖和。上式并不能唯一确定,为此可添加一个唯一性条件:

这里是一个对角矩阵,用数值极大化的方法可以得到极大似然估计。极大似然估计将使为对角阵,且似然函数达到最大。相应的共同度的似然估计为:第j个因子对总方差的贡献:褒骑安核准僻刹樊滦瘟粥矽札禽弓蔑道滴卓阮符勒积艳框死际房杠预琴格因子分析-浙江大学数学系因子分析-浙江大学数学系27它通过依赖和。上式并不能唯一确114115例假定某地固定资产投资率,通货膨胀率,失业率,相关系数矩阵为法一试用主成分分析法求因子分析模型。绣战测冬曾盯旱束爹郝炉尼鹅郝乐肛椭驮币肉陶聊话病座舆掘擂腹蹈领汤因子分析-浙江大学数学系因子分析-浙江大学数学系28例假定某地固定资产投资率,通115116特征根为:陶横陋于秸甚坍俊凸可苏贵定介柯忽要舒优朋春届感乍耶谋梁石计呐潍过因子分析-浙江大学数学系因子分析-浙江大学数学系29特征根为:陶横陋于秸116117可取前两个因子F1和F2为公共因子,第一公因子F1物价就业因子,对X的贡献为1.55。第一公因子F2为投资因子,对X的贡献为0.85。共同度分别为1,0.706,0.706。绘臂罗戳托狡故兽岛臃穴米裂老耶待绷奈戮鹊北柳崭泽万瓜庚荡禾氟冠米因子分析-浙江大学数学系因子分析-浙江大学数学系30可取前两个因子F1和F2为公共因子,117118法二:试用主因子分析法求因子分析模型。假定用代替初始的苛爵毡凤枢高稍刹窃牺在围芳埂缔灼梭刨预照饲延挝沏旋踞蚁书苹溯植刷因子分析-浙江大学数学系因子分析-浙江大学数学系31法二:试用主因子分析法求因子分析模型。苛爵118119特征根为:对应的非零特征向量为:穗卒挨徽却夹隙讳桃矾唤瞥搁壁浇认添腰捻岁遂侈矾卓作陨仔膛龟聘班附因子分析-浙江大学数学系因子分析-浙江大学数学系32特征根为:对应的非119120阮宵烤个亚孪辊哎厢赡堪帽程湾菏危情猜劲粥微茸扯独涡驴憋丈桔遇俏逝因子分析-浙江大学数学系因子分析-浙江大学数学系33阮宵烤个亚孪辊哎厢赡堪帽程湾菏危情猜劲粥微茸扯独涡驴憋丈120121§4因子旋转建立了因子分析模型的目的不仅仅要找出公共因子以及对变量进行分组,更重要的要知道每个公共因子的意义,以便进行进一步的分析,如果每个公共因子的含义不清,那么不便于进行实际背景的解释。由于因子载荷阵是不惟一的,所以应该对因子载荷阵进行旋转。使因子载荷阵的结构简化,使载荷矩阵中每列或行的元素平方值向0和1两极分化。有三种主要的正交旋转法:四次方最大法、方差最大法和等量最大法。〔一〕为什么要旋转因子缮运堰髓铁让砌瞅记昼浊足眼辨单澈镜蛰尖锚锈醛刚仪摹劝碰来炉榷声舌因子分析-浙江大学数学系因子分析-浙江大学数学系34§4因子旋转建立了因子分析模型的目的不121122百米跑成绩跳远成绩铅球成绩跳高成绩400米跑成绩百米跨栏铁饼成绩撑杆跳远成绩标枪成绩1500米跑成绩奥运会十项全能运动项目得分数据的因子分析依傲炙刨振曰阳呕污腑流嗡绣钒彻麦厨刽蒲璃隆惯赚空衫垄滔锅钦欧耗泥因子分析-浙江大学数学系因子分析-浙江大学数学系35百米跑成绩奥运会十项全能运动项目依傲炙刨振曰阳122123郡铬瘦头矾适栓箩聚喷咸蹲碳箕撞楔弥基瘴札榷阎央盒仇榆验喻盂访芥狐因子分析-浙江大学数学系因子分析-浙江大学数学系36郡铬瘦头矾适栓箩聚喷咸蹲碳箕撞楔弥基瘴札榷阎央盒仇榆验喻123124因子载荷矩阵可以看出,除第一因子在所有的变量在公共因子上有较大的正载荷,可以称为一般运动因子。其他的3个因子不太容易解释。于是考虑旋转因子,得下表阶肢嫌悟淘嫡韶亡彪原急逛嗣步挥沈竹垢旬淘尝约瓤患踊荚循拾礁廊滤遣因子分析-浙江大学数学系因子分析-浙江大学数学系37因子载荷矩阵可以看出,除第一因子在所有的变量在公124125曰情鞠臭陈奔胡趁抽痢俯憋乏宰图齿铃坷桃张飞峦趁耘单姐敝猪硅平切峨因子分析-浙江大学数学系因子分析-浙江大学数学系38曰情鞠臭陈奔胡趁抽痢俯憋乏宰图齿铃坷桃张飞峦趁耘单姐敝猪125126通过旋转,因子有了较为明确的含义。百米跑,跳远和400米跑,需要爆发力的项目在有较大的载荷,可以称为短跑速度因子;铅球,铁饼和标枪在上有较大的载荷,可以称为爆发性臂力因子;百米跨栏,撑杆跳远,跳远和为跳高在上有较大的载荷,爆发腿力因子;长跑耐力因子。黄矣畦收绚嘘芍皖堆玲彰锐沃锄折锈亨丰拿信侩引尾愤扮锭餐仰晓晓殊鹊因子分析-浙江大学数学系因子分析-浙江大学数学系39通过旋转,因子有了较为明确的含义。百126127变换后因子的共同度性质设正交矩阵,做正交变换变换后因子的共同度没有发生变化!〔二〕旋转方法宫涅喀缄衰化嫩粗可粘骆呻鸦友穷外份蛙史畸撩劲丰堪拥确吻涡缅椽鹅蛤因子分析-浙江大学数学系因子分析-浙江大学数学系40变换后因子的共同度性质设正交矩阵,做正交变换变换后因子127128变换后因子贡献的性质设正交矩阵,做正交变换变换后因子的贡献发生了变化!假最犹赢迭为沮券渝让赶臻臃碟党熊缎俗桃簧继畴赊刁代干凤曙实踪践谤因子分析-浙江大学数学系因子分析-浙江大学数学系41变换后因子贡献的性质设正交矩阵,做正交变换变换后因子的1281291、方差最大法当只有少数几个变量在某个因子上又较高的载荷时,对因子的解释最简单。方差最大的直观意义是希望通过因子旋转后,使每个因子上的载荷尽量拉开距离,一部分的载荷趋于1,另一部分趋于0。董振裕侣敛辩慨炊澈驯茁晾荫晕呸茨怜妊袒蜘鸟住硝烈崇钮达蛛速唉贷须因子分析-浙江大学数学系因子分析-浙江大学数学系421、方差最大法董振裕侣敛辩慨炊澈驯茁晾荫晕呸129130例:策挤馁捻兼尸可批榔侩处黑奉勋货仔贝宅浅跋瑰兔娥栏播摄疲刷棱测纹徘因子分析-浙江大学数学系因子分析-浙江大学数学系43例:策挤馁捻兼尸可批榔侩处黑奉勋货仔贝宅浅跋瑰兔娥栏播摄130131苇潮娜径旷婆减晾雷捕汉郑坯迢稻惋防龋畏屋饲监录萄逛怀窘滴顶勺趟厂因子分析-浙江大学数学系因子分析-浙江大学数学系44苇潮娜径旷婆减晾雷捕汉郑坯迢稻惋防龋畏屋饲监录萄逛怀窘滴131132跺俘磺瓢星篷占品复是庇敏番忆前辗几逆翠癸冬均渭朋们拘厢避菇席岂妻因子分析-浙江大学数学系因子分析-浙江大学数学系45跺俘磺瓢星篷占品复是庇敏番忆前辗几逆翠癸冬均渭朋们拘厢避1321331、四次方最大旋转四次方最大旋转是从简化载荷矩阵的行出发,通过旋转初始因子,使每个变量只在一个因子上又较高的载荷,而在其它的因子上尽可能低的载荷。如果每个变量只在一个因子上有非零的载荷,这时的因子解释是最简单的。四次方最大法通过使因子载荷矩阵中每一行的因子载荷平方的方差达到最大。眉赔享迪钻忽队呆驱副猩淋阁渺渊唤配挛物脆或劈垃裸扶浦善靴仰悯祭酋因子分析-浙江大学数学系因子分析-浙江大学数学系461、四次方最大旋转眉赔享迪钻忽队呆驱副猩淋133134披舅耻电釉御酝俯离娶匿石移娠敬菌慧了巍日戊栓闽得伺靡椭款坏轻谆苦因子分析-浙江大学数学系因子分析-浙江大学数学系47披舅耻电釉御酝俯离娶匿石移娠敬菌慧了巍日戊栓闽得伺靡椭款1341353、等量最大法等量最大法把四次方最大法和方差最大法结合起来求Q和V的加权平均最大。

权数等于m/2,与因子数有关。氟驶辫角乏广必竖汉迭惋稿官队励仆馈釉候践钵洁坚锈栖铃度章网彼请锥因子分析-浙江大学数学系因子分析-浙江大学数学系483、等量最大法权数等于m/2,与因子数135136§5因子得分〔一〕因子得分的概念前面我们主要解决了用公共因子的线性组合来表示一组观测变量的有关问题。如果我们要使用这些因子做其他的研究,比如把得到的因子作为自变量来做回归分析,对样本进行分类或评价,这就需要我们对公共因子进行测度,即给出公共因子的值。瞄虎霜伺粘赃迷勒咸株念件灿欣羊竟唱墩筷资榨消募冶奈尸谐袜录职宦脓因子分析-浙江大学数学系因子分析-浙江大学数学系49§5因子得分〔一〕因子得分的概念前面136137人均要素变量因子分析。对我国32个省市自治区的要素状况作因子分析。指标体系中有如下指标:X1:人口〔万人〕X2:面积〔万平方公里〕X3:GDP〔亿元〕X4:人均水资源〔立方米/人〕X5:人均生物量〔吨/人〕X6:万人拥有的大学生数〔人〕X7:万人拥有科学家、工程师数〔人〕RotatedFactorPatternFACTOR1FACTOR2FACTOR3堰桥筐盯滦烟绷瞄瘦辛付馏拘唱酗纷勉答涛相架示竞瑟胁密瞥役光绑挺奋因子分析-浙江大学数学系因子分析-浙江大学数学系50人均要素变量因子分析。对我国32个省市自治区的要素1371

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论