主成份和因子_第1页
主成份和因子_第2页
主成份和因子_第3页
主成份和因子_第4页
主成份和因子_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第10章

主成分分析与因子分析主成分分析因子分析中央财经大学统计学院学习目标1.主成分分析的基本思想2.主成分分析的软件实现和结果分析3.因子分析的基本思想4.因子分析的软件实现和结果分析2中央财经大学统计学院2主成分分析中央财经大学统计学院主成分分析的原理多元统计分析处理的是多变量(多指标)问题。由于变量较多,增加了分析问题的复杂性。但在实际问题中,变量之间可能存在一定的相关性,因此,多变量中可能存在信息的重叠。人们自然希望通过克服相关性、重叠性,用较少的变量来代替原来较多的变量,而这种代替可以反映原来多个变量的大部分信息,这实际上是一种“降维”的思想。“主成分分析”、“因子分析”

都可以用来对数据进行降维。4中央财经大学统计学院4主成分分析的基本思想主成分分析(Principalcomponentsanalysis)是由Hotelling于1933年首先提出的。由于多个变量之间往往存在着一定程度的相关性。人们自然希望通过线性组合的方式,从这些指标中尽可能快地提取信息。当这些变量的第一个线性组合不能提取更多的信息时,再考虑用第二个线性组合继续这个提取的过程,……,直到提取足够多的信息为止。这就是主成分分析的思想。5中央财经大学统计学院5主成分分析的基本思想主成分分析适用于原有变量之间存在较高程度相关的情况。在主成分分析适用的场合,一般可以用较少的主成分得到较多的信息量,从而得到一个更低维的向量。通过主成分既可以降低数据“维数”又保留了原数据的大部分信息。6中央财经大学统计学院6例:斯通关于国民经济的研究一项十分著名的工作是美国的统计学家斯通(Stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。在进行主成分分析后,竟以97.4%的精度,用三个新变量就取代了原17个变量。7中央财经大学统计学院7主成分分析的几何意义•••••••••••••••••••••••••••••••••••••如果仅考虑X1或X2中的任何一个分量,那么包含在另一分量中的信息将会损失,因此,直接舍弃x1或x2分量不是“降维”的有效办法。8中央财经大学统计学院8主成分分析的几何意义平移、旋转坐标轴•••••••••••••••••••••••••••••••••••••对坐标轴进行旋转,n个点在F1轴上的方差达到最大,即在此方向上包含了有关n个样品的最大量信息。因此,欲将二维空间的点投影到某个一维方向上,则选择F1轴方向能使信息的损失最小。9中央财经大学统计学院9主成鲜分分测析的而几何蛛意义第一问主成轧分的骂效果泡与椭鼠圆的循形状翅有关龟。椭榆圆越细扁平商,n个点般在F1轴上戏的方单差就而相对及越大问,在F2轴上搬的方抓差就堆相对质越小滩,用安第一剖主成泳分代班替所酷有样格品造叉成的执信息指损失乳就越兆小。10中央肢财经烧大学窃统计各学院10••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••主成蒙分分胆析的顷几何突意义原始咬变量魔不相滥关时究,主包成分交分析凯没有王效果蛮。11中央盼财经痒大学骑统计取学院11•••••••••••••••••••••••••••••••••••••主成猴分分厨析的眉几何哄意义原始烧变量矿相关琴程度漏越高逆,主寺成分岗分析羡效果冒越好棉。12中央尿财经调大学尾统计站学院12主成捏分分贝析的议数学捉模型方程施满足登下列蒜条件闷:(1)(2)Fi与Fj不相有关。(3)F1与Fp到方差猾依次悼递减楼。13中央俩财经龄大学束统计畅学院13主成遇分分荒析的合数学杨模型有p个x,相孕应可露以计厚算出p个主差成分斯。但臣一般鼻只使寒用少蛾数几群个主糊成分险就可体以提暂取大歪部分上信息虫。主成搏分分软析的两基本用任务竿是计兰算系然数矩竞阵a11……app。14中央就财经峡大学婆统计发学院14主成肌分求或解的板步骤主成馒分可英以按庸以下秤步骤挑计算贝得出坛:计算在原始匠变量封的相祝关系反数矩怕阵R。计算海相关竹系数等矩阵R的特赌征值刮,并殖按从宏大到具小的盟顺序那排列标,记帐为计算单特征窑值对异应的脚特征忧向量烫,即始为主赏成分F1……区Fp相应设的系杯数。15中央姜财经梳大学乏统计众学院15主成顶分得会分把原衣始变捐量的价值代劫入主坏成分扮表达放式中活,可感以计勺算出放主成欺分得鲜分。注意泼在计胃算主浴成分严得分双时需猪要先叼对原药始变伍量进洽行标准共化。得到需的主得成分辅得分版后,群可以笑把各昂个主岸成分巩看作徐新的是变量微代替惯原始喜变量敏,从眉而达尺到降涉维的竭目的仰。16中央著财经胡大学碧统计争学院16主成貌分的睁贡献敌率对于毛第k个主茧成分活,其地对方舞差的贡献搬率为前k个主诞成分屡贡献菌率的享累计昨值称棒为累计俯贡献毒率。17中央塞财经锈大学舱统计惹学院17主成扇分个茧数的彼确定通常塑有两仆种方演式:1、根争据大刻于1的特属征值浮的个忍数确达定主魂成分喉的个穷数;2、根斑据主宪成分侵的累蓝计贡昨献率均确定百主成包分的美个数亭,使毁累计拜贡献编率>8酿5%或者碑其他镰值。最常泛见的芦情况浆是主挑成分俱的个辨数为2-哭3个。18中央单财经叶大学熊统计劳学院18主成胀分分饭析的杯应用主成投分回娘归。即押把各泡主成壮分作爷为新规自变厚量代揪替原摸来自亩变量x做回燃归分遮析。多还可互以进过一步祥还原付得到Y与x的回鉴归方厕程(羡可以宴避免宪多重芳共线颂性的狭问题走)。用于综合觉评价。按照得单个茅的主妻成分瓦(例叼如第臣一主求成分愉)可序以对集个体西进行茧排序新。按照径几个面主成相分得强分的泽加权馆平均音值对其个体失进行吗排序顶也是欢一种评货价方立法。援一般蜓用各役个主诞成分演的方最差贡筝献率仓加权舞。由于棍加权正得分寺缺少毕实际其意义邀,这辨种方崇法理公论上诵有争郑议。19中央胳财经魄大学捏统计糊学院19主成留分分还析在SP控SS中的胁实现SP窗SS没有词直接枝提供秘主成丑分分滔析的献功能肝,需品要借翻助于漆“因梳子分脚析”挖的模雁块实周现。用SP什SS进行毫主成匠分分你析有尊几个旺操作般环节耀需要傅特别清注意达。下面陪我们门以讲淘义中托应聘村的例怜子加仪以说嚼明。20中央古财经圾大学拘统计雹学院20主成叮分分巾析在SP宪SS中的秤实现1、在SP当SS中打途开数有据文勒件(烟或者锤录入棒数据外)。21中央芦财经樱大学壮统计陶学院21主成堤分分痕析在SP无SS中的勤实现2、选昆择“喘分析羊”“降维耐”“因子驻分析敬”。3、把按除了牧“编盾号”洒以外捉的变克量选思入“飞变量剪”框暮;4、单歇击“奥描述遥”按纠钮,苗在弹己出的押对话黎框中海选中悉“系仙数”浑,以皇输出童相关想系数栗。其余送选项短使用陵默认目值。胜单击仅“确珠定”削。22中央另财经多大学识统计兵学院22SP胜SS结果堪分析吨:相树关系拦数表相关垒系数砌表中揭有较雨大的虑相关圣系数袭,主辞成分写分析负可能袍有效轰。

自信心洞察力诚信度推销能力工作经验简历格式.092.228-.107.271.548外貌.431.371.354.490.141研究能力.001.077-.030.055.266兴趣爱好.302.483.645.362.141自信心1.000.808.410.800.015洞察力.8081.000.356.818.147诚信度.410.3561.000.240-.156推销能力.800.818.2401.000.255工作经验.015.147-.156.2551.000工作魄力.704.698.280.815.337志向抱负.842.758.215.860.195理解能力.721.883.386.782.299潜能.672.777.416.754.348求职渴望度.482.527.448.563.215适应力.250.416.003.558.69323中央歪财经傲大学文统计坏学院23特征钳值和满贡献阳率前4个特妥征值朗为7.技51,2.躺05,1.迫46,1.斗20。默认串提取4个主缎成分桥,累饥计贡睡献率苹为81神.4每9%。24中央纪财经遍大学束统计街学院24因子哄载荷匪矩阵这个橡表是饲因子这分析万的因裳子载赠荷矩坝阵,室不是业特征候向量伏矩阵清。要得偶到特湾征向甲量,秋需要捷将各挡列除误以对备应特姨征值底的平撑方根齿。第1列除尚以根糖号7.器5,第鼠二列愉除以蜻根号2.艰05,等搜等。25中央缓财经霜大学彩统计鲁学院25特征振向量这是扭根据SP叉SS的结丘果在Ex哨ce姥l计算所出的弓特征架向量申。根据哑这个爱表可走以写弱出4个主诊成分古的表驾达式担。

成份

1234简历格式0.1620.4290.315-0.094外貌0.213-0.035-0.0230.262研究能力0.0400.237-0.4300.636兴趣爱好0.225-0.1300.4660.345自信心0.290-0.249-0.241-0.173洞察力0.315-0.131-0.150-0.071诚信度0.158-0.4050.2840.416推销能力0.324-0.029-0.186-0.198工作经验0.1340.5530.0830.068工作魄力0.3150.046-0.080-0.156志向抱负0.318-0.068-0.209-0.199理解能力0.331-0.023-0.1170.075潜能0.3330.022-0.0730.188求职渴望度0.259-0.0820.467-0.201适应力0.2360.4210.089-0.02026中央意财经乱大学借统计岛学院26主成鼻分表奏达式F1医=0罪.1榴62简历脏格式滋*+0接.2招13外貌粱*+0涉.0歪40学习捞能力恨*+…我…+静0.副23听6适应郑力*我。式中症带星烘号的死变量统表示梢标准产化后埋的变晃量其余脾主成届分的慎表达朴式依莲此类怜推。把标壮准化皮后的共各个悲变量滴带入楚方程唯可以餐计算鲁出主俗成分徒得分物。27中央洲财经脏大学凑统计碰学院27用SP甚SS计算纺的主鹅成分佣得分1、把岩原始愚变量方标准慕化;跟按照敲主成泻分的怠计算泥公式牢可以烛计算施出主洁成分瘦得分也。注:SA涌S、S-趣pl葵us、R等软喜件可尖以直峡接给秧出主截成分屑的系僚数表顿和主日成分皆得分志。28中央医财经摘大学银统计辆学院28主成零分分忠析案抗例210浇0个学渠生的趋六门果成绩锁(数嫌学、茫物理溉、化父学、昌语文哈、历枕史、寻英语郑)见ST肝UD仓EN忌T.黎SA季V。根据益数据放进行搂主成安分分杨析。29中央涌财经捡大学损统计痛学院29SP榨SS结果肢分析有比卷较高施的相钥关系待数,疲可以停使用招主成挎分分剂析方这法。30中央老财经尖大学尼统计苗学院30特征左值和检贡献葬率前2个主轻成分铃的贡坡献率问为81丝式.4痕2%。31中央仁财经唐大学黄统计宿学院31成分井矩阵侄和特变征向轿量成分饶矩阵阁各列灭除以蔽相应怀的特得征值炒可以范得出剪特征间向量字。第1主成分第2主成分数学-0.41700.3313物理-0.34880.4986化学-0.34910.4818语文0.46190.2877历史0.42690.4090英语0.43250.3996特征闷向量除以勺根号3.米73臂5除以狐根号1.武13踩332中央滚财经五大学镰统计迹学院32主成絮分得桥分co航m1,co浊m2为用乏公式续计算冰出的泻主成罩分得软分。33中央柿财经碌大学布统计堆学院33因子领分析中央批财经补大学沙统计沟学院因子引分析因子翠分析(f凡ac率to行r顽an秀al炭ys睛is罚)是一集种数早据简仰化的蹲技术贱。它你通过者研究著众多叠变量责之间阴的内困部依瓜赖关揭系,谨探求传观测牲数据叠中的秃基本狮结构箭,并析用少袜数几字个假迅想变敞量来偿表示只其基派本的涂数据摸结构怖。这紧几个担假想讽变量柴能够丈反映埋原来喜众多块变量除的主晴要信极息。伙原始率的变钞量是纷可观朽测的暴显在华变量厦,而色假想吊变量谁是不喂可观哪测的虾潜在颠变量蛙,称菌为因突子。35中央竞财经丢大学抗统计罩学院35一个绩例子例如京,在贞企业制形象信或品彼牌形窃象的公研究乘中,临消费宇者可健以通城过一展个有24个指可标构倚成的煎评价夺体系注,评疗价百乱货商殖场的24个方臣面的广优劣热。但消盟费者针主要迷关心雨的是国三个排方面哀,即瞧商店云的环沃境、薄商店科的服东务和阻商品犯的价免格。评因子朗分析枝方法回可以助通过24个变灶量,仓找出惹反映宴商店缠环境绸、商师店服辨务水保平和举商品涉价格技的三凝个潜霜在的渠因子醒,对常商店依进行巷综合切评价退。36中央廉财经描大学睡统计边学院36因子耍分析程的例泛子这三葵个公债共因农子可牵以表完示为躬:称馋是腾不可朴观测耀的潜闻在因蝇子。24个变造量共瓦享这矿三个召因子示,但劣是每父个变告量又墨有自杜己的却个性买,不霉被包含晨的部触分愚,称闲为特乐殊因浴子。37中央衡财经居大学阵统计症学院37因子挪分析疤与主槽成分灾分析哪的区始别主成盐分分稠析分幅析与云因子贷分析饶不同材,主挤成分挥分析吗仅仅纯是变墓量变俘换,嘴而因难子分培析需芦要构鲁造因涉子模拳型。主成通分分修析:等原始壶变量内的线剑性组此合表冷示新喇的综浅合变革量,猛即主烟成分义;因子暮分析购:潜果在的竟假想昌变量虎和随楼机影恰响变米量的蔽线性废组合配表示抬原始累变量茶。38中央每财经暴大学叛统计爱学院38因子挠分析偶的数龟学模蔬型假设理有p个变舟量X,有m个因后子(m≤遗p),升则因莫子分觉析的识数学喷模型史可以额表示允如下痒:i=回1…斜…m称贼为公不共因恰子,养是不吐可观坦测的壶变量混,他艳们的课系数葡称为毒因子钻载荷纲。贱是拾特殊朋因子汁,是踢不能显被前m个公演共因组子包屿含的隆部分竭。39中央杰财经啄大学帮统计灰学院39因子鲜分析崖的数迅学模品型因子尽之矿间互滋不相奔关,南并且姿方差惭等于1。因子队载荷堂是伯第i个变暂量与举第j个公赶共因倍子的票相关念系数您,反后映了临第j个公电共因些子对代第i个变血量的瓜影响描程度午。40中央查财经瞒大学峰统计妖学院40变量江共同遗度如果帐对变呢量X进行牺了标皆准化浙,可疏以证轨明定义软为变量Xi的共咬同度怒。变量此的共利同度京越接宋近1,说灿明被败变量孔公共网因子遗解释谅的程霞度越教高,路因子悔分析基的效垫果越涌好。41中央截财经散大学旱统计理学院41公共到因子Fj的方宇差贡内献因子弦载荷按矩阵滑中各列元素轿的平泊方和称为蹈公共见因子Fj对原舍始变哥量X的方卧差贡笑献。越可以热衡量羡衡量悠因子凝的钻相对娇重要杰性。42中央仗财经握大学俘统计援学院42因子暗载荷睛矩阵例的估缝计因子泰载荷乞矩阵少的估经计方塞法有辱多种尾,估达计结柔果并替不唯烛一。最常竹用的奖方法联之一嫩是主学成分送法:策求解慰变量X的前m个主架成分疮,进脆行简尚单后不的数僚学变欧换就取可以肯得到剪因子萄载荷品矩阵妈。与主唯成分律分析牲类似袄,可蜘以根吹据因逐子的穷累计树贡献掉率确同定因俯子的旧个数杀。43中央皆财经肾大学息统计区学院43因子辛旋转因子悔分析榜中得星出的旨各个新因子瞧如果挤有明孩确的罢含义途,则樱因子找分析话的模骄型会剩更加毁易于约解释冒和有环实际双意义浸。在因宁子分充析中名可以币对因狱子载惜荷阵炕进行杯旋转稀,使仿每个贸变量捷仅在猴一个文公共狡因子洞上有且较大野的载字荷,漆而在恭其余霸的公茂共因找子上民的载首荷比便较小添。通役过旋盈转,啄因子康可以压有更懂加明削确的你含义食。常用把的一讯种方词法是悉方差苹最大着旋转制。44中央径财经痒大学属统计屿学院44因子典得分前面必我们坚主要先解决迫了用何公共抚因子狭的线斥性组循合来释表示象一组洽观测每变量爪的有壤关问滥题。如果割我们融要使亡用这脆些因陪子做羊其他弄的研水究,无比如磁把得斑到的碍因子掏作为算自变递量来检做回欺归分望析,退对样局本进矩行分敞类或俊评价形,就踢需要狠计算美每个吊个体恰在每说个因宇子上伤的得肚分。45中央额财经还大学冈统计症学院45因子色得分汉的计贝算要计镇算因末子得屿分,年需要挠估计飘以下赠表达竹式:因子饭得分相有多程种计魄算方咳法,搭常用君的一朵种是通回归轮法。如果唐对变昂量都投进行程了标律准化舟,则顺模型自中没却有常尝数项帐。()46中央究财经棵大学豆统计慕学院46因子孔分析夫的步半骤1.根异据问厌题选饶取原龙始变敬量;2.求别其相骨关阵R,探价讨其模相关菊性;3.从R求解旱初始景公共眼因子F及因各子载负荷矩洒阵A(主成漆分法);4.因恐子旋焦转,竞分析织因子斥的含肢义;5.计倡算因删子得呢分函旅数;6.根恰据因称子得雕分值达进行注进一担步分记析(杂例如冶综合群评价庆)。47中央币财经滋大学俱统计勇学院47因子骨分析赠案例应聘断数据敲的例泄子。步骤印:1、在SP困SS中打鲁开数而据文硬件;2、选蔬择“焰分析梢”“窜降维矮”况“因毅子分问析”。3、把摧除了摔“编佣号”老以外削的变栗量选玻入“闯变量绞”框圣;4、单燃击“凳描述嫌”按郊钮,评在弹严出的伪对话度框中北选中肾“系赏数”雅,以检输出减相关带系数遗。48中央理财经调大学担统计鸣学院48SP浩SS因子屠分析筐操作5、单罢击“报旋转拾”,根选中蝇“最宾大方夏差法糊”,奶单击已“继屋续”峡;49中央圆财经是大学写统计串学院49SP霸SS因子限分析即操作5、单云击“戴得分抢”,险选中昂“保粱存为赠变量宗”,保“显眨示因奖子得螺分系鱼数矩菊阵”茅,单扩击“客继续年”;其余毫选项布使用着默认怪值。丽单击适“确学定”垦。50中央后财经躁大学睛统计堤学院50因子乔分析亮结果绣分析变量专的共缩慧同度窜表。除了翼“外落貌”桃变量涨外其窗他变畅量的斥共同挤度都颈比较筋高。51中央甚财经末大学鲜统计信学院51贡献若率根据粮下表聚,前4个因茶子的修贡献恒率为81护.4菜9%。旋转忘之后例各因套子的狗方差盖贡献偿率可牙能会核发生绑变化衣!52中央樱财经武大学缴统计堂学院52旋转诵前后任的因膀子载担荷矩当阵旋转激后的皆系数寇矩阵肠中在单一行斥中一慰般只菊有一肉个较塘大的斧值。根据后旋转充后的久因子傅载荷甚矩阵晴更容微易解炮释因花子的负含义拾。

因子旋转后1234简历格式.116.830.109-.136外貌.440.151.399.227研究能力.064.128.007.928兴趣爱好.220.245.871-.081自信心.916-.107.163-.065洞察力.863.097.255.002诚信度.219-.242.863.001推销能力.910.223.103-.041工作经验.087.851-.055.211工作魄力.800.349.156-.052志向抱负.918.159.100-.041理解能力.811.255.331.143潜能.747.326.413.224求职渴望度.440.363.534-.524适应力.383.797.076.08453中央腐财经呆大学托统计冒学院53各变就量的撞因子券表达掩式标准侨化的萍简历跌格式电分≈0.专11缎6×第一慰个因百子+0姜.8窃30耍×第二务个因绍子+0诞.1哥09勺×第三加个因柿子-0溜.1路36臂×第四麻个因沉子标准做化的态外貌离分≈0.室44桌0×第一耀个因扁子+0骂.1寺51邪×第二鸦个因拜子+0喘.3邪99稀×第三默个因疑子+0爽.2往27袋×第四再个因促子54中央太财经牢大学孤统计详学院54因子纲含义现的解悲释第一嗽个因会子在杂外恳貌繁自沸信心麦洞察门力徐推销字能力页工绩作魄屈力删志向绍抱负窄理旋解能敬力准潜能澡等民变量爹上有抚较大郑的系潮数,啊可以怕抽象流为应撞聘者布主客抱观工口作能辟力因织子第二鸦个因掩子在呼简迟历格垃式绒工胖作经恶验愚适应杂力变元量上笔有较祝大的吼系数火,可煎抽象梁为应懒聘者除对客还观环债境的跳适应破力因谜子第三唤个因蹈子在朗兴趣据爱好殿诚信苏度右求职覆渴望女度变钻量上累有较婚大的僻系数娇,可案抽象纲为应绕聘者域的兴拳趣和愁诚信衰因子蜘。第四晨个因枯子在继研究乌能力催变量雅上系他数较扛大,企可抽钩象为画

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论