主成分分析和判别分析详解_第1页
主成分分析和判别分析详解_第2页
主成分分析和判别分析详解_第3页
主成分分析和判别分析详解_第4页
主成分分析和判别分析详解_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主成分分析主题描述:中国城镇家庭全年人均食品支出分析。希望通过对原始数据,如粮食支出、 肉类支出等多个变量进行主成分分析,研究城镇家庭食品支出的主成分构成,并用较少维 度的变量综合表征食品支出这一变量。模型描述:Y =&Xi+血X2+" 冏人8其中,因变量Y表示:食品支出总额自变量X包括:Xi粮食支出、X2淀粉及薯类支出、X3干豆类支出、X4油脂类支出、X肉 禽及制品支出、X6蛋类支出、X7水产品支出、X8菜类支出、X9调味品支出、Xi0糖 类支出、Xii烟草类支出、Xi2酒和饮料支出、Xi3干鲜瓜果类支出、Xi4糕点类支出、 Xi5奶及奶制品支出、Xi6其他支出、Xi7在外

2、用餐支出、Xi8食品加工服务费支出共 18项指标。数据来源:2007/2008/2009中国数据统计年鉴30个城市自治区居民家庭平均每人全 年消费性支出共93组数据(数据见附录)结果展示及分析: 操作过程:导入数据后,选择“分析” 一“降维”一“因子分析”,在弹出的对话框中:数据选择除“年份”“城市”、“食品支出”以外的所有变量,“描述”、“抽取”、“得分”选项分别按如下图中设置,其余选项保持默认设置14 3?00SO 的DDia 23VO34 59DQ43 1OT041 27002T BW0'24 S500冷 24 DQ21 390021 530026 490015 MD020 D9

3、0024 B1D01t 03DO17 4300.I抽由3 II和匚卜 帚P-禎針1甲;*片協折時* 丁也 FF&OOi 617 6830 1 咯血0167 0110 324. 8700 2d 0200y trt(c>當is耿皿用苦旦*便 再生囲 -fTWr£KD>用斟第凶KkKfq Brthit的审制酬啊妙驻|匹15 MOO 53.0000152 92001312.220065220011 EB-DO 30.100024600536.590052 250013 26D032,8200127734 OKJO 61 460026J753D 356 990036 340

4、053 510 D 262 8COO 34 130059 2130 31B5GQQ 40 250082 4600E36.590D6 2.250 U615100262.50COt4g yjou强 21UU绑 RIKI127.7BDQ617.6B0D10S £20 D1570900325E7D020 020069'59C方去M B?Cn亠34C32 03:?f昕:24 57C43 BK50 8«2h (X1JCC3J订:3E 97:3& 3QC14J ItiQU3C 1-100(此处勾选了“载荷图”选项,主要是为了后面因子分析中对比因子旋转前后的载荷 变化,在主

5、成分中将暂不做分析。)JCi 53.aOCCJ 152.9Z3C131222G3Gi.22:0SJ.reOC Jd0.99O j53 5107 252 SDD 40 IIIWEBflO 30 140032 4&DC 536 59OD 52 2E:036 jJCO34 1K0二斤*冇宰乏角厂打挣平止旧志:E n 斗"t,二'' r-Trr. I走L'-云力生世;主比勺127 8500?34.090D61/S0DE9.:1d0 J'S.SGCO 40.2£D0成分。32 8200其中,将“抽取”设置为“基于特征值一特征值大于1 ”用以筛选

6、特征根大于1的主L蔚填車消丽11_|140 800052 1500546 9300% 2100仲 1600295 570036 4000一“临厂菽阵电” Tbifwa 子幫 0 L匕石也ifiEl叶filifi*于 Ali1.凶9日伯岂.屋山河艮的因于;»iM0 tG.6400 am aao24 31301S.92D017 030JU JMU-l*+RLi Ji-RJWJ'J -JL. 1 WIFM_J!_ EUUI-R=J 1 UH-FU .7 U W127 7800fi1?6SJQ 10S E.?fl0 157 090032b 8704)2 fl 0200卜 Ji.心Y?

7、4I別30 加J2212& 曲 旳. ".26152 92QQ1312 220血?2W2W F90Djmmdqi3& 3A0C36S2.4G0a5苒月现52却Q3,510a22.90D>331300ie127 500734 OWO61 4甜D阴MOO31S 9SOOifl 25001S 940053 Of 0011 66 DO 30.1400T3 2C.OO 翌 S?O0设置“得分”选项是用以计算将原始数据和主成分都进行标准化后的主成分系数得到的结果如下:栢矣拓曲淀输箱类干丘类油脂类氏拿及f品氷K调趕粮鶯1.00 L3952TS.5234-IQ21 1.55 F

8、.2&6.m1 000J21S.062-10J,352-.116.on.137.379.279.219402290.5224G5.5Je怔.203am32j001.4021 JOO.DOfl.349I 14.0G2472.2494ir-1072906041 000nea5J1?543f6.211.352522,2料0B91.000.315J66林.002.册-0164 el.12541.2151 100491302.557.043J546-b&2.355,4911-UOU育30,52226 S4374R?4722咄.33唧q1 0CO:46370279J200.2 4G4朋.0

9、022S2.522.H61.000,2北0B323210422.Cl閃.H8.545,137.4&2酒加糾.3冊345J?6.211侮,55£.250.35 Z.541.506齐瓢黑类267.301£72.2 as.46Csn一咖714.他2-13.343.593,21彳.535473424"17.491躺働制品5C453S.338.3353DS.403翦3.4565;2.E73其他.035-075o?e131-1?0-136-134-096046F13在外用餐.1CE230J606A 3Q213.617.倍.664.544乳話加工岳各贵-0S4023JO

10、 93.033*.043.150-.54-.024.012-104糠类咽草类脅和恢料干鲜瓜果类糕点猛妍颇制品其他在外用輟食品办野服务.379296.356.207.21 3.504.035195-094279.063.345.391.343.536-.072.23023.200.232.276.572,593.U2B.505.093249104.211.236.214.335.031.1390334日&212.155.294.283.309-.120.447-43.002.064.654.450.535.403-.136,213.120.282.146.250.529.473.293-

11、.134.617讪.522545.357.429.424.458-.085.495-2J.446.137.541714J17.622-U46.564-0121.LIOO492.506.490.431.E7B.01 S.544-.I0J.4921.000.4D8J61.407.078.392m 了.5064081.000.030JB3一了 93.154,449-.003.490J 47.6301.000.S64.567.163740.78491.161.663.8641.000.083798-.160678407793.567.6261.000.1 oe.473-064.018.078.154.

12、163.083.1061.000.164-061.54444fl.746.796.473.1641.000-.104037-.003-.076-.130-.CS4-.064-.2041 000这是相关系数矩阵,表明各个变量之间的相关性。如果数据在此矩阵中表现出来的相 关性较强则可进行主成分分析,否则表明数据不需要做主成分分析。从表中数据看:大多 数变量间的相关性中等偏高,个别变量如糕点类与干鲜瓜果类之间的相关性较强说明所选初始变量存在信息上的重叠,可以尝试进行主成分分析。鯛释的总方差祇站初始特征倡提取平方和载入合计方希累翟%合计方差的%累租17.11139.503395037.11139503

13、39.50322.02111.225507282.02111,22550.72839.050537791.629905059.77941.5TB8.764605421.578670460.54251.0886.04474.5861.0886.0474.58661.065.97930.5S51.0765.9?90055577594,27434839e.7113.9£188790g.556lose9'1.888w.2672.D3993 926ii.2941.5349556012.2211.2279678713.172.95497741U.13574990.49015.100.55

14、699 04616.091.50499.54917.05299.83718.029.163100 000提取方法:主成饴分析。本表表明所提取主成分的信息。初始特征值表征的是引入该主成分对原始变量信息的平均解释力度,当主成分的原始 特征根大于1时,表明引入该主成分是有意义的,否则说明引入该主成分对原始变量的解 释力度不如引入一个原始变量的解释力度大。从表中可以看出,前六个主成分的“初始特 征值均”大于1,被选入作为主成分。“方差的”即“方差贡献率”是用每个主成分的方差除以所有主成分方差的总和,即某 一主成分的方差在全部方差中的比重,表明某一主成分综合原始变量信息的能力,因此这 个百分数越高表明能

15、力越强。本模型中,前六个主成分的方差贡献率依次递减,最低为 左右,说明了所提取得每一主成分反映原始信息的能力。“累计”既“累计方差贡献率”是前 N个主成分的贡献率的和。本模型中前六个主成分 的累积贡献率达到80.565%。笔者认为这是可以接受的,虽然按照通常的主成分分析一般 前三个主成分的累积贡献率会达到 85%以上,但是由于原始变量维度较大(18维),且变量的数据均是原始为修正数据,因此对于模型能够反映80%以上原始数据信息这一结果是被接受的。12345e觥.283.412-.219223淀粉及曹类,419-501.397.152,376047.656.003.026-430.259027油

16、脂类.519485.4 40-.164.052*.3S4肉潼及制品"日.593.093-.038.102蛋类.552-3Q2.409-.454060水合品.571.208-.490-318-.117,isa業类.762,551.0S7-.041.089,055调味品J85-167.100-198-.033-138.127-.1 28阳&-.120,160咽草羹.437-.015522.343.411酒和钦料.727-352.1 31253.114.064干辭瓜果类.625-.31 9.213j45032-065糕臣类.834-363-.241-.151-01 6-.043幼浚

17、奶制品.79B-199.1 79.3B7-.092.04SX57-206一1 60.334.591*632在外用餐.76S-075-.507003.067.043京晶加工恁勢雳-.086-007465-176.533.434提取方法:主成伪七乳已提取了 E个成份成分矩阵显示每个原始变量在主成分中的系数。虽然从这个表中也能看出个主成分的 载荷,但是此表中的主成分是未经标准化的,因此选择使用得分系数矩阵中的载荷来分析 各主成分在变量上的载荷。咸饴123459077143J53177-J01-.207口別-.248J44.096-.45.OH干立类.92.005.010-.27323B.025.07

18、3240.270-10+048-,3B6肉磁制品.081.343-.057-058-093-.018蛋类.078-150.250-28S.055.064水赳6080103-.301-202-108A 77苧娄.107.273.053-026082.052调味品.110083.062-12&-030-J 28齬类.005063079.315-110J 43.061.113-.009.331.315.382酒和怏料.102-.174.080160105.070干稣瓜果类.115-156-.131-.092.029-.079.117175-J4S-102-0d5-.040.110-096.1

19、09.232-065.043其他.008102-.110212.543-.587在外用餐.103-037-.311.002061.040倉品加工服务费-.012-.004.236-.11149Q.403从这个表看出主成分变量经标准化后在原始变量上的载荷,首先可据此写出主成分的 表达式:Fi= O.O77X+O.O59X2+O.O92X3+O.O73X4+O.O81X5+O.O78X6+O.O8OX7+O.1O7Xb+O.11OX9+O.O95Xo+O, 061Xi 什0.102X2+0.116X3+0.117X4+0.110X5+0.008X6+0.108X7-0.012X18F2= 0.14

20、3X-0.248X2+0.005X3+0.240X4+0.343X5-0.150X6-0.103X7+0.273X8-0.083沟+0.063为o+O.113X1-O.174X12-O.158X13-O.175Xm-O.O96X15-O.1O2X16-O.O37X17-O.OO4X8F6= -0.207X1-0.044X2+0.025X3-0.366X4-0.048X3+0.064+0.177+0.052X8-0.128X9+0.149为o+O.382X 计0.078为2-0.079X13-0.040X14+0.043X5-0.587X16-0.040X17+0.403X8其次,根据系数,由于

21、主成分F1在各变量上的载荷较为均衡,可以看成变量“调味 品”、“干鲜瓜果”、“糕点”以及“奶类及奶制品”的综合反映指标;而F2可以看成 反映“淀粉及薯类”、“肉禽及制品”“菜类” 3个变量的综合指标;F3可作为“水产 品”、“油脂”、“在外用餐”、“食品加工费”的综合反映指标; F4可作为“干豆”、“蛋类”、“糖类”、“烟草类”的综合反映指标;F5和F6在变量“其他”和“食品加工服务费”上的载荷均属于各自载荷中较大的,都反映了这两个变量的信息。就这一点, 一方面有可能目前所建立的主成分模型还不够完善,另一方面由于“其他”这一变量所包 含的内容不甚明确,如果能够对其他中所包含的信息内容再进一步明

22、确,或许F5和F6在这几个变量上的载荷便会发生变化,使得其表征方向更加明显。但是由于主成分分析主要 是对变量维数进行压缩,并尽可能的去解释每一主成分所表征的意义,所以主要目的已经 达到,至于对此进行改进将在最终结论部分进行讨论。基于以上信息,可以主成分Fl作为表征居民对副食的需求,以 Fi表征居民在主食上的需求,以 F3表征对高级食物的需求, 以F4表征某些特定食物的需求,F5或F6表征其他方面的饮食需求。朗3得分Ifr方差拒阵1154561i.aoo.000.oco.aoo000£002.aoo1 000,000.OU000.0003JOO.0001.000.000000.0004

23、BOD.000.000i.aoa000.ODD5.aoo.000.000.aoa1 000,0006.ODD.coo.000.0000001.000最后的这个表示表明三个主成分协方差的表,由于协方差阵时单位阵,所以看出所提 取的三个主成分是相互正交的,符合主成分分析的要求。模型实际意义:应用所得到的主成分模型,可以对某一实际的测量值进行分析。如:07年安徽省按照表中变量顺序的实际值如下:3091.2800243.780017.250040.800092.1500548.930096.2100143.1600295.570038.400029.6100235.2100253.0500204.67

24、0057.1700175.090062.2600557.5800.4000首先将数据进行标准化,然后将标准化的数据带 F1-F6 的表达式中,便可得到安徽省各项 主成分的得分,从而得到 07 年安徽省居民的食品支出 6 维描述;若再将其与其他城市的 得分进行对比便可分析出两地居民在食品支出上的偏好、食品消费水平等。结论及不足:通过应用主成分分析,原模型所选择的 18维数据被压缩成 6 维,大大简化了数据的 结构,也使得对数据的分析更加直观简易。通过主成分分析,中国城镇家庭人均食品支出 可以用六个方面的主成分来表征,这更易于我们对数据进行各种分析。同时这也是我想到 了在多元线性回归分析中的多重共

25、线性这一问题,通过主成分可以将原变量降维,而且变 量通过线性组合之后得到的各主成分是相互独立的,因此想到主成分是否也可以作为处理 多重共线性的一种方法。而通过阅读相关数据,也恰印证了这一点,在SPS蹴计分析高级教程 (张文彤,高等教育出版社)一书中便介绍了主成分回归这一方法,即用主 成分代替原来的共线变量应用最小二乘法进行回归分析。但是,主成分估计不是无偏估计。本模型中,还有一些有待进一步完善的地方,主要集中F5和F6究竟反映哪些变量信息这一问题上,另外主成分的实际意义也需要进一步完善。结合一些文献和书籍上所提供 的说法,个人认为,主成分更多时候是作为一种过程方法,较少独立使用分析问题,因此

26、主要是利用它降低维度的能力,至于主成分所表征的实际意义可以不必太过计较,因为某 些数据的内容本身也具有一定的模糊性。而在这一问题上,因子分析的优势便显现出来了, 因为在因子分析中可对初始因子进行旋转,使得其表征信息更加明了。有关主成分分析与 因子分析的异同将在因子分析后面进行讨论。4L UU61? 5 WO1C5F7C0157 QSWO870Q30C'IOCX. KJ5J因子分析主题描述:城镇居民食品支出均衡分析。通过对原始变量进行因子分析,希望得到的因 子能够反映居民饮食的均衡程度,并应用此模型计算现实城市居民的饮食均衡得分。数据来源:2007/2008/2009中国数据统计年鉴30

27、个城市自治区居民家庭平均每人全 年消费性支出共93组数据结果及分析:数据选择除“年份”、“城市”、“食品支出”以外的所有变量,各个选项如下图中设置:操作过程:导入数据后,选择“分析” 一“降维”一“因子分析”,在弹出的对话框中:53 0000加 u wwiuu1312 220065 220035 340034 13 DO30 1400S3G 弭加2&C 0263 7900 358990053 510t 2C2SCOO?Q Q?001.52 9200也理匚;.冋帀耐V豆曲甘折希牛q/爭斯iq总便生迥.灵醫性水丰遢)|_佇到it©B隹眩费昨yParfiFi-B1 甘旳:屈柚噓(&

28、#171;:迪単世1_40 800030030 140082.4600536 590052 250053.5100262 800034 130032 8200127 8500734 090061 460059 2100318 5600 40 250092 1500548 9300 96 2100143.1600 295 57G0 38 400029 610019 680030.250054 210059690054 870030 620029 340032.030021 85002G41O024 570043.890050 8500503000?6 640036.670036 000038 9

29、7007400200 192 840061.46004 OOOO巾95-60.62001 OOOO139 5800107 110093.6900742 5800511 29001 6200100118 3(X1095.2700593 27001.810021 3900re.&ioo匸- I anT4 3700I?7 780冲5429-ih-v . ji-ruw亠 jrj rMj>. ju -&13 6£J0 106 S- -30157 iJQO. 32b 8711020-二 _ -T6 2TOOM.59Q0J;1 2721 990029 24 0021 5300

30、26 49002c»ia1S.330017 4,300門&焉MJ3& 34WB246002H2 50COTS34D0 £ Q:00152 32015 苒占的 Q S2JE00 53.510a1312 2200 氐?QD2«3 F3Q0J2so2611. WW 3V-W0.130013 %D0 翌 200127 鈣如ns SGI。40 25M734- 030 614BOO 2100Vi IUL I 昭(Hb-173.373laj.aoa3f 4=3ae i?dn.34d1 oooo56 7別5: 5 JOO 107. HOC S3.69O05'

31、;1.29DC'.62JC.074.074输出结果及相关分析:首先是KMO检验和Bartlett检验检验结果:KMO和Bartlett舒枪验取梯足辗虞的KaiEer-Meyer-Olkiri度星=1372.50516300Bartlett的瑚缱检醞近f炸方dfSig.074KMO检验的原理是假设变量间的偏相关性很小,当检验结果在0.5以下时,可以接受原假设,说明原始数据不适合因子假设;否则就拒绝原假设,认为变量间偏相关性较强。 本模型的检验结果是0.674说明原始数据具有重叠性,可以进行因子分析。Bartlett检验假设相关矩阵为单位矩阵,即检验原始变量是否相互独立。从检验结果 看,可

32、以拒绝原假设,判断原始变量间具有较强的相关性。以上检验结果说明本模型的原始变量适合进行因子分析。公因子方差初蛤提疑I1.000.731淀粉歷若类1.1000,750干HK1.000.684油脂类1.000肉葩段制品1.DOO.S44蛋类1.000.777水产品1.0007001.000.906调味品1.000714糖类1.000.776烟草类1.000牺和饮料1.000.753干鲜HI果粪1.000.856犠点类1.1000.307期浚奶制品1.000.B31其他1.000.938在外用辍1.DOO.880直品加工服务费1.000.727提取方迭:主亦饴分祈。“公因子方差”表明每个原始数据项被

33、所提取得主成分提取信息的程度,也称变量共同度。从表中看出,每项观测指标被提取信息量都在75%左右或以上,表明原始变量的大部分信息在因子分析中被提取出来了。碎石图是用来直观观察各个因子的重要程度的。横轴表示成分,纵轴用特征值大小表 征其重要程度。从图中看出,第一公因子的重要性最大,处于峰上,接着第二三四五六变 量随其后处在“陡坡”上,也是较为重要的因子;而其余因子的特征值在(0,2)区间内处于更接近0的一侧,处于曲线的“平缓地带”,重要程度明显低于前六个因子,因 此提取前六个因子。解轉的益方差成份初抬特征值提取年方和载入旌捋平方和载入舍计方差的廉累稅站合计方差的站累轉为舍计方差的站累穆17111

34、39.50339,5037.1113S.5C339.5034.34824 15424.15422,02111.22550.7262.02111.22550.7262.B441579739.95231 5299.050537791.62A6.05059.7792.64414 5S054.641415788.76469.5421.570E76468.542217612.03166.73351 oes6.04474.5361JS86.04474.5861.2987.21273.94501.0765.S7380.5651.0765 97980.5651.1326.62080.56517694 2746

35、4.6390.7113.95183790g.5503.098ai.68S10.3E72.03393.920112S41 63495.5 B012.2211.2279673713.172.95497.74114.135,7499849015.100.55699.04616.091,50499.54917.052.28099.63713J29.163100.000提取方圭:主成份分析。从解释总方差表中看出提取了六个公因子。并且为了提高所提取的因子在各个变量上 载荷的突出性,用最大方差法进行了公因子的旋转,表中列出了旋转后的因子贡献率和累 计贡献率,可以看出,虽然各个因子的贡献有变化,但其总和依旧是

36、80.565%,而且前六个因子的特征值依旧大于1,和旋转前完全相同,因此依旧选择前六个因子。成分冈1 0-0 5-r& 分06205-10-L:或分1肉第/4糾拓 加英丁类 O水产品旳怙O ° 劝會P2?w*° 任外用餐 *打*絃处器,心久此松o O槿点夬o)RftlW:HTWfX«(4粉荧70贤桜空何中的成分图<1.0-0.5-0.0-A&toxiRI«4S昭ft干豆炎“旳°生外川就“ PNAKJU厘点夬-0.5-通过对比成分图和旋转空间后的成分图,可以看出进行因子旋转后,因子在各变量上 的载荷发生了变化,对比初始的模型

37、,因子对某些变量的反映集中了,而对其余变量的反 应减弱了,也就是说某一因子更集中反应某几个变量了,而由其他的因子来表征另外的变 量。例如:经旋转后,第二因子对“糕点类”的反映程度弱了,第一因子更加独立地反映 了此变量信息;初始时,第一因子和第四因子都反映糖类的信息,经旋转后,第四因子独 立反映糖类变量信息从图中各点的总体分布中也不难发现因子旋转可以明显改善因子 和变量的相对位置,使得因子的实际意义更佳显著。成份拒卩铲咸份12345G.B34-.353-.241-161干鲜瓜果类825-.319-.213-.145妍踐妍制品706*.193.170.367调味品.785-.167,100<

38、19S<138在外用鑿7G9-.507菜类.762.551727-352.131.253.114糠类676.127-.120.498-.120160干豆类65C-.430.259水产品.571.209-.490.31 e-.117190蛋类.552-.302.403-,45454S269.412-.519-773油脂类.519.485.440-104-.394肉倉庚制品.5765S3-102淀粉殛蓉塑.419-.501.3S7152-376烟草类437.229.522.343.411宦品加工龍务赏.465*.176.533434其他-.20016034.591”加2瞳转礴阳拒阵12345

39、.849.394.117干窮呱果类.313.105茁411Q140在夕卜用軽.S12.2S0-.202水产品.735.174-.193.175-.157-306干耳类.675329.337调味品.621.347.449讪脂类.110.906.126.1 21110肉墨加制品.333.741*.199.276-.161-203菓类.410741.406.100-116G80.490.241-.1 30淀韵及蓉类.853-.1 H奶簸奶制品.331.239.656.471酒知钦斜.453.59S.401.1 24,ise蛋粪.471.213.491-.220.450烟草类129.S57.20027

40、7.240.297.701-.252食品抑工脳务黄 其她-123.636.960壬響期se r标淮化的正交旅转法&这是因子的成分矩阵,通过这两个表的对比,也可以更具体地观察因子旋转的效果。 为了消除量纲的影响,现参考“成分得分系数矩阵”分析因子旋转后各因子在变量上的载 荷的变化。123456糕直-210.306.209.003-.1 53.022-.107056447-.061vD89-109干吕类209.056-.103-.100.264.044油脂类-.391.451肉羞及制品026-.1 77.036-.119-J 20蛋类1Q5,162-.212,3

41、03-.000水产品,20r-.051-.200.021-097-252棄类.015.皿-.125.118.091r05S调味品114.078113-ua.007.045-.055055.071.326-160-.075帼草类-077-.087-.094530.2 4?21丹和饮料.011£94.187150.1 04103干鲜瓜果獎221-0T4.041-.071-041.091235-.103.054*070*.059036奶及奶制品v070£08.247169-.043.011挝他026.058-.113-.019-.014.831在外用覲.243-.113-.124

42、.115-.107.044負品 如工®务费-.025059-.070.167.073-.2C車薪期二标淮化的正交诜拷速°从这个表中分析,第一个因子在“水产品”、“干鲜瓜果类”、“糕点类”、“在外 用餐” 5个变量上的载荷较大,可以认为是通过“副食喜好”反映居民食品支出情况,命 名为副食因子;第二个因子主要在“油脂类”、“粮食”、“肉禽及制品”、“菜类”4个变量上载荷较为突出,反映为居民在家中做饭的多寡,即通过“劳动喜好”反映食品支出情况,可 定义为劳动因子;第三个因子主要通过“淀粉及薯类”、“奶及奶制品”反映食品支出情况,认为这是 通过“营养目标”来反映居民食品支出情况,命

43、名为营养因子。第四个因子在“糖类”、“烟草类”上载荷较大,通过“个人嗜好”反映食品支出情 况,定义为特殊嗜好因子;第五个因子在“食品加工服务费”上载荷最大,且与其他载荷相差较大,在这里食品 加工服务费主要理解为在餐馆吃饭时所留下的小费,因此这个因子通过“给小费习惯”反 映食品支出情况;第六个因子主要通过“其他”反映食品支出情况。至此,也得到了旋转后的因子分析模型,各因子在变量上的载荷可表示为:F1= -0.21X1-0.107X2+0.209X3-0.091X4+0.026X5+0.105X6+0.267X7+0.015X8+0.114X9-0.059X10-0.077X11+0.011X12

44、+0.221X13+0.235X14-0.070X15+0.025X16+0.243X17-0.025X18F2= 0.306X1-0.058X2+0.055X3+0.451X4+0.283X5+0.031X6-0.051X7+0.239X8+0.078X9-0.025X10+0.087X11-0.094X12-0.074X13-0.103X14-0.008X15-0.056X16-0.119X17-0.059X18F6= 0.022X1-0.169X2+0.044X3-0.168X4-0.120X5-0.080X6-0.120X7-0.080X8-0.252X9 -0.059X10 +0.045X11+0.075X12-0.021X13+0.103X14+0.091X15+0.039X16+0.044X17-0.020X18模型应用:由于前面执行了将因子保存为变量的操作,通过再次查看数据表中所保存的Fac_1等数据可以计算出每一地区在某一年的食品支出均衡得分,即因子贡献率向量与因子

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论