




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
问题:影响因素很多,采用什么方法将多指标化为几个综合指标来分析其影响因素?问题提出食品衣着设备医疗交通教育居住杂项北京4934.051512.88981.131294.072328.512383.961246.19649.66天津4249.311024.15760.561163.981309.941639.831417.45463.64河北2789.85975.94546.75833.511010.51895.06917.19266.16山西2600.371064.61477.74640.221027.991054.05991.77245.07内蒙古2824.891396.86561.71719.131123.821245.09941.79468.17辽宁3560.211017.65439.28879.081033.361052.941047.04400.16吉林2842.681127.09407.35854.8873.88997.751062.46394.29黑龙江2633.181021.45355.67729.55746.03938.21784.51310.67………………………第8章主成份分析8.1主成份分析直观解释8.2主成份分析性质8.3主成份分析步骤8.4注意事项8.1主成份分析直观解释基本思想:通过降维技术把多个变量化为几个少数主成分的方法,即将原来众多具有一定相关性的指标,重新组合成一组新的相互无关的综合指标。3、单独提取变量y1而放弃变量y2,丧失的信息也是很微小的。1、x1和x2都包含较多信息,单独选择x1或者x2都会丧失较多的原始信息。2、对x1和x2做正交(垂直)旋转,得到新的坐标轴y1和y2。旋转后数据主要是沿y1方向散布,在y2方向的离散程度很低,且相互垂直不相关。旋转公式:第一主成份第二主成份8.2主成份分析性质结论:1、uij为第i个成分yi和第j个原先的变量xj之间的线性系数。2、y1,y2,…,yp分别叫做第1主成分,第2主成分,…,第p主成分,y1得到最大解释变异能力,y2是能对原始资料中尚未被y1解释的变异部分拥有最大解释能力。3、选择m个yi(i=1,2,…,m,m≦p),希望m愈小愈好,但解释能力却能达到约80%以上。1、表示形式2、主成份推导基本形式:其中:给定条件下,方差最大,拉格朗日乘数:条件:a1Ta1=1第1主成份偏导:有:有解充要条件:结论:λ是x协方差阵特征根,λ大则Var(y)大,即λ应取协方差阵最大的特征根λ1,a1即为特征根对应的特征向量或因子载荷。第二主成份等依然按次方法完成。解例1
2、主成份个数、方差贡献确定结论:该式子表示yi的方差λ在全部方差中所占的比重,比重越大,表明yi这个变量综合xi的能力就越强,故可以将该比值作为成分方差贡献率。当累计贡献率超过80%即可。对应的a即为方程系数或因子载荷(主成份yi与变量xi的相关系数)。8.3主成份分析步骤标准化原始数据求标准化数据相关矩阵及其特征根和特征向量求方差贡献率和累计方差贡献率,并以大于等于80%累计贡献率确定主成份用原指标线性组合计算主成份得分计算综合得分,并进行得分排序:1、分析步骤问题:使用31个省、市、自治区调查资料对区域消费水平做分析评价,并并根据主成分得分和综合得分对人均消费水平进行综合分析。食品衣着设备医疗交通教育居住杂项北京4934.051512.88981.131294.072328.512383.961246.19649.66天津4249.311024.15760.561163.981309.941639.831417.45463.64河北2789.85975.94546.75833.511010.51895.06917.19266.16山西2600.371064.61477.74640.221027.991054.05991.77245.07内蒙古2824.891396.86561.71719.131123.821245.09941.79468.17辽宁3560.211017.65439.28879.081033.361052.941047.04400.16吉林2842.681127.09407.35854.8873.88997.751062.46394.29黑龙江2633.181021.45355.67729.55746.03938.21784.51310.672.实例分析(1)计算相关系数X=read.table("clipboard",header=T)Y=scale(X)#标准化cor(Y)#计算相关系数食品衣着设备医疗交通教育居住杂项食品10.2570.72530.38540.8990.82850.71450.7219衣着0.25710.45380.57650.35750.5420.40450.6278设备0.72530.453810.58310.78230.89250.77440.7221医疗0.38540.57650.583110.46660.62910.69110.6254交通0.8990.35750.78230.466610.87950.78540.7518教育0.82850.5420.89250.62910.879510.81330.8435居住0.71450.40450.77440.69110.78540.813310.7183杂项0.72190.62780.72210.62540.75180.84350.71831(2)计算特征根和贡献率summary(PCA)screeplot(PCA,type="lines")PCA=princomp(x,cor=T)成分重要性Comp.1Comp.2Comp.3Comp.4Comp.5Comp.6Comp.7Comp.8标准误差2.38771.01420.71010.52230.43140.40160.29550.2415方差比率0.71260.12860.06300.03410.02320.02010.01090.0072累计贡献率0.71260.84120.90420.93840.96160.98170.99271结论:前两个主成份累计贡献率为0.8412>0.8,选择第1和第2个两个主成份(3)主成份载荷PCA$loadings#主成分载荷结论:,主成分C1在、X3(家庭设备及服务)、X5(人均交通和通讯支出)、X6(娱乐教育文化支出)、X7(人均居住支出)、X8(人均杂项商品和服务支出)上的载荷值都很大,可视为非必需消费品主成分;C2在X1(人均食品支出)、X2(人均衣着商品支出)、X4(人均医疗支出)上有较大的载荷,可视为反映日常必需消费的主成分Comp.1Comp.2Comp.3Comp.4Comp.5Comp.6Comp.7Comp.8食品-0.3530.4290.1750.299-0.3770.651衣着-0.249-0.6770.521-0.399-0.1290.134设备-0.374-0.7890.2610.1160.372医疗-0.302-0.472-0.6280.2250.249-0.416交通-0.3760.3240.1230.127-0.281-0.267-0.6950.298教育-0.404-0.20.132-0.156-0.857居住-0.371-0.442-0.5840.5350.166杂项-0.374-0.1180.2820.4090.5220.5460.141(4)主成份得分PCA$scores#主成分得分Comp.1Comp.2Comp.3Comp.4Comp.5Comp.6Comp.7Comp.8北京-6.1223-1.5225-0.0007-0.16660.8082-0.61710.03100.1977天津-3.0101-0.5368-1.98360.24020.22580.29550.69030.0012河北0.8875-0.6923-1.0079-0.1833-0.0715-0.2507-0.23040.3306山西1.1038-0.6014-0.3727-0.2830-0.83310.1858-0.3391-0.2002内蒙古-0.5334-1.84770.90520.0215-0.11600.5854-0.27680.1299辽宁-0.0944-0.6552-0.73281.08400.02240.12280.23870.0388吉林0.3271-1.4247-0.61180.8757-0.27560.5079-0.0646-0.0578黑龙江1.6886-0.9959-0.20850.58630.0814-0.0745-0.2912-0.2549上海-7.08471.06931.29850.47820.37120.3345-0.05760.0469江苏-1.14130.4537-0.0912-0.56520.29630.05440.2224-0.4352浙江-3.8211-0.17210.89170.3821-0.7426-0.8234-0.2274-0.4362安徽1.12340.35180.09060.14030.08710.09200.1494-0.4004福建-1.17171.3776-0.0040-0.0711-0.77250.75090.3961-0.0602江西1.66940.54850.6641-0.74110.32710.31060.28210.0892山东-0.4811-0.80850.1015-0.6657-0.62660.0462-0.07230.3355河南1.2772-0.64790.0901-0.45360.07950.0840-0.16620.2057(5)主成份排名library(mvstats)princomp.rank(PCA,m=2)#主成分排名Comp.1Comp.2PCRank北京-6.1223-1.5225-5.419222天津-3.01011-0.5368-2.632055河北0.8875-0.69230.6460214山西1.10375-0.60140.8431216内蒙古-0.53335-1.8477-0.734258辽宁-0.09438-0.6552-0.1800911吉林0.32707-1.42470.0593112黑龙江1.68861-0.99591.2782824上海-7.084671.0693-5.838321江苏-1.141310.4537-0.897516浙江-3.82111-0.1721-3.263353PC=(5.70*Comp.1+1.03*Comp.2)/(5.70+1.03)8.4主成份分析注意事项1.主成分分析,可使用样本协方差阵或相关系数矩阵为出发点来进行分析。但大都以相关系数矩阵为主。2.为使方差达到最大,通常主成分分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 怎样做智慧教育
- 任长友培训课件
- 立式油罐知识培训课件
- 大班礼仪培训
- 幼儿园班本课程建设培训
- 假发染色知识培训课件
- 催款与回款管理制度
- 住院病人饮食护理
- 艺考招生培训
- 古诗所见课件第一
- GB/T 5683-2024铬铁
- 提高静脉血栓栓塞症规范预防率-医务科-2023.12.7
- 2022年版初中物理课程标准解读-课件
- 2024年建筑业10项新技术
- 术后病人烫伤不良事件PDCA循环分析课件
- 配电设备运行、维护、巡回检查制度范本
- 2024年上海外服招聘笔试参考题库附带答案详解
- 工业安全教学课件
- 骨科手术后的康复辅助器具和辅助装置
- 新员工企业文化培训
- 2024年江西吉安市城投公司招聘笔试参考题库含答案解析
评论
0/150
提交评论