




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主成分分析principalcomponentanalysis主成分的定义---综合目的的寻求首先,将各变量规范化。对规范化变换后的变量xi,按以下步骤寻求一个又一个综合目的:(1)寻求综合目的C1:C1=a11x1+a12x2+…+a1pxp,且使Var(C1)最大,那么称C1为第一主成分;〔2〕寻求综合目的C2:C2=a21x1+a22x2+…+a2pxp,(a21,a22,…,a2p)垂直于(a11,a12,…,a1p),且使Var(C2)最大。按以上原那么继续寻求综合目的。主成分的性质主成分间互不相关:Corr(Ci,Cj)=0组合系数(ai1,ai2,…,aip)构成的向量为单位向量:各主成分的方差是依次递减的:Var(C1)≥Var(C2)≥…≥Var(Cp)总方差不增不减:Var(C1)+Var(C2)+…+Var(Cp)=Var(x1)+Var(x2)+…+Var(xp)=p主成分是原变量的线性组合,是对原变量信息的一种改组,主成分不添加总信息量,也不减少总信息量。计算X1,X2,…,Xp的相关矩阵R;求矩阵R的全部特征值,由大到小依次记为1,2,…i…,p;求相应于特征值i的特征向量(ai1,ai2,…,aip)。主成分分析的实践计算步骤第i主成分的方差PROCPRINCOMP过程PROCPRINCOMP<options>;1〕OUT=SAS-data-set〔SAS数据集〕---规定一个包含原始数据以及主成分的输出数据集。2〕OUTSTAT=SAS-data-set〔SAS数据集〕---生成一个包含均值,规范差,观测个数,相关阵或协差阵,特征值和特征向量的输出SAS数据集。3〕N=number〔个数〕---规定被计算的主分量个数。的值必需是大于等于零的整数。4〕PREFIX=name〔名字〕---规定主分量名字的前缀。缺省时的名字为PRIN1,PRIN2,PRINn。假设PREFIX=C,那么主分量名字为C1,C2,C3等。两两之间具有不同程度的相关性dataaa;inputidx1x2x3x4x5x6;cards;1 173.28 93.62 60.10 86.72 38.97 27.512 172.09 92.83 60.38 87.39 38.62 27.823 171.46 92.78 59.74 85.59 38.83 27.464 170.08 92.25 58.04 85.92 38.33 27.295 170.61 92.36 59.67 87.46 38.38 27.146 171.69 92.85 59.44 87.45 38.19 27.107 171.46 92.93 58.70 87.06 38.58 27.368 171.60 93.28 59.75 88.03 38.68 27.229 171.60 92.26 60.50 87.63 38.79 26.6310 171.16 92.62 58.72 87.11 38.19 27.1811 170.04 92.17 56.95 88.08 38.24 27.6512 170.27 91.94 56.00 84.52 37.16 26.8113 170.61 92.50 57.34 85.61 38.52 27.3614 171.39 92.44 58.92 85.37 38.83 26.4715 171.83 92.79 56.85 85.35 38.58 27.0316 171.36 92.53 58.39 87.09 38.23 27.0417 171.24 92.61 57.69 83.98 39.04 27.0718 170.49 92.03 57.56 87.18 38.54 27.5719 169.43 91.67 57.22 83.87 38.41 26.6020 168.57 91.40 55.96 83.02 38.74 26.9721 170.43 92.38 57.87 84.87 38.78 27.3722 169.88 91.89 56.87 86.34 38.37 27.1923 167.94 90.91 55.97 86.77 38.17 27.1624 168.82 91.30 56.07 85.87 37.61 26.6725 168.02 91.26 55.28 85.63 39.66 28.0726 167.87 90.96 55.79 84.92 38.20 26.5327 168.15 91.50 54.56 84.81 38.44 27.3828 168.99 91.52 55.11 86.23 38.30 27.14;procprincomp;varx1-x6;run;procprincompout=bbprefix=C;varx1-x6;run;某小学10名男学生六个工程的智力丈量计分表受试者常识算术了解填图积木译码合计编号X1X2X3X4X5X6114132814223913021014151434351223111219132439118477792023735131224122638125619142216233713172016262138691908910149314611999815131446105109912102346109作业要求:计算相关矩阵、特征值并写出各主成分的表达式。例18-3陈峰(1991)报告了主成分回归的一个实例。有22例胎儿受精龄(Y,周)与胎儿外形丈量目的:身长(X1,cm),头围(X2,cm),体重(X3,g)的数据如表25.5所示(引自中国卫生统计,1991,8(1))。试求由X1,X2,X3推算Y的回归方程。dataaa;inputnox1x2x3y;cards;1 13.0 9.2 50.0 13.02 18.7 13.2 102.0 14.03 21.0 14.8 150.0 15.04 19.0 13.3 110.0 16.05 22.8 16.0 200.0 17.06 26.0 18.2 330.0 18.07 28.0 19.7 450.0 19.08 31.4 22.5 450.0 20.09 30.3 21.4 550.0 21.010 29.2 20.5 640.0 22.011 36.2 25.2 800.0 23.012 37.0 26.1 1090.0 24.013 37.9 27.2 1140.0 25.014 41.6 30.0 1500.0 26.015 38.2 27.1 1180.0 27.016 39.4 27.4 1320.0 28.017 39.2 27.6 1400.0 29.018 42.0 29.4 1600.0 30.019 43.0 30.0 1600.0 31.020 41.1 27.2 1400.0 33.021 43.0 31.0 2050.0 35.022 49.0 34.8 2500.0 36.0;线性回归和线性相关分析procreg;modely=x1-x3;run;proccorr;varx1x2x3;run;主成分回归分析procprincompout=bbprefix=C;varx1-x3;run;procreg;modely=C1-C2;run;C1=a11x1+a12x2+a13x3=0.58057x1+0.58107x2+0.57034x3C2=a21x1+a22x2+a23x3=-0.41852x1-0.38789x2+0.82121x3主成分回归这里C1,C2的累计奉献达99.92%,即我们利用了原资料的99.92%的信息,在丢掉0.08%的信息后,所得方程更符合实践情况。如只取一个主成分与y作回归,亦能得到合理的解释。当取全部主成分与y作回归,所得方程与用原变量与y作回归所得方程一样。作业:2.郑俊池和王国立(1994)发表了一份30名婴幼儿身高X1(cm)、体重X2(kg)、体外表积Y(cm2)的资料,现仅转录其中15例男性婴幼儿的资料如表25.14所示(摘自中国卫生统计,1994,11(3))。PROCPRINCOMPOUT=SAS-data-set〔SAS数据集〕规定一个包含原始数据以及主分量得分的输出数据集。假设用户想创建永久的SAS数据集,他必需规定两级名字。2OUTSTAT=SAS-data-set〔SAS数据集〕生成一个包含均值,规范差,观测个数,相关阵或协差阵,特征值和特征向量的输出SAS数据集COVARIANCE/COV―要求从协差阵出发计算主分量N=number〔个数〕―规定被计算的主分量个数5PREFIX=name〔名字〕――规定主分量名字的前缀。缺省时的名字为PRIN1,PRIN2,PRINn。假设规定PREFIX=ABC,那么主分量名字为ABC1,ABC2,ABC3等等。前缀的字符个数加上数字的位数不能超越8个。6STANDARD/STD―要求在OUT=的数据集里把主分量得分规范化为单位方差。假
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家庭教育指导服务行业2025年市场潜力与竞争格局分析报告
- 2025年营养师基础知识考核试卷:食品营养学综合应用试题
- 五年级上册语文课堂管理计划
- 六年级上册社交安全教育教学计划
- 数学思维训练复习计划
- 小学四年级体育竞赛组织计划
- 文化产业信息化发展战略计划
- 城市公共设施安全生产年度工作计划
- 幼儿园中班教育游戏设计计划
- 地方音乐文化研究与教学计划
- 2024年四川省自然资源投资集团有限责任公司招聘笔试参考题库附带答案详解
- 日式介护培训课件
- 面向多类型数据源的数据仓库构建及ETL关键技术的研究
- 景墙的施工技术方案
- 施工标准化九牌一图
- 单角子宫疾病演示课件
- 义务教育物理课程标准(2022年版)测试题文本版(附答案)
- FSSC22000V6.0体系文件清单
- 贾玲春晚搞笑公司年会小品《真假老师》台词剧本完整版
- 23S519 小型排水构筑物(带书签)
- 第三章扫描电子显微镜【完整版】PPT
评论
0/150
提交评论