多元统计分析课程设计心得_第1页
多元统计分析课程设计心得_第2页
多元统计分析课程设计心得_第3页
多元统计分析课程设计心得_第4页
多元统计分析课程设计心得_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元统计分析》课程设计指导书一、 课程设计的目的掌握用统计软件利用主成分分析的方法对涉及众多变量的某一问题进行分析二、 设计名称:用统计软件利用主成分分析法对涉及进行众多变量的问题进行分析三、 设计要求掌握用统计软件利用主成分分析的方法对涉及进行众多变量的问题进行分析的方法掌握利用SPSS软件求初始变量的协方差阵或相关阵的特征根与相应标准特征向量判断是否存在明显的多重共线性掌握利用SPSS软件求得主成分四、 设计过程1、收集数据2、根据研究问题选取初始分析变量3、求协方差阵或相关阵的特征根与相应标准特征向量4、判断是否存在明显的多重共线性,若存在,则回到第一步5、得到主成分的表达式并确定主成分的个数,选取主成分6、对主成分进行分析得出结果,完成设计报告五、设计细则1.注意对数据的采集,不要过于繁杂,不要过少2.吸取他人的经验,总结自己的教训,有条不紊的进行3.上机前先作好准备,上机时积极改进方法六、说明

为了培养自己的上机操作方法,所以我尽量运用SPSS软件上的检验方法课程设计任务书姓名学号班级课程名称多元统计分析课程性质专业课设计时间2010年6月26日——2009年7月2日设计名称用统计软件利用主成分分析的方法对涉及多个指标的问题进行分析设计要求掌握用统计软件利用主成分分析的方法对涉及进行众多变量的问题进行分析的方法掌握利用SPSS软件求初始变量的协方差阵或相关阵的特征根与相应标准特征向量判断是否存在明显的多重共线性掌握利用SPSS软件求得主成分设计思路与设计过程1、 收集数据2、 根据研究问题选取初始分析变量3、 求协方差阵或相关阵的特征根与相应标准特征向量4、 判断是否存在明显的多重共线性,若存在,则回到第一步5、 得到主成分的表达式并确定主成分的个数,选取主成分6、 对主成分进行分析得出结果,完成设计报告计划与进度第一周:星期一〜星期三:查资料选定课程设计数据材料星期四〜星期五:选中研究方法星期六:1413上机第二周:星期一〜星期五:针对错误改进星期六:1413上机星期天:设计报告任课教师意 见说 明课程设计报告课程:多元统计分析学号:姓名:班级:教师:

设计名称:用统计软件利用主成分分析法对涉及进行众多变量的问题进行分析设计内容:在企业经济效益的评价中,设计的指标往往很多。为了简化系统结构,抓住经济效益评价中的主要问题,我们可由原始数据矩阵出发求主成分。在对我国部分省、市、自治区独立核算的工业企业的经济效益评价中,设计9项指标,原始数据见下表样品数n=28,变量数p=9100元 每千瓦100固定资产原值实现值(%)100元固定资产原值实现利税(%)资金实现利税(%)100元工每吨标准煤实现工业产值(元)时电力100元流动资金实现产值(元)业总产值实现利税(%)100元销售收入实现利税(%)实现工业产值(元)全员劳动生产率(元/人.年)北京(1)119.2930.9829.9225.9715.4821783.4121006296.7天津(2)143.9831.5930.2121.9412.2928524.2920254363.1河北(3)94.817.217.9518.149.3711672.0312607322.2山西(4)65.811.0811.0612.1516.848.821.6510166284.7内蒙(5)54.799.249.5416.866.278941.87564225.4辽宁(6)94.5121.1222.8322.3511.2814162.3613.386311.7吉林(7)黑龙江80.4913.3613.7616.67.1413062.079400274.1(8)75.8615.8216.6720.8610.3712672.269830267上海(9)187.7945.939.7724.4415.0943464.1131246418.6江苏(10)205.9627.6522.5813.427.8132024.6923377407.2浙江(11)207.4633.0625.7815.949.2838114.1922054385.5安徽(12)110.7820.720.1218.696.614682.2312578341.1福建(13)江西122.7622.5219.9318.348.3522002.6312164301.2(14)94.9414.714.1815.496.6916692.2410463274.4山东(15)117.5821.9320.8918.659.118202.817829331.1河南(16)85.9817.317.1820.127.6713061.8911247276.5湖北(17)103.9619.518.4818.779.1618292.7515745308.9湖南(18)104.0321.4721.2820.638.7212721.9813161309广东(19)136.4423.6420.8317.337.8529593.7116259334广西(20)100.7222.0420.921.889.6717322.1312441296.4四川(21)84.7314.3514.1716.937.9613102.3411703242.5贵州(22)59.0514.4814.3524.538.0910681.329710206.7云南(23)73.7221.9122.729.729.3814471.9412517295.8陕西(24)78.0213.1312.5716.839.1917312.0811369220.3甘肃(25)59.6214.0716.2423.5911.349261.1313084246.8青海(26)51.668.328.2616.117.0510551.319246176.49宁夏(27)52.958.258.8215.576.588341.1210406245.4新疆(28)60.2911.2613.1418.688.3910412.910983266

设计目的与要求:掌握用统计软件利用主成分分析的方法对涉及众多变量的某一问题进行分析设计环境或器材、原理与说明:机房spss软件设x=(X,,X)是一个p维随机向量,有二阶矩存在,记p=E(x),E=D(x)。1p考虑它的线性变换:=ax—=ax—aX+aX+11111212—a!x—aX+aX+<22121222•••—ax—aX+aX+Jp p 1p1 2p2••易见… … …Var(Y)—Var(arx)—aEa,Cov(Y,Y)—CovQx,arx)—ijij+aXp1 p+aXp2p(5.1)+aX・pppa'Ea,i—1,,卩 (5-2)ij假如我们希望用Y来代替原来的p个变量X, ,X,这就要求Y尽可能地反映原来p个1 1 ・・・p 1变量的信息,这里“信息”用什么来表达?最经典的方法是用Y的方差来表达。Var(Y)越大,11•••表示Y包含的信息越多。由(5.2)可以看出,对a必须有某种限制,否则可使Var(Y,111常用的限制是a'a—1,i—1, ,p (5.3)ii故我们希望在约束(5.3)下找a,使得Var(Y)—a'Ea达到极大,Y就称为第一主成分。如11111果一个主成分不足以代表原p个变量,可再考虑采用Y2,为了最有效地代表原变量的信息,Y已有的信息就不需要出现在Y中,用数学语言来讲,就是12Cov(Y,Y)—0 (5.4)12于是,求Y就是在约束(5.3)和(5.4)下求a,使Var(Y)达到极大,所求的Y称为第二主成2222分。类似地,我们可以定义第三主成分、第四主成分、…。一般地讲,x的第i个主成分Y—a'xii是指:在约束aa—1,i—1,,piiCov(Y,Y)—Cov(a'x,ax)—0(k<i)ik ik

下求a,使得Var(Y.)=a'Ea达到极大。i令九>1iii>九>0表示刀-D(x)的特征根,t, ,t为相应的单位特征向量。若特征p 1 p根有重根,对应于这个特征根的特征向量组成一个RP的子空间,子空间的维数等于重根的••• •••次数。在子空间中任取一组正交的坐标系,这个坐标系的单位向量就可用来作为它的特征向量。显然,这时特征向量的取法不唯一,有无穷多种取法,在下面的讨论中,我们总假定已选定的某一种取法。设计过程(步骤)或程序代码:1、将原始数据标准化,标准化的数据见下表0.4235231.3384051.5902821.6875562.2396340.4819710.9547461.2603710.0480.9951991.4096491.6314530.6672281.0658731.1887581.8553941.1338441.200-0.14352-0.271-0.10906-0.29487-0.00854-0.57821-0.45763-0.152790.49-0.81499-0.98577-1.08721-1.811432.740046-1.79273-0.84655-0.56349-0.15-1.06992-1.20067-1.303-0.61894-1.14919-0.86449-0.69303-1.00129-1.18-0.150240.1868270.5837370.7710330.694243-0.3171-0.11989-2.27170.308-0.47486-0.71949-0.7039-0.68477-0.82907-0.43245-0.4167-0.69238-0.34-0.58206-0.43218-0.290780.393790.359408-0.47334-0.22224-0.62003-0.462.0095833.0809562.9886561.3001862.0961332.7554331.6711712.9832842.1622.4302940.9494850.548246-1.48989-0.582541.5557832.264781.6592991.9642.4650251.5813351.002539-0.85187-0.041662.1944081.7530481.43671.5880.2264810.1377740.199007-0.15562-1.02776-0.26257-0.25294-0.157670.8180.5038680.3503370.172033-0.24423-0.383850.5050410.156444-0.227320.126-0.14028-0.56298-0.64428-0.9658-0.99465-0.05179-0.24271-0.51352-0.330.3839290.2814290.308322-0.16574-0.107890.1065570.3304330.725830.645-0.34774-0.25932-0.218380.206435-0.63406-0.43245-0.60092-0.38161-0.300.068569-0.00238-0.03382-0.13536-0.085810.1159940.279260.375190.2600.070190.2277050.3636890.335558-0.24771-0.4681-0.50881-0.059580.2620.8206170.4811450.299804-0.49995-0.567831.3009631.2617850.4616730.695-0.006450.2942770.3097410.6520370.1018430.014276-0.35529-0.180720.043-0.37669-0.60386-0.6457-0.60122-0.52735-0.42825-0.14036-0.30489-0.89-0.97128-0.58868-0.620141.322972-0.47952-0.68202-1.18429-0.64022-1.51-0.631610.2790930.5652822.636993-0.00486-0.28459-0.54975-0.167930.033-0.53205-0.74635-0.87284-0.62654-0.074770.013227-0.40646-0.36109-1.27-0.95809-0.63656-0.351821.084980.71632-0.83093-1.37875-0.07253-0.81-1.14239-1.30812-1.48472-0.80883-0.86219-0.69566-1.19453-0.71829-2.03-1.11252-1.3163-1.40522-0.94555-1.03512-0.92741-1.38899-0.52311-0.84-0.94257-0.96475-0.79192-0.15815-0.36913-0.710340.432779-0.42603-0.482、将以上数据导入spss软件,依次点击分析一降维一因子分析点击按钮,在弹出的对话框中,在中选择。回到原对话框点击右侧的确定。即可得到以下输出结果

TotalVarianceExplainedComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%16.15068.33268.3326.15068.33268.33221.47316.36584.6981.47316.36584.6983.6977.74992.4474.3183.53195.9785.1902.11298.0906.1161.28999.3797.029.32499.7038.024.27099.9739.002.027100.000ExtractionMethod:PrincipalComponentAnalysis.由输出结果看到前面两个主成分yl,y2的方差和占全部方差的比例为84.7%。我们就选取y1为第一主成分,y2为第二主成分。且这两个主成分占全部方差的84.7%,即基本上保留了原来指标的信息,这样由原来的9个指标转化为2个新的指标,起到了降维的作用2、spss软件得到主成分系数矩阵如下:ComponentMatrixaComponent12X1.931-.315X2.976.163X3.931.322X4.232.863X5.433.596X6.923-.200X7.897-.274X8.871-.064X9.899-.154Undefinederror#11401-Cannotopentextfile"D:\ProgramFiles\SPSSInc\Statistics17\lang\en\spss.ea.2componentsextracted.3、由以上结果得到前两个主成分的线性组合为y1=0.931x1+0.976x2+0.931x30.232x4+0.433x5+0.923x6+0.897x7+0.871x8+0.899x9y2=-0.315x1+0.163x2+0.322x3+0.863x4+0.596x5-0.2x6-0.274x7-0.064x8-0.154x94、对所选主成分做经济解释:第一主成分的线性组合中除了100元工业总产值实现利税和100元销售收入实现利税外,其余变量的系数相当所以第一主成分可以看成是xl,x2,x3,x6,x7,x8,x9的综合变量。可以解释为第一主成分反映了工业生产中投入的资金、劳动力所产生的效果,他是投入和产出之比。第一主成分所占信息总量为68.3%,在我国目前的工业企业中,经济效益首先反映在投入与产出之比上,其中固定资产所产生的经济效益更大一些。第二主成分是把工业生产中所得产量(即工业总产值和销售收入)与局部量(即利税)进行比较,反映了产出对国家所做的贡献。这样,在抓企业经济效益活动中,就应注重投入与产出之比和产出对国家所做的贡献,抓住了这两个方面,经济效益一定会提高5、通常为了分析各样品在主成分所反映的经济意义方面的情况,还将标准化后的原始数据代入主成分表达式计算各样品的主成分得分6.992.949.270.65-1.21-0.12-5.010.47-7.38-0.89-1.041.54-4.00-0.98-2.580.8417.451.679.78-3.4110.83-2.210.18-0.731.27-0.63-2.95-1.522.44-0.44-2.550.120.88-0.36-0.110.474.51-1.60

0.34-3.50-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论