钢铁行业股票的聚类_第1页
钢铁行业股票的聚类_第2页
钢铁行业股票的聚类_第3页
钢铁行业股票的聚类_第4页
钢铁行业股票的聚类_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

钢铁行业股票的聚类分析摘要随着经济的发展,人们已经越来越关心股票这一高风险高收入的投资项目,对此,本文运用多元统计办法,通过考察钢铁行业的一些相关指标数据,运用聚类分析理论中最成熟的系统巨雷方法,对这些指标数据进行分析,得出结论,帮助投资者选择最佳股票。关键词:总资产,主营业务收入,聚类分析,风险性导言股票至今已有将近400年的历史,它最早出现在资本主义国家,是社会化大生产的产物。发展到现在,股份已经成为资本主义国家最基本的企业组织形式;股票已经成为资本主义国家业筹资的重要渠道和方式,亦是投资者投资的基本选择方式;而股票的发行和市场交易亦已成为资本主义国家证券市场的重要基本经营内容,成为证券市场不可缺少的重要组成部分。同时,股份公司,股票和股票市场不是资本主义所持有的。我国是一个社会主义国家,在发展有计划商品经济的条件下,同样可以利用股份公司的企业组织形式,股票筹资的方式和股票市场的调节机制,为发展社会主义的有计划的商品经济服务。对国家来说,股票具有多方面的积极作用,它可以广泛地动员,积聚和集中社会的闲散资金,可以为改革完善我国的企业组织形式探索一条新道路,可以促进我国经济体制改革的深化发展,还可以扩大我国利用外资的渠道和方式,增强对外的吸纳能力等。同时有利于股份制企业建立和完善自我约束,自我发展的经营管理机制,有利于股份制企业筹集资金,满足生产建设的资金需要。对广大的投资者来说,可以开拓投资渠道,扩大投资的选择范围,适应了投资者多样性的投资动机,交易动机和利益的需求,一般来说能为投资者提供获得较高收益的可能性。但是由于股票价格既受政治,经济,市场因素的影响,亦受技术和投资者行为因素的影响,因此,股票股票价格经常处在频繁的变动之中。股票价格频繁的变动扩大了股票市场的投机性活动,使股票市场的风险性增大。股票投资是一种风险与收益相当的投资行为,所以对于股票的选择必须慎重考虑。本文就钢铁这一行业的股票进行分析。考虑同一行业在国际和国内环境的相似性,以及国家政策的同等性,在文中只对该上市公司及其股票的一些指标进行分析,得出相应的结果。并提出一些建议。模型分析的原理及其思想2.1聚类分析的基本思想聚类分析又称集群分析,是研究如何将客观事物合理分类的一种数学方法。它是根据食物本身的特性对被研究对象进行分类,使同一类中的个体有较大的相似性,不同类中的个体有较大的差异。它与判别分析同属类分析问题。聚类分析根据分类对象的不同,可分为样本聚类和变量聚类。样本聚类在统计学中又称为Q型聚类,它是根据被观测的对象的各种特性,对各变量值进行分类。变量聚类在统计学中又称为R型聚类,反映同一事物特点的变量有很多,我们往往选择部分变量对事物的某一方面进行研究。与多元分析的其他方法相比,聚类分析是从事物数量上的特征出发对事物进行分类,是数值分析学和多元统计技术结合的结果,是一种较粗糙的、理论并非完善的分析方法,但是其使用简便,分类效果较好,是常用的探索性分析工具,解决许多实际问题,所以很受人们的重视,同回归分析、判别分析一起被成为多元统计分析的三大方法。2.2聚类分析的分类聚类分析主要包括有:二阶段聚类、K中心聚类、层次聚类(系统聚类)二阶段聚类;二阶段聚类模型是一种新型的分层聚类算法,目前一般应用在数据挖掘与多元统计的交叉领域—模式分类中,其算法适用任何尺度的变量。K中心聚类:K中心聚类为一种快速聚类方法,适合处理大样本数据。K中心聚类要求聚类变量为数值变量,研究者事先需要制定分类数K,各分类中心的初值可以由研究者指定,也可以由程序自动给出。K中心聚类采用迭代算法,不断调整各分类中心位置,直到收敛。层次聚类(也称系统聚类)是实际工作中使用最多的一种方法。层次聚类法的层次含义是:开始时每个样品各看成一类,将距离最近的两类合并;重新计算新类与其他类的距离,再将距离最近的两类合并;再计算新类与其他类的距离,这样一步步地进行下去,每一步减少异类,直至所有的样品都合并成一类为止。整个聚类过程可绘成聚类图。类与一类之间的距离有各种不同的定义方法,定义不同即产生不同的算法,而不同的算法可能聚得不同的结果。选用何种结果合适,可以结合专业知识帮助判断。类间平均法,倾向合并偏差较小的类。类内平均法,倾向合并偏差较小的类最邻近距离法,适用于非常离散的资料遭最远距离法唯,为前两种欧方法的折中床中心法,分皇类效果较差邮,但稳健,皂对异常值不厚敏感滚离差平方和铃法,倾向得税到各类样品选数目接近的疾分类结果分廉类效果好但闹对异常值敏和感。友2.3分析后方法柄这次设计用僻的是聚类分悔析方法中理影论比较成熟技的系统聚类娘法。有雨类果与类之间有屡以上几种距荷离的定义,建所以系统聚茄类法主要有耗五种,分别吵为最短距离举法、最长距张离法、重心撕法、类平均时法以及离差茄平均和法。柱本次分析用殃了五种方法贤对数据进行洽分析后选取鸽一种最好的怠方法进行分灾析。零3.原始数维据及其数据劣分析付3.1相关尾原始数据佩表一原始数夏据纸总资产业主营收入振净利润胆增长率畅每股净甲资产负净资产放收益率隔主营业无收序入增长率丝每股资本公中积金手大钢不锈漆452.2拉3啦178.6察5冻759.4顷8达5.463熊8.43肥210.1毕2傻2.200拌8湖安阳钢铁刃159.2侮7捷49.33侧721.7拖2娇3.38上2.94郊41.78物0.387衫鲁银投资份15.67母8.44走649.8倾2页1.47观2.13览36.15评0.144爆南钢股份里100.0帽9门50.77票614常4.03社6.24断63.67绢1.205骡5奖武钢股份著490.8创5县124.1倡604.6养2.99恶6.026第49.0竹3眨0.736稻8思菜钢股份唐159.9奴6踩69.38敬549.1疯5逗6.21猪3.86双21.54工1.477粒柳钢股份瓜102.6剥4苦46.78栗456.7兄7罚6.095拐4.97雕45.11留1.464扎6造凌钢股份拨34.92锡16.01猜331.5阳4遭5.27修3.15乎12.9凝0.836皱5罚华凌股份番389.3脉8哀92.63恩330.8萌7认4.71齐2.64蜘31.52丸1.837啄3锤济南钢铁斯160.1通1俘76.93摔325.8毙4洽4.25端6.18句37.9望1.428滑8精唐钢股份碌291.0割7棍95.69婶313.6婶1雄4.3蒸4.77们54.34始1.427高3天杭钢股份利91伤32策308.8肠2京5.18藏2.09姓17.98斗1.140贞1抹安泰股份倍37.53猜7.92讨250.8涉6桶3.28有2.73大44.13伍0.887僵9浑承德钒钛早108.6淡30.23懒221.5捐2烘3.31殿1.79谢58.59诊1.162服韶钢松山债128.3幻6货32.16消213.7荡1疮4.07枕1.76拉9.79至1.041包3蕉本钢板材菠2课59.5推77.03孝207.0倘4压5.232邪3海1.92书89.47塘2.775涨8芝八一钢铁贵92.24腿26.68胖185.2蛾5哥4.19没1.6向71.53师1.449钥5西宝钢股份覆1778.寄4园429.7盛5露156.3饮8根4.85昂4.32锋28.66释1.874塞9戒鹏博士雾5.93带1.6题153.0玉5琴1.471胖0.93搅9.57安0.329求广钢股份馆44.14巡12.87漠145.4卸1给2.13揉0.92久43.53午0.874惊4竭三钢股份涉56.17锈21.89赛128.6洋3菜4.69酷4餐8.51厌1.325榆3扑包钢股份缎151.6睁3醋48.31妥120.5附2无2.31妹2.53挣39.45差0.673留3浸宁夏恒力犁12.84橡1.38王115.1塑3惠2.442坛0.332欧25.38把1.176犁3热鞍钢股份揪627.9钱5爷160.1懂7直111.6郑7狭5.48佳7.36内32.63瓶2.165雄3凉邯郸钢铁烂242.8圾4键59.84财92.41并4.12脏2.19恢15.2耗1.658顷6丝马钢股份床585.4怨8漂99.43摇79.53疲3.12磁11.31群30.32颂0.844啄8吗ST长钢嫁20.08看7.08犯75.71帅0.814壁-1.48匠10.34碰0.103勒大冶特钢榜29.72平12.74柴66.28痕3.115及5.57右9.81制1.080童7成西宁特钢浊69.59太10.62笨52.87路2.948壮1么2.037钩82.42萌1.090兵5材新华股份袄7.39营2.26辱43.88牵1.86抬2华6.99痒0.272便1饿首钢股份铸170.2织3肚62.67氏41.85绸2.674登1.82练7.05音1.142缸2敬酒钢股份坐77.74太40.6赖4犹21.83棒4.76版1.74捧53.61融1.154誓8巨抚顺特钢界47.04铅10.78惩20.94究2.986粱0397顶3.11幸1.411爆8铅新型铸管谷93.95捎31.27饼20.88迅4.040丧9辣3.39茄14.18膨1.459你4飘福星科技坡49.36挤4.74阀12.08毅6.85蚁1.9届30.35度2.758垂8肃大连金牛短36.6他7.04烧8.19听3.78阀0.22常12.67腊1.952乔9戴法尔胜衡38.96曲4.8政7.72头2.607填6罩0.61财8.32寄1.2麦287叛攀钢钢钒杰212.2湖1挪46.86民10.1辆3.49稻2.18拳36.96瞒1.449桥9站贵绳股份刺12.13零2.19染1.08赔4.53都1.32度11.14倘2.893哀7顶重庆钢铁席103.1鞭1气27.65尼0轮2.92判2.43焰0独0.661明总资产(亿程元)主营收福入(亿元)背每股净资产刘(元)每股沾资本公积金杀(元)丈3.2结果草分析取1、下面将肉数据输入到羡spss的赞编辑器,进架行数据处理丈。过程如下馒:津首先把数据惩输入到sp旁ss的编辑饮器,在菜单研栏中选An姨alyze挎中的cla骡ssify驳命令,再c相lassi丹fy子菜单羽里的hie魂rarch煤ical怪clust婆er(即系吃统聚类法)毫,在sta早stist振ics里选窝中aggl逗omera桑tion阔sched痛ule和p蒜roxim劳itym耕atrix终并且在ra翼ngeo爹fsol螺ution兰s中选3到樱7类;这在plot剥中选den慎drogr钢am,ce博cle中选奖allc酬luste肺rs,or窗ienta使tion中算选vert旺ical;朱在meth瓦od中选w翅ards晨metho运d,帅stand绩ardiz满e中选z松csco焦res和b怎y误varia绸ble杜。运行sp本ss得到成妙员聚类表。喷表2成员聚肺类表帽根据上表给支出的结果我龟选择聚为六孝类,因为它草最符合实际搁。送表3个案处初理摘要图梢表4成员聚册类表冠表5聚类过财程结果滔2.通过对务数据进行聚爸类分析,可秃以看到分为伟六类结果比画较令人满意见,其具体的侍分类结果如初下:众第一类包括熄:太钢不锈巩第二类包括钩:安阳钢铁描、鲁银投资游第三类包括意:南钢股份汪、武钢股份迁、菜钢股份耗、凌钢股份钞、华菱股份旗、济南钢铁孤。唐钢股份问。安泰集团早、承德钒钛刻、韶钢松山心、八一钢铁绳、鹏博士、醉广钢股份、能三钢闽光、架包钢股份、用宁夏恒力、肥鞍钢股份、畏邯郸钢铁、貌ST长钢、辛大冶特钢、侍西宁特钢、搂新华股份、标首钢股份、匀酒钢宏兴、塘抚顺特钢、州新兴铸管、除法尔胜、攀店钢钢钒、重通庆钢铁芝第四类包括粱:本港板材森、福星科技恒、大连金牛弃、贵绳股份餐第五类包括滥:包钢股份愧第六类包括截:马钢股份雕回顾分析指丘标,我们不息难发现,就泪整体而言,缴几乎所有的把上市其股票客行情相当,沟也就是说,碗除了少数具堵有明显优势波或者劣势的祸公司以外,三钢铁行业的施整体实力都丘维持在同一羽层次上。汪就太钢不锈歉来说,到0宪7年3月3滚1号为止岔,太钢不锈姐向投资者交须了一份满意叮的答案:2乎006年,巾公司实现主警营业务收入史400亿元若,同比上期庸增长了68搂.78%,队实现净利润都24亿元,骂同比增长幅辛度高达21可2.04%配,净资产收乳益率达到1原8.25%质,2006贫年控股股东坟太原集团向它太钢不锈注孕入优质资产冰,由此,太仿钢不锈一跃辫实现了钢铁御主业资产蹈“冠一体化胸”棒。收购效益帮相当明显。矩与此同时,床新产品的开蕉发也使太钢顶不锈业绩斐身然。由此引脑起太钢不锈垃股票前景一匪片大好。对模于宝钢股份虫,其总资产鱼以及主营业碧务收入在当因前都排名第塌一,但是净祝利润排到十环九,相对与惩总体净利润俊来说,成为暮负利润。并做且,在往前雕看,06年备12月31诵号,其情形欣基本相同。就宝钢股份从态总体上已经悉形成一定的苗固定形式,给不能灵活的露变动,再加趴上其管理阶场层的人员变堆动不少,使形其很难进步姐,但实力仍区然雄厚。尤毙其是宝钢股腾份试制成X斥120管线即,被认为是驳目前世界上国最高强度的葬管线钢。马提钢股份可以咳说是上市比翠较早的钢铁施公司,实力傻雄厚其总资拖产和主管业斧务收入始终瞧保持在前五丰名,尽管它祸的净面利润仍为负旅数,但是就酷最近的几次努总体数据来祖看,它一直批是呈现积极畅的增长阶段鲜,前景也可浆观。再看赚本钢板材、营福星科技、蔽大连金牛、盟贵绳股份这摄四支股票,剥后三支股票剪无论在主营碗业务收入、梯总资产,还锄是在净利润差上,都不能剥和其他的一问些股票相提臭并论,而且纷是长期在这摆样的状态下蜘,一直很难仆改变现状,雀其趋势亦只润能维持在这颜个状态。对罚于本钢板材菠,其效益比兔上面三个好露,但是其前染景同样不是蛾很乐观。以爷它的净利润粮来说,在短穷短三个月内票,由原来的借第三名下降额到十六名。秒可见一斑。渣总结以及建墨议巷通过以上的凝分析,可以禾知道,包钢矮股份蝇是比较传统厦的钢铁公司否,其股份相脏对来说比较犯大对于这样浪的股票,它渡无论是涨还咬是跌,幅度槽都不会很大绢;而对于马特钢股份,它甩具有传统钢世铁行业的优燃点,同时也蛮能够对公司慎内部进行一批定的灵活变廉动,有相当千的潜力;本的钢板材。福榴星科技。大喊连金牛、贵谁绳股份这三吹支股票并不陪可取;与此男相反,太钢减不锈却是有字着很好的潜洁力,对于第锻二类股票,灶由于处于总晴体均衡位置燕,实际来说萌有一定的投怠资效果,但秋不明显。晚另外要注意元的事,以上肯分析知识在锋假设同行业括间面临同样历的国际国内没形式的情况瓦下进行的,暖没有考虑到罩很多其他的丸因素,比如爪说地方保护岁政策,环境卡因素等等。具因此这只是公一种初步的嘴估计,与现钱实之间仍然关存在一定的照差异。股票倦市场千变万换化,国际、袍国内的重要膊商业变动都渔可以随时使狗它发生变化魄,因此在实似际选择股票鞠的时候,必盼须多方面考颈虑,每一种告情况都要沾分析明白。粥同时自身心迎理因素对股赌票的选择也除有一定的影浅响。参考文献谈[1]卢璇修等译,实用蚁多元统计分歌析,北京,味清华大学出职版社,20壳01低[2]方开轰泰,实用多吉元统计分析纱,上海,华愁东师范大学野出版社,1脸989阴[3]王学甚仁,王松桂很,实用多元组统计分析,裙上海科学技最术出版社,拒1990跟[4]宇传飘华,sps紧s与统计分置析,北京,时电子工业出罗版社,20梳07著[5]卢纹阔岱,《sp池ssfo净rwin雾dows旁统计分析》耽[M]北京漆:电子工业撤出版社,2滤000年既学生成绩的竿主成分分析摘要的对一个人的晓智育能力判极断标准是什轧么呢?这个揪问题是值得类研究的我们婶不能根据自常己个人喜好伐来判断,必拴须要客观综斩合地给出一授个判断。摩本文通过运木用主成分分槐析对学生成界绩分析得出界比较方法,猫用来解决智播育能力判断蛋的问题。本痛文主要部分辉是数据选取祖、数据分析罩、结论分析毛。通过对学奴生各科成绩拉做主成分分迷析,得出每胜门课程的贡都献来对结论强作出解释。斑关键词:瞎数据选取精数据分析丢主成分分析引言甲大学生本科巾教育水平是再高还是低,略我相信很多抬人对这一问熄题是持有保滴留的态度。扛随着经济的谱不断发展,卫无论经济管简理类蔑行业还是高豪新技术行业鄙,各种市场赠需要的人才猴越来越多,系然而人数的忠增加并没有溪影响市场对疾人才判断的锁标准,而是凑越来越严格尘。中国大学盖本科教育有桌着自己特点常,取得了一何定程度上的遍成就。在教动育中注重的滨事理论方面放的培养。就寇因为这种社删会学习风气无的影响下,惰形成了一种素对需求人才翼的判断标准素。但是我觉其得这种标准鄙时存在一定橡的弊端。虽拖然大学教育盾在不断改善吩,为了满足伙社会对各种鞭人才的需要台,大学本科沿教育业增加嚼很多各方面肿的知识课程泳来提高学生价的能力;但臂是只是一些败表面上工作锐的改善时没酷有用的,我捐国对大学生托素质的判断岛还保留着以悟前那套作风毯,还是对人腰才素质的判挠断标准定在挣了某些方面希,并没有从欠本质上改善嫁。对一个大月学生能力素弃质方面的判融断,并不能扰再只从单方培面,而是通姿过对学生各腾方面的综合寸能力分析比透较再定标准涛。大学本科笛生时人才市禁场的主要部鉴分。而一个呢人的能力,甘我相信在艰毫苦但富有意骄义的四年大转学生活中得袍到了充分的喘体现。因此决对大学生能丙力判断,也动是对社会人恼才的判断近买似定了个标别准和判断方编法。忠大学生能力膝究竟怎样判般断比较呢?圆很多人是把伞他们某一方静面拿来比较研。例如:把姿两个学生各庭自相对较强船的项目拿来惩比较就绑对他们两个超人的能力高虑低做出判定宰,这是一个误很不科学的王方法。在现涝在大学教育夸中,学生需铅要的各种专像业知识越来侦越多,因此顶开设学习科慎目也很多,露单从某一方靠面成绩来比爸较根本不能碑很好地做出明分析。科目们一般都分专艘业选修、专唇业必修、公似共基础等等忧。个人对这额些科目分类薪看法不一样纽,兴趣爱好蚀不一样,都搜影响着他们礼各科的成绩屈,因此拿某享些科目来比性较是很不科帆学的。我们迁必须把学生余在大学四年胆的总体成绩绳做比较后才否能对他们智白育能力做出棕判断。供选取做比较痕的人为了避梦免专业不同对带来的差异宜,就必须是膝来自同一专衫业学习薄相同科目的答。因此我选逃取了统计系升2002就级学生做比吼较对象,把希他们从说2002爬年盯—插2005钱年各门成绩帝做比较数据供。学生成绩纱中包括专业堪选修、专业种必修和一些扛公畅共基础课程亩。通过用主变成分分析的殖方法,利用哄SPSS炎软件对数据滋进行上机实埋现分完析,计算出筑每个人在各拌因子中的因染子得分,然偿后对他们各旅自的因子得览分加权平均尸,之得出结果后思再对他们进粮行有效的排捞名。这种比宏较方法相信坟比从单方面扮进行比较具熔有更好的说益服力。蓬2奶.1丹主成分分析鄙主成分分析隆(辟princ糊ipal慈compo老nents歇anal拳ysis典)是由霍特煎林于蹈1933浸年首先提出桥的,主成分财分析利用降肌维的思想,水在损失很少扎信息的前提省下把多个指嘴标转化成几羽个综合指标青的多元统计改方法。通常先把转化生成飞的综合指标醋称为主成分全,其中每个弃主成分都是率原始变量的洋线形组合,弹且各个主成番分之间各不斥相关,这就态使得主成分宵比原始变量右具有更优越弟的性能。这捐样在研究复太杂问题的时盛候就可以只衬考虑少数几顾个主成分而衫不至于损失歪太多信息,纹从而更容易拥抓住主要矛蔑盾,结实事买物内部变量推之间的规律畏性,同时使衡问题得到简南化,提高分承析效率。病嫁慧主成分分析牵的基本思想轧在对某一事匹物进行实证炼研究的时候拴,为了全面仅、准确的反轿映出事物的渣特征极躁其发展规律喜,人们往往贺要考虑与其础有关系的多马个指标,这和些指标在多抚元统计中称梢为原始变量见。这样就产躺生了如下问蜘题:一方面产人们为了避简免遗漏重要厘的信息而考谣虑尽可能多症的指标,而需另一方面随钻着指标的增塑多增加了问寒题的复杂性遍,同时由于寻各指标均是书对同一事物狮的反映,不松可避免地造角成信息的大摄量重叠。这序中信息的重奶叠有时候甚富至会抹杀事负物的真正特厌征和内在规脆律。基于上呈述问题,人磨们就希望在饼定量研究中查涉及的变量浴较少,而得手到的信息量蛮又较多。主赴成分分析正蜜是研究如何翼通过原始变翠量的少数几督个线形组合糕来解释原来宪变量绝大多追数信息的一辱种多元统团计分析方法谎。深既然研究某度一问题涉及膀的众多变量杆之间有一定狗的相关性,铁就必须存在游着起支孩配作用的共旅同因素,根哪据这一点,幅通过对原始跃变量相关矩今阵或协方差告矩阵内部结节构关系的研废究,利用原滥始变量的线桂形组合形成异几个综合指雄标(主成分悲),在保留猛原始变量主软要信息的前萌提下其到降其维和简化问衣题的作用,返使得在研究载复杂问题时效更容易抓住昆主要矛盾。棋一般地说,差利用主成分辉分析得到的印主成分与原块始变量之间欢有如下基本动关系:埋1.梢每个主成分屈都是各原始问变量的线形氧组合。趟2.牙主成分数目浮大大少于原趟始变量的数覆目。咐3.陪主成分保留军了原始变量惕的绝大部分槽信息返4.北各主成分之昌间互不相关仪。坐设某一事物婚的研究涉及说p伸个指标晓,逗分别用表示泄,这满p已个指标构成合的歼12,滚,...坏,PX枣XX送p叉维随机向量碰.辽设随机对婶X膝的均值为,血协方差阵为辨X=(废X1,X渠2,..译.,XP姜)押′壶顺μ常畏Σ闸,对样X乞进昂行线性变换校,可以形成陶新的综合变继量,用利Y熊表示,既其跃可由原来的载变量线性表妄示,满足下式:职ppY耽XX海X11透111镇221失=闯μ哈+论μ净+..搜..+忆μ炼pPY备XX钥X22善112城222痕=内μ喜+重μ唤+..接..+天μ……竖PPp稼PPP覆Y=脾μ云X+坟μ栋X+蜂....+挂另μ杏X伐在基于一定愤原则的情况挎下,综合变扯量、俩…蛙.跟分别称为原澡始变量的第贷一、巡1Y2态Yp迷Y往第二、顽…炼第吐P漏个主成分。竞通过主成分贱分析,可以某从事物之间头错综复杂的矮关系中胸找出一些主享要成分,从追而能有违效利用大量渐统计数据进剂行定量分析嘱,揭示变量雹之间耕的内在关系吗,得到对事占物特征及其攻发展的一些允深层次的启梯发,把研究谎工作引向深入。尤统寇求解主成分恰的方法握求解主成分姨的方法主要算有两种,一夜是从原始变禾量的协方差刘矩阵结构入翼手,二稠是从原始变金量的相关性廊矩阵结构入乞手。畏一吃·慎从协方差矩织阵出发求解隔主成分晋设矩阵池A汇′颗=A层,将不A祥的特征值依处大小顺序排至列,不妨设掠12,桥,...闪,n诊λ课医λ包邮λ婆,鼠痛为矩阵我A炒各特征值对殊应的标准正躲交特征向量馆,则对粮12.饼..n持λ表陵≥膊驴λ翁编≥输困≥宽科λ贯12安,,..省.,p绞γ葵好γ捡俗γ状任意向量筐x蛇有010豪max,彻min桶xxn播xAx披xAx掀xxx梢xλλ≠株当随机向量旨的协方差阵劈为絮X=(棕X1,X据2,..际.,Xp部)驱′欣贿Σ控,超掠为的特征屑12.读..p峰λ途犯≥具竖λ宋筋≥析赴≥幅村λ分脂Σ弄值,号烟为矩阵浊A明各特征值对僻应的标准正哥交特征向量兵,则第挖i貌个主成分为宰12,背,...毯,p逢γ衡激γ鞠检γ孕(刮i=1,2揉,晚…站,p购)顾11也22.扁..i淹iip霞ipY货=规γ卧X+资γ自X+莫+艺γ租X盒所以我们把禽的协方差矩秃阵的非零特宵征值凉>0奔对洒12,大,...因,PX昂XX唐Σ常12手...p插弟λ厕暂≥轮来λ割天≥红携≥融烦λ弹应的标准化李特征向量分驻别作为系数派向量,仿12桂,,..每.,p撒γ腿摸γ摧幼γ谨分别称为随蚂机向量比X符的第一主成螺分、第二主哑成艺112助2,堂,...,秋pp山Y=震γ玩食′醒XY=雪比γ类覆′郑XY=垃勇γ循X堂分、叹…谦第柄p胀主成分鼻.挖于是随机向招量晃X河与随机向量岔Y俊之间存在关钳系YXXμμμμ⎡′⎤⎢⎥⎢′⎥老=声′而=烛⎢熊弄⎥⎢⎥夹⎢丧姻′茧稠⎥源虑⎢⎣造惊⎥⎦1122..ppXXXγγγ认⎡陆即′灿界⎤虎院⎡钳念⎤扩疗⎢荒皮⎥貌鹅⎢暑藏⎥照微⎢脾挡′战罗⎥浇饰⎢埋钢⎥若=证⎢够碧⎥适搏⎢鲁电⎥水乱⎢舟沾⎥误反⎢下钓⎥籍慧⎢捷染′⎥之底⎢⎣涉刺⎥⎦悉亮⎢⎣挣允⎥⎦积二筝·艺从相关系数套矩阵出发求两解主成分迷首先数据矩巧阵元素进行典标准化劫ii要,充i=1洪,涌2坟,绘…慈,浆p治;沉僵;iiiZXμσ−=1()/niiiμxn==Σ1唯()/年(1)niii棚σ拒xx闹n−=训=令Σ夸葬−接厕−缸式中,碑伙和分别表示回变量的期望卷与方差,于渠是有,帮Σ例=办⎜楼杠⎟巡泽⎜办杏⎟⎜⎟⎜⎟⎜⎟⎝⎠LLMMML趣于是对原始械变量范X今进行如下标钟准化:筐=(许Σ叛2)誉−占1(X愧−μ汁)显然有:11含212车1()0狐cov(没)()剧()EZ罚Z逝−次充−雷R辰因此,原始绕变量的相关惕矩阵实际是哗对原始变量扎标准化后的短协方削12,掌,...辫,PX具XX因差阵。由相挠关阵求主成指分的过程与唐主成分个数塘的确定准则社实际上是与欧由协方差阵乌出发求主成仁分的过程与描主成分个数胜的确定准则懒是一致的。京求得的主成大分与原始变量表示为:斑3汇·匹数据的提取星要使分析结滔果有很好的厕说服力菌,士数据就必须蔽要有真实性控,激而且不失一弃般性凡.枯不泽能只取某些痕人或者某些残成绩来比较瞒.膝于是我选取年了统计系顿2002筛级全部学生评从聪2002陷年到篮2005原年五个学期棕所学科目的冰成绩做分析您数据蔬,裙这样数据才牙具有分析价眼值和参考意政义兽.况4盖·五1伸数据的处理举通过把数据市用鞋SPSS摆软件上机实金现得出以下悦结果乱:表3.1唱总方差解释陵表总方差解释成分朋旋转载荷平荷方和叫总和方差百笨分比累积百味分比允13.1积75192麻19.8菌4495初19.84桃495女22.4扎54631顶15.3溜4145铺35.18给64载32.0姥93123配13.0少8202伍48.26享842勇41.6虏79715锅10.4爽9822探58.76性663约51.3轻05402乏8.15泻8766兽6.925电39虫61.1乒55123槐7.21蝴9527健4.144约91孔表蛋3.1荐表示主成分符分析后主成球分提取和主怖成分旋转的迷结果义.图3.2图集图支3.2寺表示主成分疲碎石图。它命的横坐标为啦主成分数。敲纵坐标表示粪主成分的特浙征值。可见存前两个主成翠分特征值变葛化非常明显肿,到了第三区个特征值以蜜后,特征值涛变化趋于平督稳。表3.3成分矩阵亏表洒3.3孔是按照前面单的主成分载纠荷矩阵结果梳。未经过旋杰转的载荷矩蚀阵中,主成串分变量在许劈多变量上都痕有较高的载传荷。上表给太出的标准化捡原始变量用傻住成分线性脖表示的近似良表达式如下勿:照标准化英语罪≈观爬×趴鲜−捧朋×齐+妻×油+区×贝岁−观0.165历50.宪0876所0.214多10.鄙3592姑0.69谱030劝.043出4语prin惊prin引prin形prin宵prin蠢prin湾+皇×河烛−象成×秘标准化高等则代数检≈掠健×忆+朴×衔+猎×亭鞭−讨射×列0.229趋50.悬0506涨0.070兼10.蒙3502状0.70层630齿.234螺4衣prin喘prin述prin睬prin盼prin脚prin侧+哄×院+浙×打标准化数学隐分析动≈渠眼×扰+语×扛+乐×泄+啄×隔50.0缎406扭0.085让10.君1142粗0.12于530忧.908鬼40.0今90器prin嘴prin才prin松prin宅prin甚prin×+×在标准化毛概燕≈符秃×吩+础标准化思想像道德粒≈洞轿×轨挺−卫展×层+嫁×葬+护×茄50.9醉226回0.036钓10.告0722墙0.02构130框.001劈40.0堵73练prin毫prin远prin麦prin疑prin益prin×+×伐标准化体育词≈避倾×观+轨×世+拿×膏厦−炊钥×南+杏0.364萌50.贸1036陶0.113应10.拥5582寸0.47两830勤.189叹4允prin征prin名prin爹prin摇prin遣prin束+另×扎+雷×德标准化大学趋物理室≈皂幸×悄+饥×枪+介×划+膀×甩0.104积501旺716纤0.661械10.雁2652奔0.22俭530栏.177塌4争prin简prin忆prin脖prin艺prin筒prin×+×如标准化数值霜分析意≈拳例×劳+双×慈+殊×茅+僻×赴插−着50.2璃126豆标准化实变养函数娱≈会工×植+挥×云+累×狱+葵×斤0.013屯50.狗1246番0.213怒10.恩7862侄0.17驴630克.237德4驼prin壶prin感prin费prin柄prin季prin配−典啊×策+咽×沉标准化复变卵函数超≈犹疗×干+穴×案+宁×面+棍×叙0.240昂50.毯1836致0.671秤10.桂2732宝0.12沿830汗.134车4榨prin旺prin盏prin述prin帅prin红prin后+术×尚亲−榜塑×说标准化概率厦论茂≈丛纸×地+迟×滴+顽×钻+粉×么0.081徒50.没1116液0.543井10.净6282厉0.13理730疤.145槽4艰prin翻prin越prin桃prin溪prin误prin需−足味×斧+驼×迹标准化数理免统计完≈训邮×厚+煌×崇+旅×抢+刮0.039蚕50.近1796某0.467医10.的6542债0.06拌930故.153蔑4欠prin瞎prin马prin庄prin浩prin询prin赠+崇×遣昂−笼牛×惭标准化随机礼过程艘≈驶心×文+迟×辩+古×爱+觉×槐0.304脱50.芬0996鞠0.723庆1城标准化统计再计算,表3.4万成分得分系堡数矩阵售上表是主成巴分得分系数扭矩阵。表格兆为标准化主艘成分用标准践化后的原始幼变量线性边违式的系数矩括阵。如下:絮标准化咳prin1铸=抽标准化英语耕×木0.091哑+粥标准化高等剪代数支×忧0.070锁-饲标准化数学膏分析狗×呈0.192敢-滔标准化毛泽容东概论清×摊0.133啦-允标准化思想歌×桃0.055勾+窗标准化体育环×锻0.029论+尿标准奉化物理掠×财0.199学-涨标准化数值邪分析帮×愤0.266挂+肃标准化常微国分多×捉0.391护+秧标准化实变苗函敏数撒×且0.062闷+织标准化复变务函数直×弓0.184锄-乓标准化概率蚊论河×百0.274比+零标准化数理矛统计环×锅0.101侵+魄标准化随机摘过程浅×贵0.028钞+插标准化多元凳×弱0.376撇+真标准化统计晚计算材×椒0.082万标准化者prin2无=延标准化英语搭×击0.365及+锻标准化高等必代数鸽×屯0.095祖+姐标准化数学客分析丰×孙0.060膊-料标准化毛泽佣东概论锻×拾0.153炊-馅标准化思想磨0.154王-脑标准化体育演×访0.021明+娃标准化怨物理吐0.264哀-梅标准化数值忍分析娘×镰0.076聚-测标准化常微搬分躲×旦0.183叛+贸标准化实变蜂函数里×爆0.031歪+厘标准化复变写函数市×艺0.515等-化标准化概率惠论龄×辫0.054偷+仓标准化数理蜘统计哗×某0.322弊+梨标准化随机踢过程趣×应0.369腔-副标准化多元台×时0.214顺-兼标准化统计鼠计算艇×答0.059卡标准化牛prin3着=凉标准化英语愈×差0.525因+上标准化高等血代数筐×大0.390馒+估标准化数学址分析闷×挎0.385块-却标准化毛泽贩东概论寿×届0.038感-兵标准化思想梅×罩0.013纷-找标准化体育烂×锈0.050细+尊标准化蛋物理上×嚼0.175诊+袍标准化数值糠分析诉×递0.003闪+伞标准化常微塔分党×蛋0.068左-慕标准化实变币函数落×蛙0.146贼+获标准化复变打函数于×庭0.091炊+炒标准化概率淋论定×盼0.058备-碰标准化数理什统计级×废0.105批-拍标准化随机模过程置×眼0.149佣-示标准化多元贵×疗0.122被+脚标准化统计隙计算只×赚0.88堪标准化目prin4果=谅标准化英语肌×航0.46-遵标准化高等焰代数昂×抱0.228士+扇标准化数学幕分析作×浑0.045越+协标准化毛泽帽东概论绞×锻0.748们-疗标准化思想岁×批0.023清+运标准化体育贷×爪0.056亲-汉标准锹化物理嚷×娇0.026坑+圣标准化数值仔分析肃×星0.005唉-蔑标准化常微驰分粗×吉0.149宅+叮标准化实变蛮函数雪×娇0.394续+北标准化复变都函数荷×永0.006关-削标准化概率民论话×湾0.082关-传标准化数理君统计郊×犯0.166递-硬标准化随机开过程垮×圆0.094满-木标准化多元墨×向0.11+哥标准化统计奔计算付×妈0.195般标准化脏prin5歉=悠标准化英语劈×泊-0.24虚8+桂标准化高等嘴代数很×似0.084于+瓜标准化数学斜分析貌×剂0.117店-耻标准化毛泽估东概论角×封0.002婶+泻标准化思想坛×厌0.735蔽+忽标准化体育碑×甜0.042逆+事标准迎化物理渔×识0.217读-傲标准化数值幼分析茶×蓬0.131博-甚标准化常微编分煌×兼0.101凡-努标准化实变大函数笛×杜0.095脚-坚标准化复变推函数怨×喇0.107羊+何标准化概率颗论鸡×摧0.158皂-角标准化数理享统计天×拼0.135值-精标准化随机胀过程倾×脚0.041风+毙标准化多元卡×骂0.228搞-决标准化统计叨计算御×拥0.032湾标准化喊prin6码=念标准化英语滩×给0.033郑-仗标准化高等咬代数环×鞠0.130蛾+宗标准化数学驴分析紫×顾0.010穴+字标准化毛泽栏东概论炉×盾0.107撕+危标准化思想垦×慰0.058舞+叶标准化体育称×久0.808焦+零标准孤化物理未×趟0.049板+呀标准化数值弊分析禽×黄0.165馅+尚标准化常微纷分魄×腹0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论