利用SPSS进行主成分回归分析1_第1页
利用SPSS进行主成分回归分析1_第2页
利用SPSS进行主成分回归分析1_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 CHINAPUBL/CHEALTHVol.17No.8A200/中国公共卫生2001年第17巻第8期1995-2004TsinghuaTongfangOpticalDiscCo.Ltd.AUrightsreserved.1995-2004TsinghuaTongfangOpticalDiscCo.、Ltd.Allrightsreserved.:1001-0580(2001)08-0746-03SPSS CHINAPUBL/CHEALTHVol.17No.8A200/中国公共卫生2001年第17巻第8期1995-2004TsinghuaTongfangOpticalDiscCo.Ltd.AUr

2、ightsreserved.1995-2004TsinghuaTongfangOpticalDiscCo.、Ltd.Allrightsreserved.暨南大学医学院(广州510632):利用SPSS8.0进行主成分回归分析。利用SPSS8-0的LinearRegression,FactorAnalysis,ComputeVariable和BivariateCorreciations等过程结台主成分回归分析的基本原理介绍整个主成分回归分析的步骤。用一个实例描述SPSS8.0各种过程的操作和主成分回归整个计算过程并且确定“最佳”方程。介绍多重共线性的各种诊断指标主成分回归分析的优点和注意事顶利用

3、SPSS进行主成分回归分析能达到简便快捷和准确的统计效果。:多重共线性诊断:主成分回归分析:R195.1:APrincipalComponentRegressionAnalysiswthSPSSLIURiurxing.MedicalCollegeofJinanUniversity(Guangzhou510632,China)Abstract:ObjectiveTointroducehowtodotheprincipalconponentregressionanalysiswithSPSSMethodsTheanalysisstepsoftheprincipalcomponentregressi

4、onbycombiningtheLiirearRegression.FactorAnalysis,GdniputeVariableandBivariateGDrreclationsproceduresinSPSS8.0forWindowswiththebasicprinciplesoftheprincipalcomponentregressionareintroducedResultsAnexampleisusedtodescribealloperationsofeachproceduresinSPSS80andallcalculatingprocessesofprincipalconrpon

5、entregression.andthebeslequationisbuiltGmclusionsTheeachindexesofmulticollinearitydiagnosisandtheadvantageandthepointforattentionaboutprincipalcomponentregressionanalysisareintroducedandthesinplifiedspeededupandaccuratestatisticaleffectarereachedthroughtheprinicipalcomponentregressionaiuilysiswithSP

6、SSKeyw)rds:multicollinearitydiagnosis;principalcomponentregressionanalysis在多变重分析中常常采用最小二乘法拟台多重线性回归模型但是最小二乘估计有时会很不理想造成这种情况的一个重要原因是矩阵X的列向量接近线性相关这种自变量之间的近似线性关系我们称为多重共线性(multicollinearity).而多重共线性存在是我们求出的回归系数的符号及其数值与理论不一致的主要原因。本文利用SPSS8.0forWindows通过主成分和线性回归相结合的方法来解决多重共线性的问题。4】。11-1以应变量Y和全部自变j|X进行逐步回归.筛选

7、出P个有统计学意义的自变重.并且诊断各自变量的多重共线性。1-2用P个自变量进行主成分分析得到主成分矩阵和各主成分的累计方差百分比。1-3计算标化应变量和P个标化自变重分别见式(1.1)和(1.2),按(1.3)式得到P个主成分的值。Y=(Y-Y)/Sy(1.1)XXX,-X)/Sx,(i=l,.p)(1.2)C,=a,1X,1+a12X,2+-+a,pX,p,(i=l,-.p)(1-3)Y为标化应变量.Y为应变重Y为应变重均数.Sy为应变重标准差.XI为第i个标化自变Ji.X为第i个自变重,X为第i个自变量均数.Sx,为第i个自变量标准差C为第i个主刘润幸成分斶为主成分矩阵(C与XI构成的矩

8、阵)的系数。14从累计方差百分比渕5%所包括的主成分开始建立标化主成分回归方程再向后逐步增加主成分个数.得到m个标化主成分回归方程.见式(1.4)。yA,j=2fe,C,(j=l,,m切。i=l,,K卸)(1.4)yAj为第j个标化主成分回归方程估计值为标化主成分回归方程中第i个标化偏回归索数。1.5计算m个标化主成分回归方程的残差见式(1.5).对残差取绝对值见式(16).参考较小残差绝对值均数和较大累计方差百分比在仃4)式中挑选“熾佳”标化主成分回归方程。Y-yAj,(j=l,m)(1-5)AE=IEl,(j=l,.m)(1.6)E为第j个标化主成分回归方程的残差-AE,为E,的残差绝对值

9、。16把仃3)代入“毘佳”标化主成分回归方程整理后得标化线性回归方程.见(1.7)式。yA,=WbiXi,(i=l,卩)(1.7)y为标化线性回归方程估计值它与相应的标化主成分回归方程估计值等价。b为标化线性回归方程的第i个标化偏回归乘数。1-7把标化线性回归方程转换成一般线性回归方程。标化備回归系数转换为偏回归系数以及常数计算公式见(18)和(1-9)ob.=b丄YY/LMi(1.8)h=V-习侃(1.9)b.为一般线性回归方程的第i个偏回归索数丄yy为的离均差平方和.Lmn为X,的离均差平方和。bo为一般线性回归方程的常数。2在19511998年间(缺乏1986和1969年的数据),我国各

10、年车祸死亡率(1/10万)为应变量Y.机动车数量(万辆)为自变量XI.货运重(万吨)为自变重X2.客运量(万人)为自变重X3.有路面里程数(万公里)为自变重X4和无路面里程数(万公里为自变量X5。2.1使用SPSSLinearRegression过程的向后逐步法佛选变重和进行多重共线性诊断在LinearRegression对话框.把应变重Y放入Dependent栏把全部自变11放入Independent栏.在Melhod下拉菜单中.选择Backward法佛选有统计学意义(P15有别于前三维的特征值和条件指数其对应的自变重X.和x3均有大的方差百分比:088和0.99这些证据均支持自变量&和X,

11、存在共线性。主成分分析可以把相关性较强的自变量综合在同一主成分中各主成分彼此独立使相关自变重变为相互无关主成分,尽可能取小残差绝对值和大累计方差百分比使能够充分利用原有的信息.然后把主成分回归主程转换为线性回归方程.这样既克胆了共线性的干扰和暴露本来直面目(本例经主成分回归分析把bi=-7.52E-04纠正为6=0.00149说明车祸死亡率与机动车数重呈正相关符合客观事实)又不损失原有信息(本例“最佳”主成分回归方程:yAr=o.969G+0.158C2-0.121C3其残差绝对值均数与标准差为1.32021.0618.与yAr=0.97G和yA,=0.97Q+0.158C2方程的残差绝对值均

12、数与标准差基本一致其累计方差百分比为100%.即利用全部原有信息)O“最佳”标化主成分回归方程中的Bl.Bi和B,均有统计学意义(PV0.05),各主成分均包含自变量XI,X3和X*4的信息可以间接说明标化线性回归方程的b和Z均有统计学意义同理也可以推论一般线性回归方程的bib和“均显著。这样即可以使用标化偏回归系数bi作因素分析也可以使用一般线性回归方程:T3.735+0.00149X,+0.0000053X3+0.0616X:作预测。计算主成分C,的值时.应该使用标化自变量X,因为其数学表达式为:C=ailXI+3,2X%+aipXrp,而不能使用原始自变fiXo如果使用原始自变量X计算:

13、心),会导致各主成分之间全相关(Rc,Cj=1或-l,i为)。利用SPSS进行主成分回归分析是一种行之有效的方法。它不但可以用多个共线性指标诊断每个自变重的共线性而且可以解决共线性问题同时绝大部分的计算过程由计算机完成减少人工计算的繁琐且保证结果无误达到简便快捷和准确的统计效果。:刘润幸(1954-八男广东惠州副教授卫生统计学硕士。硏究方向:慢性病危险因素的硏究。数学模型的应用硏究。锂学统计学与SPSS统计软件的计算机辅助教学硏究。陈舞主成分回归分析中国卫生统计991.8(1):20.方积乾(主编),等.医学统计学与电脑实验.第1版.上海:上海科技出版社1997.2953刘润幸(主編)SPSS

14、8.0forWindows统计软件使用指南第1版广州:广东人民出版社.1999.259.4.SPSSInc.SPSS8.0forWindows.USA.SPSSInc:1997.(200004-24收稿200012-16修回蔡天德编辑张亚莲校对) #CHINAPUBL/CHEALTHVol.17No.8A200/中国公共卫生2001年第17巻第8期1995-2004TsinghuaTongfangOpticalDiscCo.Ltd.AUrightsreserved.1995-2004TsinghuaTongfangOpticalDiscCo.、Ltd.Allrightsreserved. #C

15、HINAPUBL/CHEALTHVol.17No.8A200/中国公共卫生2001年第17巻第8期1995-2004TsinghuaTongfangOpticalDiscCo.Ltd.AUrightsreserved.1995-2004TsinghuaTongfangOpticalDiscCo.、Ltd.Allrightsreserved.:1001-0580(2001)08-0748-01天水市79例聋哑学生致残因素调查甘肃省天水市卫生防疫站(741000)李建国熊志军李娟:R195.4:B1999年11月至2000年1月对天水市聋哑学校的全体聋哑学生进行了一次聋哑因素调查。现报吿如下。调查

16、对象为天水市聋哑学校的79名聋哑学生。根据可能的致聋因素设计制定了调查表和填写说明提出要求由老师和家长协助学生认直填写。在校学生男生占63.29%.女性占36.71%.年龄范围618岁。(1)听觉障碍(失听)出现时间:先天性失听3例.占3.8%;出生16个月发生失听8例.占10.13%:出生6个月至1岁期间失听发病率较高.共16例占20.25%;2岁期间为儿童发生失听的高峰期共39例,占4937%:此后随年龄增长可能由于儿童的自身免疫力和抗病力増强发生失听人数显著减少发病率明显降低。34岁发生11例占13.92%:5岁后仅发生2例,占2.53%。先天遗传因素:在被调查的79例聋哑学生中其亲族中

17、有先天性聋人4例占5-06%;另有2例其父母为姨表亲结婚。这说明近亲结婚致先天性聋哑的可能性较大。至于该病是否有家族遗传性还待进一步研究探讨。(3)孕妇傩康因索的影响:母孕期患病21例,占26.58%:使用过可能致聋药物者30人次。其中使用链霉素药物者15人次,占50%;使用青霉素药物者10人次占33.3%:使用镇静剂药物者3人次占10.00%;使用庆大霉索药物者2人次.占6.67%0经随访发现有3人母孕期患精神病.长期胆用镇静剂(氯丙嗪、苯巴比妥)等药物结果所生孩子在半年内均发生失听。(4)后天致聋疾病因素:79例聋生中出生后因患各种疾病可能致失听者53例占总例数的67.09%o其中不明高热

18、者26例,占49-06%;/Jx儿肺炎者10例占18.86%:胸膜炎5例,占9-43%:腮腺炎3例,占5.66%:中耳炎2例占3.77%:麻疹2例,占3.77%冰痘3例,占5.66%;肺结核2例.占2.77%0该结果说明.以上这些疾病是儿童致聋不可忽视的因素。药物因素:在79例聋生中有70例曽因患各种疾病而使用过氨基糖貳类抗生素及其他可能具有耳毒性的药物治疗.占88.61%。其中使用链霉素药物者39例,占55.71%:使用青霉素药物者22例.占31.43%;使用庆大霉素药物者8例.占11.43%:使用卡那霉素药物者1例占1.43%。(I)加强耳毒性药物使用的管理工作。临床医师要提高责任心治疗时应充分考虑各种药物的不良反应和毒副作用.并采取积极的预防和缓解措施。对有毒副作用的药物能不用时尽量不用争取选择疗效好毒副作用小的药物非用不可时要积极观寮随时注意毒副作用的出现及时采取缓解措施o(2)加强儿童预防保健工作。(3)认直宜传学习和贯彻落实婚姻法。严禁近亲族结婚.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论