![多元回归分析应注意的两个问题_第1页](http://file4.renrendoc.com/view/ceddb107c90a34733de430a7d8c70712/ceddb107c90a34733de430a7d8c707121.gif)
![多元回归分析应注意的两个问题_第2页](http://file4.renrendoc.com/view/ceddb107c90a34733de430a7d8c70712/ceddb107c90a34733de430a7d8c707122.gif)
![多元回归分析应注意的两个问题_第3页](http://file4.renrendoc.com/view/ceddb107c90a34733de430a7d8c70712/ceddb107c90a34733de430a7d8c707123.gif)
![多元回归分析应注意的两个问题_第4页](http://file4.renrendoc.com/view/ceddb107c90a34733de430a7d8c70712/ceddb107c90a34733de430a7d8c707124.gif)
![多元回归分析应注意的两个问题_第5页](http://file4.renrendoc.com/view/ceddb107c90a34733de430a7d8c70712/ceddb107c90a34733de430a7d8c707125.gif)
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、体育科研中运用多元回归分析时应注意的两个问题回归分析是研究变量之间的相关关系的一种数理统计方法。在体育领域中存在着大量 多因素(变量)的问题。所以,近年来体育科研中多元回归和逐步回归分析方法运用得越来 越多了。回归分析主要可用于解决下列问题:(一)确定几个变量之间是否存在相关关系。如果存在,则找出它们之间合适的数学 表达式一一回归方程。如在体质研究、运动员选材研究中为了研究各项形态、机能、素质指 标之间的相关关系,常常通过大样本统计数据计算各指标之间的相关系数rij,并建立各指 标之间的回归方程。如1979年全国体质调研后建立了 1825岁男青年的身高、体重对肺活量 的二元回归方程:Y = 2
2、708 + 27.89X1 + 35.56X2(肺活量)(身高)(体重)(二)根据回归方程用一个或几个自变量的值预测或控制另一个因变量的取值。对于 一些不容易测的指标,可以通过建立回归方程用几个比较容易测的指标来推测它的估计值。 如果自变量选得恰当,这样的回归方程是很有实用价值的。如北京体院高强等人研究建立了 推测快肌纤维百分比的三元回归方程:Y=5.90+35.53 X1 + 18.2 X2 一 6.41 X3(快肌)(相对肌力)(MPE %) (IEMG)只要进行肌肉力量和肌电图的几项测试,就可以实现肌纤维成分的无损伤测定。(三)进行因素分析。当许多个变量(因素)都对某一个变量有影响时,可
3、以通过回归 分析找出其中哪几个是重要因素,哪几个是次要因素。如对田径十项全能世界级优秀运动员 的十项全能总分和十个单项成绩进行逐步回归计算,从中可筛选出四个比较重要的项自是: 400米、铅球、110米栏、跳高。有的研究还根据多元回归方程的系数bi。或标准回归系数 b i来确定各指标的“权重”。但是,近来在运用多元回归和逐步回归的研究论文中也出现了一些对回归分析的运用条 件注意不够的问题。一、样本含量n和自变量个数k之间的关系问题复相关系数R是检验多元回归方程效果的重要指标。一般讲,R越接近1即表示回归方 程的效果越好。因此当计算的结果R值接近1时,有些作者就立即认定计算结果十分理想。 如“广东
4、省少体校游泳运动员因素分析与运动模型,(1983年全国体育统计报告会论文) 一文中,男1516岁组自由泳成绩与形态机能指标的十元回归方程R=0.999,十三元回归 方程R=1。又如“对男女优秀篮球运动员五大关节活动幅度与运动成绩逐步回归的探讨” (体育科学86年1期)一文中,辽宁男篮队员运动成绩与四项关节活动幅度建立的四元回 归方程R=0.995,辽宁女篮队员运动成绩与七项关节活动幅度建立的七元回归方程R=l。 作者都认为回归方程十分理想,并根据回归方程作了进一步的分析和结论。但是,再看回归 方程中各个指标与因变量(Y)的相关系数则发现有许多指标和Y是不相关的(p0.05)。 可见,R接近1的
5、原因并不是这些指标和Y相关程度极高,而是作者用于计算的样本n太小(游泳一文n=15,篮球一文n=10)。在体育统计方法及一些数理统计书中,都指出:复相关系数R与多元回归方程中自 变量的个数k及样本含量n有关。当n相对于k并不很大时,常有较大的R,当n=k+1时, 即使这k个自变量与Y并不相关,也会R=1。如设变量Y与另外K个变量X1, X2Xk的内在联系是线性的,它的第a次测试 数据是:(Ya, Xa1, Xa2,Xak)a=1,2,,n则这一组数据可以有如下的结构式:Y1 = p 0+8 1X11 + 8 2X12 + + 8 kX1k+& 1Y2 = p 0+8 1X21 + 8 2X22
6、 + + 8 kX2k+& 2Yn=8 0+8 1Xn1 + 8 2Xn2 + 8 kXnk+& n其中:8 0,8 1是K+ 1个待估计参数,X1,X2,Xk是K个可以精确测得 的变量,& 1,& 2,& n是n个相互独立且服从正态分布N (0,6 )的随机变量,这就 是多元回归的数学模型。把它写成矩阵形式:Y = X8 +g用最小二乘法原理,建立正规方程,可解出bo,bl,bk。它们是参数8 0,8 18 k的最小二乘估计,则多元回归方程为:Y=bo+b1X1+b2X2 + +bkXk计算bo, b1, b2,,bk时要计算下列四个矩阵:X,A,C,B其中:X是n组侧试数据Ya的结构矩阵,
7、A=XX是正规方程组的系数L ij矩阵,C=A-1是系数矩阵A的逆矩阵,B是正规方程组的常数项Liy矩阵。多元回归的系数b=A-1 B.可见,多元回归方程的系数bi的解是和所侧得的原始数据的 组数(样本含量)n紧密相系的。可以推导出:当n=k + 1时,结构矩阵X是方阵,这时解 出的bi,即使X,和Y全都不相关,仍可以得到:Q=E(Y-Y)=0亦即:U=Z bi Lij=Lyy所 以 R=sqrt(U/Lyy) = 1。为了用计算实例来说明以上的理论推导,我们随机抽取了 K=34, n=10的一个样本。其 中大部分X和Y是不相关的(即r iy的值,经检验为P0.05)。选取其中9个和Y不相关
8、的X作九元回归计算,riy最小的为一 0.011,最大的为0.471,均为P0.05,计算结果见表1, 虽然每个X的偏回归平方和Pi作F检验时,都是P0.05,但复相关系数R=0.9999975。 把多元回归的X增加到15,20和34个时,R值分别为:0.9999891,1.000009,1.0000830 可见当样本含量n太小与自变量个数K的比例不恰当时,解出的bi是不能正确地反映各自 变量和Y之间的内在关系的。如果用这样的多元回归方程为依据去分析和作结论,就一定会 产生谬误。表1:K =9n=10的多元回归计算结果ib iP iF iR iyB iXLiy0-60.3588910.3407
9、0091.0238856.017856 E-39-0.094-2.16617621.5172844.2104442.474677 E-38-0.32926.61042032.0023413.5692782.097833 E-38-0.011-1.65717340.25529280.05146970-0.201-0.25325035-6.1716812.0577761.209452 E-380.148-16.4932261.6205042.745021.613378 E-380.47112.784167-0.080389620.052341800.068-0.245107881.8359661.
10、78691.050245 E-380.0654.71669-2.2152762.4977591.468051 E-380.16013.23939R=0 .9999975Lyy= 10.05696U= 10.05692有的数理统计专著上提出:n应是K的510倍,这是我们在计算时应特别注意的问题。体育科研中,特别是研究优秀运动员的时候,样本含量一般都比较小。而希望分析与专 项成绩有关的指标时,又常常取许多个Xi,所以,K和n的比例常是一个大问题。我们认为:在运用多元回归分析时,首先应尽可能地扩大样本含量n,特别要注意n与 K的比例。其次,在算出多元回归方程后,不仅要看R值的大小(或对方程作方差分析
11、后的 F值大小),还必须仔细看一下每个自变量的Pi的F检验结果,以决定这个方程是否具有实 用价值。二、自变量之间相关的问题在体育科研中常常运用多元回归或逐步回归来进沂因素分析。即从许多个自变量Xi中 分析哪几个是影响Y的主要因素,哪几个是影响Y的次要因素。按照回归分析的原理,在多元回归中,回归平方和U是所有自变量对Y变差(波动)的 总贡献。在原有的自变量中减去一个自变量后,U就会减小,减小的数值越大,就说明这个 自变量对Y的作用越大。所以,把取消一个自变量后,回归平方和U减少的值称为:Y对这 个自变量的偏回归平方和Pi。但是,通常情况下由于自变量之间互相存在着相关关系,所 以E Pi尹U,只有
12、当各自变量之间的相关系数rij=0即正规方程的系数矩阵为对角阵(除主 对角线元素L11,L22,Lkk外其余元素全为0)时,才有U=E Pi。通过计算偏回归平方和Pi后可以作比较,Pi值越大的自变量对Y的作用就越大。如果 Pi经F检验为P0.05,就可认为它对Y的影响不显著。但是,这样用Pi来进行比较的前提是:各自变量之间的相关程度应该很小,即r ij的绝对值都不大,其分析结果才正确。可是,体育科研中对许多指标作回归分析时,往往自变量之间的相关程度都很高。如以 100米跑成绩为Y,分析各项形态、机能、素质指标和100米跑成绩之间的关系时,形态指标 中的身高、指距、下肢长这类长度指标之间的rij
13、都在0.8 一 0.9左右,体重和胸围、 上臂紧张围、大腿围等围度类指标之间的rij约在0.8-0.9之间,素质指标中30米跑、 立定跳远、纵跳之间的rij也在0.7 7左右。如果计算者不注意自变量之间的相关性的 问题,按计算的结果下结论,也会出现错误的。因为,假设在一个多元回归中,X1和X2对Y的影响都很大,但是它们之间高度相关。 由于X1对Y的影响中很大部分可以从X2对Y的影响中反映出来,这时如从回归方程中减去 X1,U并不会减小很多,即P1的值一定不大,同样的理由,P2也不会很大。因此,这时看 P1、P2的值就不能正确地反映出X1, X2对Y的重要性。我们在一次四元回归计算中遇到这样一个
14、实例(n=31),四个变量和Y之间的相关系数 如表2:由表2可见,X1与X2的相关系数r12=0.949呈高度相关,而其他Xi之间不仅相关系数rij的绝对值较小.而且P0. 05,即相互之间相关不显著。再看表上r3y=0.245 (P0. 05),即X3与Y相关不显著。但做四元回归计算出的Pi (见表3),P2VP3而且对 P2作F检验,F:=0. 528( P0.05),似乎可得出结论X2对Y的影响比X3小,而且由于 经F检验不显著应把X2剔除。表2X 2X 3X 4YX 10.949 *0.151-0.120-0.499 *X 20.188-0.099-0.434 *X 30.1900.245X 40.741 *注:*为 PV0.01* 为 PV0.05表3四元三元P 10.9330939P 20.10691123.364034P 30.63685670.7613853P 48.620649.039985当我们考虑到X1和X2之间高度相关,而把X1剔除后再作三元回归计算(见表3),P2 就大大地增大为3.364034不仅F检验结果PP3说明X2比X3的作用更 大些。同时从表3上还可以看出,在四元回归中P1、P2都小于1,远比三元回归中的P2小。 这个实例可以让我们更加理解回归分析原理中关于:自变量之间的相关性会给因素分析带来 麻烦的阐述。我们
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度铝合金门窗行业供应链合作协议书3篇
- 2025版离婚子女房产分割与抚养费支付执行协议书
- 2025年度绿色装修材料认证采购合同
- 2025年度生态公园防水工程劳务分包合同
- 2025年第三方健康机构合作协议书
- 2025年碳硫分析仪合作协议书
- 前台文员的礼仪与形象塑造计划
- 多样化评价方式的探索计划
- 职业发展规划思路计划
- 班主任如何引导学生养成良好的学习习惯计划
- 2024-2025学年第二学期开学典礼-开学典礼校长致辞
- 生物(A版)-安徽省合肥一中(省十联考)2024-2025学年度高二年级上学期期末测试试题和答案
- 苏教版四年级数学下册第三单元第二课时《常见的数量关系》课件
- 2025年中考物理总复习《压强》专项测试卷含答案
- 《智能传感器技术》课件
- SaaS服务具体应用合同范本2024版版
- 山东省潍坊市2024-2025学年高三上学期1月期末 政治试题(含答案)
- 2025-2030年中国旅居康养行业全国市场开拓战略制定与实施研究报告
- 知识产权培训内容课件
- 食品检验员聘用合同样本
- 2025年幼儿园年度工作总结及工作计划
评论
0/150
提交评论