因子分析-王振乾.docx_第1页
因子分析-王振乾.docx_第2页
因子分析-王振乾.docx_第3页
因子分析-王振乾.docx_第4页
因子分析-王振乾.docx_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于因子分析法分析影响NAB洛杉矶湖人队2009-2010赛季季后赛成绩的主要因素 2010级信息管理 王振乾摘要:该文首先简介了因子分析理论及分析步骤,然后通过使用SPSS 统计软件对NBA洛杉矶湖人队2009-2010赛季季后赛成绩进行因子分析,分析球队各项数据统计,从而挖掘出影响球队成绩的主要因素,进而帮助球队在以后的比赛中取得更好的成绩。关键词:湖人队 因子分析法 数据统计 成绩一、 引言球队成绩分析是整个比赛过程的一个重要环节。它对于教练来说是一件必须要做的事情,但是它也是一件复杂的事情。每个赛季教练都能获得很多球队和队员的数据,那么我们该如何从这些数据中获得对比赛有用的信息呢?我们该怎样从这些数据中挖掘出球队的潜在能力呢?因子分析是研究如何以最少的信息的丢失,将众多的原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的解释性的一种多元统计分析方法。也就是说利用少数的几个公共因子,即挖掘出数据的共性,去解释较多需观测的变量中存在的复杂关系。因此我们可以利用因子分析方法的这一特性来分析球队的各项数据,找出少数隐含的公共因子来解释球队的各项数据,进而分析球队的潜在能力。SPSS是世界上最早的,也是目前最好的统计软件,所以我们使用SPSS这一统计软件来对球队成绩进行因子分析。2010年NBA季后赛是NBA2009-10常规赛季之后进行的锦标赛。季后赛从2010年4月17日开始。经过23场比赛的鏖战,西部联盟冠军洛杉矶湖人队(Los Angeles Lakers )最终在总决赛中以4-3战胜了东部联盟冠军波士顿凯尔特人队(Boston Celtics),成功卫冕。二、 因子分析我们观测的变量之间往往存在相关性,那么变量之间为何会有相关性呢?这是因为往往有一些共同的因子支配着这些相关的变量。例如,随着年龄的增长,儿童的身高、体重会随着变化,具有一定的相关性;身高和体重之间为何会有相关性呢?因为存在着一个同时支配或影响着身高与体重的生长因子。那么,我们能否通过对多个变量的相关系数矩阵的研究,找出同时影响或支配所有变量的共性因子呢?因子分析就是从大量的数据中“由表及里”、“去粗取精”,寻找影响或支配变量的多元统计方法。因子分析正是基于信息损失最小化而提出的一种非常有效的方法。它把众多的指标综合成几个为数较少的指标,这些指标即因子指标。因子的特点是:第一,因子变量的数量远远少于原始变量的个数;第二,因子变量并非原始变量的简单取舍,而是一种新的综合;第三,因子变量之间没有线性关系;第四,因子变量具有明明解释性,可以最大限度地发挥专业分析的作用。因子分析是把每个原始变量分解成两个部分:一部分是由所有变量共同具有的少数几个因子构成的,即所谓公共因子;另一部分是仅对某一个变量产生影响,为某一个变量所特有的,即所谓特殊因子。基于这样的假设,相应的因子模型为:设有p个 为可观测的随机变量,每个变量可作如下分解: 上式为因子模型,其中 为公共因子,为特殊因子,(i=1p,j=1m)为因子载荷;数学上可以证明,因子载荷就是第i 变量与第j因子的相关系数,反映了第i变量在第j 因子上的重要性。在因子模型中,公共因子 之间互不相关,特殊因子之间互不相关,都是独立的,相互之间是没有关的。特殊因子与公共因子互不相关。特殊因子与被测原始变量相关。因子载荷 表示了公共因子 对第i个变量的影响程度,即对 的依赖程度。它是变量 在公共因子上的载荷量。所以因子分析是如何从一组原始的观测变量出发,分析出公共因子和特殊因子,并求出相应的载荷矩阵,进而解释各个公共因子的含义。即用于寻找表示这种潜在能力因子的统计方法。因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。因子分析常常有以下四个基本步骤:(1)确认待分析的原有干变量是否适合作因子分析。(2)构造因子变量。(3)利用旋转方法使因子变量更具有可解释性。(4)计算因子变量得分。三、 应用spss软件分析NBA湖人队2009-2010赛季季后赛成绩现使用NBA热火队的上赛季季后赛21场比赛中篮板、助攻、失误、抢断、盖帽、犯规6项数据使用SPSS统计软件进行分析,将篮板、助攻、失误、抢断、盖帽、犯规作为六个变量,也就是因子模型中的可观测的随机变量,具体步骤是:1、 在SPSS 中将数据输入表中。2、 调用主菜单中的 AnalyzeData ReductionFactor命令,打开Factor analysis对话框,如下图所示。将前六个变量移入variables栏中。 3、 在Descriptives、Extraction、Rotatioin和Scores各选项下,如下四图所示的选择,以计算巴特利特球体检验和KMO测度值,选择主成分分析法提取公因子,用特征值法确定因子数目并绘制因子碎石图,用方差最大化方法进行因子旋转,保存因子得分。提交运行,在output窗口查看结果。图1图2 图3图44、 结果分析此表用于判断数据能否进行因子分析。KMO(Kaiser-Meyer-Olkin)统计量检验统计是用于比较观测相关系数值与偏相关系数值的一个指标,其值愈逼近1,表明对这些变量进行因子分析的效果愈好。表格中的第一行为检验变量间相关性的KMO 统计量,数值为0.523,大于0.5,表明可以进行因子分析。第二行为巴特利特球度检验的结果,巴特利特球度检验是以变量的相关系数矩阵为出发点。如果该统计量值比较大,则适合作因子分析,反之则不适合因子分析。从表中的巴特利特球度检验的数据值为15,还是可以进行因子分析。此表是总的方差解释,以主成分分析法作为因子提取方法,选定因子的标准是:特征值1。有两个(篮板和助攻)满足条件的特征值,它们对样本方差的累计贡献率达到了56.103%。虽然没有达到60%的标准,但还是可以进行,因此,提取两个因子便能够对所分析的问题进行解释。如下的因子碎石图也支持了这一结论:此表为成分矩阵,反映六个变量可以主要由两个公因子来解释,即各变量的信息被这两个公因子提取了多少,亦即给出了在因子分析中需要的因子表式。所以根据表中提供的系数可以给出各变量的因子表达式为:(1)X1=0.757x1-0.097x2+1(2)X2=0.458x1+0.328x2+2(3) X3=0.627x1+0.316x2+3(4) X4=0.578x1-0.481x2+4(5) X5=0.597x1+0.534x2+5(6) X6=-0.407x1+0.775x2+6通过这六个表达式,我们可以在假定每场比赛球队的潜在能力相同和估计每一项数据的特殊因子的数值的情况下,计算出每场比赛的六项数据的大概成绩。此表为旋转成分矩阵,通过该系数矩阵就可以将公因子表示为各个变量的线形组合,如:Z1=0.537X1+0.562X2+0.688X3+0.160X4+0.800X5+0.156X6Z2=0.542X1+0.023X2+0.137X3+0.735X4-0.053X5-0.862X6通过上述两个式子,我们可以知道,教练在得到任意一场比赛的数据时,可以直接计算出这两个因子的标准化值,即决定这六项数据成绩好坏的潜在能力的强弱,大概的衡量出球队在该场比赛中这两项数据的所获得的潜在能力的大小。四、结论通过对NBA洛杉矶湖人队2009-2010赛季季后赛六项数据篮板、助攻、失误、抢断、盖帽、犯规使用SPSS 统计软件进行因子分析, 得到篮板、助攻是影响球队成绩的比较重要的因素。同时,我们可以通过因子得分矩阵即能计算出任意一场比赛在这三方面的数据的强弱。也就是说篮板、助攻是打好一场比赛的关键,即潜在能力,所以作为教练在平时训练应该多注意培养队员的这两方面的能力,这样才能达到更好的成绩。当然,本次分析的数据只是选取了一支球队在一个赛季的季后赛数据,具有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论