版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、关于英超球队的分析 摘要:欧洲足球联赛11/12赛季终于落下帷幕,几家欢喜几家愁。蓝军切尔西最终捧得欧冠冠军,西甲豪门巴萨被他们斩于马下。有人说切尔西用钱堆出来的,算不上豪门,也正因为切尔西的崛起,改变了英超传统豪门的格局,曼联,利物浦,阿森纳,传统豪门,而切尔西仿佛更像是一个暴发户,但是不管用如何,需要用数据来说话。本文先进行聚类分析,选出第一梯队的球队,进行分析,运用主成分分析,因子分析选出对结果影响的主要因素。再选近五年成绩看看近两年切尔西是否保持着第一集团。本文数据来自网易的国际足球数据库主要用20112012年度,包括20支球队:曼城,曼联,阿森纳,托特纳姆,切尔西,纽卡斯尔,诺维奇
2、,埃弗顿,布莱克本,富勒姆,利物浦,博尔顿,桑德兰,西布朗,斯旺西,女王公园巡游者,维甘,狼队,阿斯顿维拉,斯托克城。(见附表一)关键词:强队,豪门,分类正文: 如今处在信息化社会,任何理论都要有数据的支持才能站得住脚,在足球中,进球仿佛成了一支球队是否是强队的有力依据,但不要忘了,射门次数,射正次数,角球,犯规,传球成功率,抢断成功率,黄红牌,控球率。只有把这些综合考虑进去才会得出最综合的答案。聚类表阶群集组合系数首次出现阶群集下一阶群集 1群集 2群集 1群集 217820887.680003261421580.5100010371833429.0301010451134171.79000
3、115121635449.500007631551101.8500087121992441.5905012813100836.445069912174877.90780151067289694.11523131145366364.6550415121213395278.347701413617614152.36810016149121762278.4000121615142279144.7729111716693675296.917131418171107034957.266150191862012594604.89416019191636440659.46517180通过上述聚类过程,得出了
4、下面的分类的树状图。 从树状图中我们可以看出分成五类比较好。群集成员案例5 群集1:曼城 12:曼联 13:阿森纳 14:托特纳姆 15:切尔西 16:纽卡斯尔 27:诺维奇 28:埃弗顿 29:布莱克本 310:富勒姆 411:利物浦 112:博尔顿 313:桑德兰 314:西布朗 215:斯旺西 116:女王公园巡游者317:维甘 218:狼队 219:阿斯顿维拉 320:斯托克城 5从图片中看出类别球队球队数量第一类曼城,曼联,阿森纳,托特纳姆,切尔西,利物浦,斯旺西7第二类纽卡斯尔,诺维奇,埃佛顿,西布朗,维甘,狼队6第三类布莱克本,博尔顿,桑德兰,女王公园巡游者,阿斯顿维拉5第四类富
5、勒姆1第五类斯托克城1从分类结果显示出强队中除了曼联,利物浦和阿森纳。也有了曼城,托特纳姆热刺,斯旺西以及切尔西的的加入,使得英超比西甲多了观赏性。西甲的防守过于孱弱,不堪一击,两大豪门皇家马德里和巴塞罗那过于强大,联赛缺乏竞争力。也许这正是近些年英超球迷越来越多的原因吧。anova平方和df均方f显著性进球组间3209.9784802.4946.933.002组内1736.22215115.748总数4946.20019半场组间541.7004135.4257.373.002组内275.5001518.367总数817.20019失球组间2355.9784588.9945.233.008组内
6、1688.22215112.548总数4044.20019射门组间169061.394442265.34938.536.000组内16451.556151096.770总数185512.95019射正组间31622.16147905.54047.087.000组内2518.38915167.893总数34140.55019角球组间31207.30047801.82519.884.000组内5885.50015392.367总数37092.80019犯规组间12631.49443157.8742.673.073组内17721.056151181.404总数30352.55019传球组间1.734
7、e844.335e735.812.000组内1.816e7151210564.470总数1.916e819传球成功率组间458.9434114.73617.789.000组内96.749156.450总数555.69219抢断组间17366.33344341.5831.746.192组内37306.667152487.111总数54673.00019抢断成功率组间45.437411.3595.174.008组内32.929152.195总数78.36619越位组间3717.4504929.3623.316.039组内4203.50015280.233总数7920.95019黄牌组间511.53
8、34127.8831.798.182组内1066.6671571.111总数1578.20019红牌组间25.97846.4941.940.156组内50.222153.348总数76.20019控球率组间639.1364159.78433.361.000组内71.842154.789总数710.97819通过上面这个分析表可以看出分组情况非常好,至于抢断,黄红牌的p值比较大的原因恐怕是因为足球是一个团体项目,再强亦或者再弱的球队抢断这一项的数据都不会差很多。而红黄牌随着比赛向技术流发展,大动作的犯规或者恶意犯规已经减少,各队差异不太大。 通过上述报告,从这十项技术统计中可以看出,处在第一梯队
9、的六支球队的进球率明显高于其他球队,从这方面体现出了强队应有的成绩。与此同时在防守方面失球率也是明显低于其他球队,最少的也有八个球。射门次数,射正次数也更是多余其他队伍大约100次之多,强队不是吹出来的,靠技术说话,让人不得不服。而传球和传球成功率这两项数据也是更好地说明了球星的作用,好的中场球星能够起到穿针引线的作用,使整支球队进攻更流畅,也更富想象力。强队是技术流,是球星的作用,更是想象力的天堂。而足球比赛充满偶然性,充满机遇,只有丰富的想象力才能获得精彩的结果。通过判别分析来验证一下分组是否合理:按照案例顺序的统计量案例数目实际组最高组第二最高组判别式得分预测组p(dd | g=g)p(
10、g=g | d=d)到质心的平方 mahalanobis 距离组p(g=g | d=d)到质心的平方 mahalanobis 距离函数 1函数 2函数 3函数 4pdf初始111.90441.0001.0414.0002712.77947.0081.573.172-.834211.32641.0004.6444.0003007.25649.6972.023.945-.758311.20641.0005.9114.0002694.96347.281-.793.712.796411.51741.0003.2494.0002747.20947.668.561-.870-1.635511.98241.
11、000.4064.0002778.79147.6781.354.799-.726622.13541.0007.0264.000265.338-12.334.642-1.3892.765722.54641.0003.0684.000151.489-10.198-2.132-1.346.605822.47941.0003.4944.000171.893-9.446-1.355-1.9312.444933.43341.0003.8095.000191.789-43.337.6201.9161.02710441.00041.000.0002.000189.475-3.262-11.690-2.322-
12、2.7211111.71641.0002.1064.0002833.22547.9022.352.609.3841233.56141.0002.9795.000173.008-44.1002.1652.639-1.5421333.20541.0005.9205.000241.277-43.585.5734.636-1.9301422.34041.0004.5254.000191.077-12.104-2.663-.0182.3871511.97841.000.4554.0002776.91547.7171.255-.320-.1801633.35441.0004.4025.000240.429
13、-41.482.9103.020.4241722.97641.000.4724.000186.570-10.445-1.090-.3231.5921822.82641.0001.5064.000190.575-10.373-.913.2101.4561933.28841.0004.9895.000164.531-43.243.481.668-1.82920551.00041.000.0003.000197.787-51.0446.128-7.804-1.724交叉验证a111.000141.00048775.7304.000155009.536211.000141.000713.0794.00
14、048442.460311.000141.0002778.3082.00012739.133411.000141.00050.5484.0002624.598511.000141.00080.6384.0002612.445622.000141.0003294.4013.00020459.264724*.000141.000772.6102.0002104.281824*.000141.000185.5822.0001175.802933.000141.000128.8015.000206.1461042*.000141.000189.4753.0001778.5671111.000141.0
15、00582.7192.0004003.6501235*.000141.000178.4523.000304.2671333.000141.000100.8955.000672.0961422.000141.00075.5274.000215.1781511.000141.000642.9094.0002692.6941633.000141.000276.6615.0001439.5311724*.000141.000730.8482.0001072.0841822.000141.000397.2284.000443.4261935*.000141.000234.9423.000255.4712
16、053*.000141.000197.7872.0001734.696由上表,我们可以看出分组无误。分类结果b,caverage linkage (between groups) 预测组成员合计12345初始计数17000072060006300500540001015000011%1100.0.0.0.0.0100.02.0100.0.0.0.0100.03.0.0100.0.0.0100.04.0.0.0100.0.0100.05.0.0.0.0100.0100.0交叉验证a计数17000072030306300302540100015001001%1100.0.0.0.0.0100.02
17、.050.0.050.0.0100.03.0.060.0.040.0100.04.0100.0.0.0.0100.05.0.0100.0.0.0100.0a. 仅对分析中的案例进行交叉验证。 在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。b. 已对初始分组案例中的 100.0% 个进行了正确分类。c. 已对交叉验证分组案例中的 65.0% 个进行了正确分类。由上表说明,100%的判别率证明上述得出的聚类的结果分类成功。下面通过主成分分析欲找出其主要作用的几个成分。kmo 和 bartlett 的检验取样足够度的 kaiser-meyer-olkin 度量。.490
18、bartlett 的球形度检验近似卡方250.709df91sig.000取样足够度的 kaiser-meyer-olkin 度量才达到了0.49说明不太适合做主成分分析,但是sig值小于0.000说明可以做主成分分析。解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %16.60647.18747.1876.60647.18747.1875.89942.13742.13721.76112.58259.7691.76112.58259.7691.83113.07955.21631.60311.44971.2181.60311.
19、44971.2181.66011.85667.07241.0527.51278.7301.0527.51278.7301.41110.07877.1505.9746.95685.686.9746.95685.6861.1958.53685.6866.7015.00490.6907.3952.82193.5118.3432.45195.9629.2912.07698.03810.1631.16599.20311.060.43299.63512.031.22199.85513.017.12299.97814.003.022100.000提取方法:主成份分析。通过解释的总方差可以看出第1,2,3,4
20、,5成分对结果影响很大。其中第一个主成分的特征根为6.606,占总特征根的的比例(方差贡献率)为47.187%,而前五个主成分方差贡献率的和为85.686%。这表示第一个主成分解释了原始15个变量85.686%的信息,可见第一个主成分对原来的15个变量解释的已经很充分了。而下面这张碎石图也很好地证明了这一观点。成份矩阵a成份12345射正.948.038.206.041-.141传球.928-.079-.178-.051-.188射门.922-.004.205.262-.112传球成功率.895.004-.166-.136-.241进球.855-.076.273-.193-.100半场.847
21、-.153.229-.317.033角球.840-.078.101.291.078失球-.730-.277.115.043-.352抢断成功率.230.781.178-.086.034越位.374.560-.220.513.352红牌-.086-.555.518.538-.048犯规-.359.305.691.148-.011黄牌-.335.352.660-.305-.048抢断.260-.438.219-.247.760提取方法 :主成份。a. 已提取了 5 个成份。通过上面的成分矩阵可以列出:y1=0.948x1+0.928x2+0.922x3+0.895x4+0.855x5+0.847x
22、6+0.840x7-0.730x8+0.230x9+0.374x10-0.086x11-0.359x12-0.355x13+0.260x14y2=0.038x1-0.079x2-0.004x3-0.004x4+0.943x5+0.842x6-0.375x7+0.946x8+0.910x9+0.248x10+0.209x11+0.353x12-0.339x13-0.080x14y5=0.948x1+0.842x2-0.741x3+0.916x4+0.943x5+0.842x6-0.375x7+0.946x8+0.910x9+0.248x10+0.209x11+0.353x12-0.339x13-
23、0.080x14运用manova分析:多变量检验b效应值f假设 df误差 dfsig.截距pillai 的跟踪1.0003044.123a15.0005.000.000wilks 的 lambda.0003044.123a15.0005.000.000hotelling 的跟踪9132.3693044.123a15.0005.000.000roy 的最大根9132.3693044.123a15.0005.000.000a. 精确统计量b. 设计 : 截距因为wilks lambda 的sig 值0.00小于0.05 拒绝原假设,差异显著 经过同样的处理方法处理了2010到2011赛季的数据得出
24、如下结论:(数据详见附表二)在这次分组中,分成2到5组,无论如何切尔西均出现在第一集团。可见切尔西一直处在强队之列。经过这两年的比较也可以看出,处在第一集团的球队由三支增加到了7支。这也从侧面反映了英超的精彩度在增加。英超已不是过去的英超,同样西甲亦不是过去的西甲。每个联赛都在吸收其他联赛的优势。当你还沉迷于过往时光时,世间变换迅速。仅仅经过一年的时间,英超就已经有了如此巨大的变化。现如今也不用去谈到底是不是暴发户的问题,有了资本的投入,才会有好的球员,才能踢出精彩的比赛。有了一个好的开端,才会使一支球队向着更好的方向走下去。那些传统豪强门之所以成为豪强只不过是资本的投入早,让他们有了好的球队
25、的精神。让他们能够一直延续下去。2012年的欧冠,我们看到了铁血的切尔西,他们用顽强拼搏,用不放弃,用他们的激情,他们对足球的热爱书写了历史的新篇章,华丽的巴萨不是不可战胜,只要这支球队有自己的队魂,有这种精神!那么肯定胜多负少,豪门也许就是经过了这些过程,他们很早就留下了这些传统罢了。但足球同时也要拼运气。切尔西欧冠冠军,让他们也迈入了豪门的队列。豪门都是由强队的转换,强队则是由背后一串串数字来做推动力,让大家信服的数字。本文就足球的一些基本数据简单的分析了强队的必要条件,也证明了自己喜欢的球队切尔西,真的是强队,豪门!无可争议,因为有数据!附表一:球队场次进球半场失球射门射正角球犯规传球传
26、球成功率抢断抢断成功率越位黄牌红牌控球率曼城389330297382502694302170783.50%69473.90%8551558.20%曼联388940336462432793892120282.30%80375.20%8951157.80%阿森纳387434496372372624062149282.00%75074.50%8864460.20%托特纳姆386630417012302843752041282.30%73174.30%9343356.70%切尔西386529466712242544291973882.00%69877.70%7074455.80%纽卡斯尔3856285
27、14891541724091536874.20%74473.90%9767247.30%诺维奇385224665141641674051602873.40%69271.40%7458346.80%埃弗顿385018405201641804811594074.40%62478.20%11661248.00%布莱克本384821784531431664581303570.30%69075.10%5866541.80%富勒姆384820515411951883771831779.90%66977.10%8554049.40%利物浦384722406672073094021989677.70%7287
28、3.80%12853555.50%博尔顿384620774951632104631434969.10%73273.10%5550546.60%桑德兰384520464581411804101477771.70%82476.10%7659444.60%西布朗384520525441672134221547474.30%68276.40%12748145.80%斯旺西384421514721452033182151283.50%70972.10%6740258.00%女王公园巡游者384319665391501954091418171.50%76472.40%8354945.10%维甘384220
29、625191622104851646177.80%72873.40%7167350.20%狼队384017824731522073751585173.30%61975.40%8264448.20%阿斯顿维拉383717534381382184131399270.10%77475.60%8570243.90%斯托克城38361453376941664511164366.30%65570.70%6260240.30%附表二:球队场次进球半场失球射门射正角球犯规传球传球成功率抢断抢断成功率越位黄牌红牌控球率曼联387834376182122454231987578.40%69375.60%10256356.20%阿森纳387234436542382534532107881.00%77274.10%9365660.40%切尔西3869
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论