




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
足球比赛结果预测模型摘要本文建立了一个关于足球比赛结果预测和确定如何下注获利最大化模型。第一问,对于确定X场比赛主队胜平负以及如何下注问题,我们将给定的大量数据(各球员进球、助攻、射门、射正和扑救等数量)进行整合,运用Excel进行统计分析并算出X场比赛主队和其客队的进球能力、进攻能力和防守能力,从而确定主队和其客队的进球期望值,然后运用泊松分布的方法计算出X球队胜平负的概率,确定如何下注。第二问中,预测X场总进球数的概率分布,确定如何下注,根据第一问结论并利用数学软件MATLAB预测出所有可能的X场总进球数的概率分布,选择概率最大的,结合实际历史数据和主客观影响因素确定如何下注。对于第三问,要求预测四场比赛的进球情况,并确定在这四场中如何下注获利最大,首先球队在积分榜上的排名可以较为客观的代表这支球队的实力强弱,其中进球数直接影响球队积分,因此本问通过球队积分排行榜和进球率的相关性预测四场比赛进球情况,利用Excel画出球队进球率与排名散点图和相关性分析确定下注比例。最后一问,要求通过分析赔率对于博彩公司收益的影响并针对问题三,设计合理赔率方案。本文论证严密,运用大量可靠数据对模型进行验证,并对模型优缺点进行了分析。关键词足球预测泊松分布MATLAB进球期望值赔率相关性分析问题的重述与分析问题的重述博彩业发展繁荣,创造了不少富翁,其中福利彩票的中奖可以认为是纯粹的随机数,难以预测。而体彩中一些结果可以人为预测,并根据预测结果下注。结果预测准确与否,关系到金钱的盈亏。足球赔率是博彩公司在其十几年乃至数十年所积累的丰富的、海量的与足球比赛相关数据的基础上,利用科学的数学理论模型,计算得出的对于一场足球比赛所产生某种结果的概率,并使这组数据加以转换得到的一组常人可以看得懂的数据。赔率与足球比赛的结果间存在着必然的联系。博彩公司就是靠预测结果,调整赔率,吸引大家下注来赚取收益的。如果我们比博彩公司预测得更加准确,或者押中冷门,就有可能在其中赚取巨大收益。现在我们所关心的问题就是:根据所给的数据,如何确定各球队胜负平的概率,并确定如何下注。根据比赛的总进球数的概率分布,如何确定下注的分配比率。根据球队历史排名与进球率,如何预测球队未来进球情况,并在下注时获利最大。通过分析赔率对博彩公司收益的影响,如何给出合理的赔率设计方案,在吸引尽可能多的客户的同时,获得最大利润。问题的分析对于一场球赛,结果有胜、平、负三种结果。而比赛结果往往由球队实力高低,主客场,裁判判决公正与否甚至是天气好坏等一些要素相关,导致胜负平的概率不会是1/3;这就要求模型能综合比赛各项因素得出合理的赛果预测。本问题即是一个在历史数据的基础上,通过对数据的整合,如何制定预测模型,确定下注比例并获得最大利润。二、模型的基本假设假设在一个赛季,一名球员的单位进球、进攻、防守能力变化不大比赛主要影响因素是实力和主客场,其结果不受天气等环境影响。球队实力由球队近期战绩决定。比赛结果符合泊松分布。裁判判决公正无黑哨。确定现实中已有伤病球员不上场,所选球员无伤病情绪稳定、发挥正常。三、符号说明a:代表球员单场进球能力。B:代表球员单场进攻能力。Y:代表球员单场防守能力。d1:代表球员单场助攻数。d2:代表球员单场射门数。d3:代表球员单场射正数。d4:代表球员单场扑救数。T:代表球员出场时间。入:代表球队进球期望值。P:代表球队单场获胜概率。Wt:代表某支球队的进球率.Yi:代表这支球队在第i场比赛的进球数四、模型建立4.1:问题一及其求解根据题意,要预测X场比赛中主队的胜平负的概率(即猜胜负平),而球队的胜负平取决于球员的进球以及进攻防守能力,所以应根据附表1计算出主队和客队的综合进球、进攻和防守能力,从而分别得出主队和客队的进球期望值,经过比较确定主队的胜负平的概率,并确定如何下注。(一)、主队进球能力、进攻能力和防守能力的计算根据附表1,用Excel数据处理器对其数据进行整合及计算,分别得出主队和客队的进球能力、进攻能力和防守能力,以球员阿格利亚尔迪为例:将他的单场助攻数d1、单场射门数d2和单场射正数d3相加再除以出场时间T,即可得到单位进攻能力B1。再将单场扑救数d4除以出场时间T,就得到单位防守能力Y1。经过计算得到本场所有球员的单场进球能力a,所有球员的单场进攻能力B以及所有球员的单场防守能力Y,然后将a,B,丫三个数进行算术平均,从而得出单场球队进球期望值入。具体计算如下:利用公式公式一三工od/T+工(dl+d2+d3)/T+》d3/T公式一3*T=0.0196289(注:上式中代入的数据,如0.01962892等参照附录中的表一)(二)、球队胜负平概率的计算为了更为充分合理地说明问题,我们对球队胜负平概率的计算采用泊松分布[5]进行计算,具体计算如下:设在主队进球数为y1的概率为P{goal二y1}=(e"(-入1)*入1"y1)/y1!其中y1取[0,7]整数客队进球数为y2的概率为P{goal=y2}=(e"(-入2)*入2^y2)/y2!其中y2取[0,7]整数则两队比分为y1,y2的概率为P(y1:y2)=(e"(-入1)*入「y1*e"(-入2)*入2"y2)/y1!*y2!其中y1,y2取[0,7]整数,如果y1>y2,则主队胜客队y1=y2,则两队战平
yl<y2,则客队战胜主队易知,当0〈二y〈=7比赛结果有49种,则主队胜的概率为P(yl>y2)=刀(e“(-入1)*入1"y1*e"(-入2)*入2"y2)/yl!*y2!其中y1,y2取[0,7]整数平局的概率为P(y1=y2)=刀(e“(-入1)*入1^y1*e"(-入2)*入2^y2)/y1!*y2!其中y1,y2取[0,7]整数客队胜的概率为P(y1<y2)=刀(e“(-入1)*入1"y1*e"(-入2)*入2^y2)/y1!*y2!其中y1,y2取[0,7]整数以2014至2015年度意甲联赛中,维罗纳和尤文图斯的数据带入,运用泊松分布模型预测两队交锋时赛果的概率。如附录1所示,将数据带入公式由数学软件matlab计算可得主队胜的概率P1=0.5801两队平的概率P2=0.2167主队负的概率P3=0.2022综上所述,由泊松分布得出主队胜平负的概率,经过比较可知,主队胜出的可能性最大,因此人们应该选择买主队胜利的彩票。4.2:问题2的求解问题2为预测X场比赛总进球数的概率分布并确定如何下注,首先由附表1的数据和问题1的结论出发,经分析可以清楚地知道这两题思路相同,即在第1题matlab程序代码基础上增加一条输出语句后,我们能够直接清晰地得到X场比赛中主队和客队每种可能比分情况以及它们所对应的概率:p1=0.09451:0p1=0.09282:0p1=0.09932:1p1=0.0607p1=0.09932:1p1=0.06073:0p1=0.0650p1=0.06503:1p1=0.02984:0p1=0.01714:2p1=0.01175:p1=0.00675:p1=6.3953e-0045:p1=0.00416:p1=7.8189e-0046:p1=4.4788e-0056:p1=0.00117:p1=2.1925e-0047:p1=1.2559e-0057:p1=0.03483:2p1=0.03194;1p1=0.00614:3p1=0.01255:1p1=0.00245:3p1=0.00386:0p1=0.00226:2p1=2.0922e-0046:4p1=0.00117:0p1=6.1453e-0047:2p1=5.8668e-0057:4p1=2.2404e-0067:6经过比较,当主队维罗纳获胜时,二者比分为2:1概率最大的,此时Pl(yl,y2)=刀(e“(—入1)*入1"yl*e"(—入2)*入2"y2)/yl!*y2!=0.0993.所以,应选择下注总进球数为3。4.3:问题3的解决预测X、Y、Z、W四场比赛的进球情况,确定在“4场进球”中如何下注能获利最大。进球率对于比赛结果有着直接的影响效果,进球率的高低是否能够真实反映一支球队实力的强弱。其中球队在积分榜上的排名可以客观代表这支球队实力的强弱。进球率的计算公式[1]如下:Wt=Wt=Yi其中,wt表示某支球队的进球率,Yi表示这支球队在第i场比赛的进球数,i=l,2,3,-n,n为总的比赛场次。对一支球队来说,在整个赛季中它的进球率是相对稳定的。然而漫长的一个赛季中,因为诸多不可预测因素的影响,一支球队不可能永远保持一个同样的竞技状态。而球队近期竞技状态的好坏将直接影响球队的进球率以及胜率,竞技状态好的时候,胜率就高;竞技状态差的时候,胜率就低。所以从整体来看,进球率确实反映了球队的实力,但是却不能反映球队当前所处的竞技状态对比赛的影响,因此我们有必要对进球率的计算公式进行一些合理的调整,将球队近期的状态考虑进去,也就是将球队近期比赛的进球数与原有的进球率结合起来。将球队最近4场比赛的进球数纳入调整后的进球率,得到如下计算[1]公式:Yi+工Yi其中,Wt表示调整后的某支球队进球率,表示这支球队在第i场比赛中的进球数i二1,2,3,…,n,n为总的比赛场次。如图所示:球队总场次总进球数最近4场比赛总进球数进球率预计进球数维罗纳374751.2682926831尤文图斯377071.878048782佛罗伦萨3758121.7073170732切沃372830.7560975611桑普多利亚374651.2439024391帕尔马373140.8536585371都灵364351.21切塞那3736511因此,由预测的X、Y、Z、W四场比赛进球情况,可以确定确定在“4场进球”中应选择单式投注,方能获利最大。4.4:问题4的解决博彩公司事前所设定的赔付率不会随意变动,而变动的是赔率和胜负平概率,跟随其变动的则是凯利指数。由于凯利指数是“变量中的变量”总是随市场赔率和平均概率(平均概率又是随着各家概率高低变动的)不断变动的,就是说凯利指数是能够反映博彩公司的数据的真实趋势和投注资金流量运动。凯利指数首要的作用就是反应将一场球赛做为经济市场各家公司赢利和赔付风险差异的做用,一般来说,认同程度越高的选项,打出可能越大,博彩公司存在的赔付风险越大。而差异越大的选项,则打出可能越小,为博彩公司盈利安全点。有问题3可知,通过分析对阵双方的各种资讯,诸如出场阵容,以往交手战绩,主队主场战绩,客队客场战绩,在联赛中的成绩排位,球队最近的状态斗志,俱乐部的运作情况等等方面因素之后,估算出这场赛事胜,平,负三种结果的概率。根据所得概率确定对应赔率,一般概率高的情况赔率相对较低,而概率低的情况赔率相对较高。假设D=A(1-10%)其中:A:代表博彩公司根据各个球队以往十年历史赔率数据的算术平均数;D:代表根据计算最后得到的赔率。如下表:主队比分客队D胜D平D负都灵础VS啪切塞纳1.953.303.60佛罗伦萨宙VS®切沃2.073.303.40维罗纳孺VS督尤文图斯1.903.303.55桑普多利亚*VS刑帕尔马1.853.353.70五、模型的误差分析
在第一问中,我们运用了Excel数据处理器选取部分历史数据作为基础,进行整合,完成对问题一的解答,但数据具有一定的偏向性,同时数据的基础量不够充足。我们通过分析球员的各项能力确定了一个较为合理的球队进球期望值,创新
性的把数学软件MATLAB引入,并且利用泊松分布对足球比赛结果进行分析预测。六、模型的评价优点:本模型利用历史数据、Excel数据处理器、相关性比较及MATLAB软件对如何预测足球比赛的胜平负和怎样确定下注进行了模拟和验证,结果误差小,数据准确合理。本模型综合应用了多种方法对问题进行求解,如第一问确定X场比赛主对胜平负概率时,应用了两种处理办法,加强了模型的精确性,更令人信服。本模型通过大量的历史数据对问题进行阐述,给人一目了然的感觉。本模型有很好的推广价值。缺点:由于统计资料不够全面,仅有一个赛季的数据,以及对足球赛事了解不深,我们设计预测模型时,各个因素的确定有一定的偏差。第三问的约束条件中,对部分数值的处理是由经验假设而来,具有一定的主观性。七、模型的推广本模型针对足球比赛结果预测和如何下注利润最大化的问题,运用了历史数据、Excel数据处理器、相关性比较及MATLAB软件对如何预测足球比赛胜平负概率和怎样下注进行了求解并通过大量的数据给出结论,非常直观。在博彩业的运营和购买彩票过程中有很强的实用性,此模型同样适用于篮球比赛等运动类赛事结果的预测。八、参考文献阎峰.《利用关联规则对足球赔率进行数据挖掘的研究》../KCMS/.2015年5月24日.黄晓雯.《足球博彩市场建模及市场有效性假说检验》.专题研究.2015年5月24日.宗松.《竞彩足球投资策略分析》./.2015年5月24日.黄丹宁.《英超球员能力的定量评估和预测》./kns/brief/default_result.aspx.2015年5月24日.不详.《基于泊松分布预测足球赛果的统计模型》..doc88..2015.2015年5月24日.九、附录附录一:维罗纳:球员位置出场时间(单位:分钟)进球单位进球能力助攻射门射正单位进攻能力扑救单位防守能力
本尼西斯门将1421001000.00070373620.043631246格里尼门将270000000160.059259259拉斐尔门将1620000000580.035802469LorenzoFerrari门将000000AlessandroSalvetti门将000000布里维奥后卫1110000410.00450450500索伦森后卫639001300.00625978100阿戈斯蒂尼后卫1723000200.00116076600罗德里格斯后卫000000马蒂奇后卫1026001200.00292397700
莫拉斯后卫286120.00069905611360.00699056300马奎后21020001060.0000斯卫7611798马奎后125600000000斯卫罗德后1044000110.0000里格卫1915斯709皮萨后1676000900.0000诺卫5369928F订i后00—000—0—ppo卫Boni克里中124910.000531120.0300斯托场800648430多罗1745普洛斯哈尔中194610.00082560.0200弗雷场513870041德森511罗尼中115320.00111370.0100塔场7346082135356扬科中111710.00022580.0300维奇场895251333593奥巴中112010.00011320.0100
迪场8928574285714萨拉中104320.0012640.0100场9175415056273塔赫中279630.001245150.0200特斯场072962174蒂斯1535格雷0000科场9708738Matt中16210.0061410.0300ia场172847037Valo037tiGust中610000810.0100avo场4754Camp098anharoPier中00—000—0—luig场iCappelluzzoLuca中00—000—0—Chee场chin洛佩前94150.005232160.0500斯锋3134931346963
华尼托前锋169950.002942908331160.02942907600前3240001650.0600锋4814815托尼前3052180.005211480.0500锋89777437352256Javi前43010.00221270.0400er锋325588837Savi1209olaMoha前100010100med锋FaresFern前91000210.0300andi锋2967nho033合计平均单位进0.001平均单位进0.05平均0.00球0.球能力07515攻能力3029单位4782队011091时间516实96防守力28能力92尤文图斯:球员位置出场时间(单位:分钟)进球单位进球能力助攻射门射正单位进攻能力扑救单位防守能力
布门将2880000000610.021180556鲁比尼奥门将000000斯托拉里门将450000000160.035555556EmilioAudero门将000000GiacomVolpe门将000000马罗后000000巴尔扎利后77000000000博努奇后292430.001025992024100.01162790700基耶利后24470012030.009807900
尼28德后85930.00850.000塞卫034151利924338耶3377埃后173810.031050.000弗卫005103拉7535677432奥后166300000000邦卫纳F订后00—000—0—ipp卫oRomagna阿中621000730.000萨场161莫030阿6马中281930.064480.000尔场010205基642746西0772奥莫中00—000—0—塔场帕中1271003920.000多场110因14949
佩佩中场21010.0047619051210.01904761900皮中152140.052580.000尔场026249洛2988354963博中202080.0251240.000格场039381巴6031889612比中208770.0451170.000达场033344尔5409929781佩中220130.033090.000雷场013190拉6308221735斯中174410.002250.000图场005154拉733816诺9451Mat中25000100.000tia场4Vitale科前4890021330.000曼锋36809816乔前1860001980.100文451
科锋6129略前187160.0146200.000伦锋032358特0680974127莫前132180.0552200.000拉锋060582塔5608911875特前2500200.0610470.000维锋085632斯马前135470.0535190.000特锋051435里6987456794And前00—000—0—rea锋Fav订l■i合计平均单位进0.0平均单位进攻0.0平均0.0球0.0球能力018能力278单位023队107847615防守640实0342537能力05力2佛罗伦萨:球员位置出场时间(单位:分钟)进球单位进球能助攻射门射正单位进攻能扑救单位防守能
力力力莱泽门00—000—0—里尼将卢帕门00—000—0—特利将托门2520000000800.0将31746032塔塔门720000100.0290.0鲁萨将013402努8887778978tg3ri±±罗萨门00—000—0—蒂将Loren门00—000—0—Z0将BardiniMarco后16610032340.000s卫180Alons614o09Jos??后207020.001550.000Mar??卫009096a661618Basan8436ta赫加后00—000—0—齐卫帕斯后132720.031690.000夸尔卫015211
0715900226罗德后251070.0019100.000里格卫027115斯8885374585萨维后233920.011230.000奇卫008068550405663托莫后183010.03820.000维奇卫0050714640384825Nicol后00—000—0—o卫GigliGianl后00—000—0—uca卫ManciniRicar后400000000do卫Bagadur库提中125210.022050.000克场0072159876542295Luzay中00—000—0—adio场Bangu
阿奎拉尼中场16100013680.02795031100库亚中144940.0453190.000德拉场027524多6054992465费尔中188120.0536130.000南德场010287斯6320816434伊科中00—000—0—文科场罗兹中136760.0361210.000伊利场043621契奇8917997356华金中135720.031330.000场0141407380143974兰扎中83000210.000里场36144578Octav中00—000—0—io场皮萨中16820032010.000罗场14268728
巴雷罗中场207420.00096432236130.02459016400l~n~inf罗西中537000520.000场13035382马林中00—000—0—场巴德000里基场09595613Aless中67520.0041130.000andro场0298Diama629nti63萨拉中85360.0128120.000赫场0704803396569851Simon中00—000—0—e场Minelli伯纳前149001420.000德希锋46979866戈麦前139840.0236130.000斯锋028364612806
387Mouni前3710.00110.000rEl锋270540Hamda270540oui2754马托前00—000—0—斯锋Alber前61630.011270.000to锋048324Gilar701675dino332合计平均单位进0.0平均单位进0.0平均0.0球0・球能力024攻能力260单位027队01180864防守701实043465能力47力25切沃:球员位置出场时间(单位:分钟)进球单位进球能力助攻射门射正单位进攻能力扑救单位防守能力巴尔迪门将900000000380.042222222普吉奥尼门将000000塞库林门将000000
比萨里门将2340000000720.030769231Gr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学科学《健康成长》
- 康熙与乾隆教学课件
- 儿童咳嗽诊断与治疗指南
- 共建共享健康中国
- 供应商信息管理系统
- 交行项目贷款管理办法
- 企业分类折旧管理办法
- 乡镇工作分片管理办法
- 企业发票取得管理办法
- 企业借入资金管理办法
- 安徽省劳动合同(安徽省人力资源和社会保障厅制)
- 平台建设运营考核方案
- 临时用电安全责任确认书
- 网络运维专项方案
- DZ∕T 0173-2022 大地电磁测深法技术规程(正式版)
- 手术器械检查与保养
- 2024中国农业科学院农业资源与农业区划研究所农业遥感团队科研助理公开招聘1人高频考题难、易错点模拟试题(共500题)附带答案详解
- 多囊卵巢综合征诊治路径专家共识
- 医用气体系统维保服务方案
- JJF 2093-2024高加速寿命和应力筛选试验系统校准规范
- 糖尿病急性并发症识别处理和预防护理课件
评论
0/150
提交评论