用数据分析方法预测足球比赛结果

 2022-07-10 19:33:10

论文总字数:33130字

摘 要

随着人们对各类足球比赛的日益关注,推动了足球博彩业的不断发展,专家们对于足球比赛结果的预测问题进行了长期的摸索与探究。本文通过模糊层次分析法,针对胜率,攻防水平,近期状态及赔率四大因素构建线性评价模型,模糊综合评价模型及基于线性评价模型结合埃罗预测法和六场战绩比较法改进的综合调整模型,实现对英超2017/18赛季比赛结果的预测,并对各模型预测结果的准确度进行了分析比较。

对英超2017/18赛季的229场比赛进行验证发现线性评价模型总体预测准确率为53.28%,其中主场获胜的预测准确度较高,达到了64.76%,其次是客场获胜的预测准确率,达到53.97%,而平局的预测准确率相对较低,仅有32.79%。模糊综合评价模型的总体预测准确率为53.71%,其中主场获胜的预测准确度很高,达到了81.90%,其次是客场获胜的预测准确率,达到58.73%,而平局的预测准确率为0。结合埃罗预测法和六场战绩比较法对线性评价模型的部分结果进行调整而得到的综合调整模型,其总体预测准确率为70.74%,其中主场获胜的预测准确度很高,达到了86.67%,其次是客场获胜的预测准确率,达到68.25%,平局的预测准确率相对较低但也达到了45.90%。

最后,对三个模型预测的结果进行分析发现,线性评价模型和综合调整模型对比赛结果的预测评判相对合理,且综合调整模型的准确率最高,而综合评价模型的评判相对片面,没有准确的刻画平局,从而使得结果预测时主场获胜和客场获胜的场数明显增加,也就使得主场胜和客场胜的预测准确率提高。所以,最后采用基于模糊层次线性评价方法的综合调整模型作为对于英超比赛结果的预测模型。

关键词:模糊层次,线性评价,模糊综合,埃罗预测法,六场战绩比较法

Abstract

With the increasing attention to various events, as well as the analysis and prediction of events and the continuous development of football gambling industry, people begin to explore and pay attention to the accurate prediction of the results of the football match. Based on the fuzzy analytic hierarchy process, linear evaluation model and fuzzy comprehensive evaluation model are constructed with four major factors for the success rate, the attack and defense level, the recent state and the bet in order to predict the results of the England Premier League 2017/18 season. Besides the above two prediction models, the comprehensive adjustment model is established based on the linear evaluation model by elor prediction and comparison of six games to predict the results in a more rational and accurate way. After the prediction carried out by the three models, the accuracy of the prediction results are compared and analyzed then.

The verification of 229 matches in the English Premier League in 2017 / 18 season shows that the overall prediction accuracy of the linear evaluation is 53.28%, in which the prediction accuracy of the home victory reaches 64.76%, followed by the away victory, which reaches 53.97%, while the prediction accuracy of the draw is only 32.79%. The overall prediction accuracy rate of the fuzzy comprehensive evaluation model is 53.71%, of which the home victory reaches 81.90%, followed by the accuracy of the away team victory, reaching 58.73%, while the accuracy of the draw is 0. The comprehensive adjustment model that comes from the linear evaluation model combined with the elor prediction method and the six-game comparison method adjusts the partial results of the linear evaluation model. Then, the overall prediction accuracy rate of the model is 70.74%, of which the accuracy of the home victory reaches 86.67%, the accuracy rate of away victory, reaching 68.25%, and the accuracy rate of draw is a bit lower, but it also reaches 45.90%.

Finally, the comparison of the prediction results of the three models shows that the linear evaluation model and the comprehensive adjustment model are relatively reasonable in predicting the matches results, and the accuracy of the comprehensive adjustment model is the highest, while the comprehensive evaluation model is relatively one-sided and inaccurate in the description of draw. The number of home victory and away victory games are big, which also improves the prediction accuracy of home and away victory. Therefore, the comprehensive adjustment model based on the fuzzy hierarchical linear evaluation method was used as the prediction model for the results of the Premier League game.

KEY WORDS: FAHP, Fuzzy Comprehensive Evaluation, Linear Evaluation,

Elor Prediction, Comparison of six games

目录

摘要 III

Abstract iv

第一章 引言 1

1.1 研究背景 1

1.1.1 研究对象的选择 1

1.1.2 联赛的赛制 1

1.2 研究现状 1

1.2.1 贝叶斯网络预测模型 1

1.2.2 基于决策树C4.5算法的预测模型 2

1.2.3 基于盘口数据的预测模型 2

1.3 研究意义 3

第二章 模型建立 4

2.1 评估因素 4

2.2 数据处理 4

2.2.1 胜率 4

2.2.2 攻防水平 4

2.2.3 近期状态 5

2.2.4 赔率 5

2.2.5 球队替代 5

2.3 预测模型 5

2.3.1 评价指标 5

2.3.2 基于模糊层次分析法的线性评价模型 8

2.3.3 基于模糊层次分析法的综合评价模型 11

2.3.4 基于线性评价的综合调整模型 15

第三章 模型实证 19

3.1 比赛结果预测 19

3.1.1 线性评价模型预测结果 19

3.1.2 综合评价模型预测结果 19

3.1.3 综合调整评价模型预测结果 19

3.2 比赛结果分析 20

3.2.1 预测结果分析 20

3.2.2 比赛结果分析 21

3.3 模型分析 21

第四章 结论与展望 22

4.1 结论 22

4.2 展望 22

致谢 23

参考文献 24

附录 25

引言

足球作为世界第一大运动,以其无与伦比的竞技魅力和影响力,吸引着全世界的人民,得到了广泛的喜爱。而早已成为欧洲人民生活不可缺少的欧洲五大联赛更是全球知名。随着人们对各类足球比赛的日益关注,推动了足球博彩业的不断发展,专家们对于足球比赛结果的预测问题进行了长期的摸索与探究。能够准确的预测足球比赛对于将足球这项竞技运动商业化和价值化具有深远的意义和推广作用。同时,伴随着计算机技术和数据分析技术的发展,越来越来多的事物可以通过专业和科学的分析方法,找到其背后的运行规律,从而更好的应用。因此,在本课题中,我们将通过对比赛数据的分析,建立预测模型,实现对足球比赛结果的预测。

研究背景

研究对象的选择

根据相关统计报告显示,比较欧洲五大联赛所在俱乐部的盈利发现,英超占据着主导优势,收入位居榜首。在2014-2015年度,英超的年度收入从32.6亿英镑增长到33.55亿,同比上升3%;将收入换算成欧元,由于英镑在2014-2015年度升值,英超俱乐部收入自39亿欧元增长自44欧元,同比上升13%。足以可见英超比赛在欧洲乃至世界的受欢迎程度。而英超的比赛也可谓是竞技性最强,观赏性最高的比赛了,甚至时常会出现冷门比赛的情况,将会不断地兴奋,刺激着观众们。因此,在本项目中,将针对英超进行比赛结果的预测。

联赛的赛制

英超联赛于1995/96赛季开始规定每赛季参赛球队为20队,每支球队与另外19支球队各比赛两场,作为主场和客场分别一次,也就是每支球队将总共进行38场比赛。这也就是主客场双循环赛制。同时,球队每获胜一局可积3分,每平一局积1分,每负一局则不积分。最后,按照球队本赛季总积分进行排序,总积分最高的球队即为本赛季总冠军,而积分排名最末的三支球队将降级,即不能再参加下一赛季的比赛。如果两支球队最后的总积分相同,便按照球队比赛净胜球数和进球数辨别先后顺序。如果还是不能区别球队的排名并且涉及到冠军和降级这两个关键问题的,就选择一个客观场地对两支球队进行加赛,确定排名。

考虑到英超赛制,每年都会有球队在英超俱乐部进进出出,那么在这近二十多年间进行比赛的球队数众多,也不便确定。为了便于分析和参数获取,在这里我们将只针对2017/18赛季的英超联赛进行比赛结果的预测,也就是说我们主要针对2017/18赛季的二十支球队进行分析。另外,考虑到从1995/96赛季开始参赛球队才由22队减至20队,因此我们将选取从1995/96赛季至2016/17赛季二十二年的数据进行分析预测。

研究现状

随着足球博彩业的蓬勃发展,以及各种数据分析方法和工具的诞生,涌现出了许多建立在数据分析统计基础上的足球比赛结果预测的模型研究。在通过相关方面大量文献的阅读后,发现了三种准确度较高且相对科学的足球比赛结果预测的模型,分别是贝叶斯网络预测,基于决策树C4.5算法的预测,基于盘口数据的预测模型。

贝叶斯网络预测模型

在文献[2]中,以特定球员,比赛位置,球队攻击力,球队素质及对手素质为指标因素构建贝叶斯网络模型进行预测,这里数据采取1995/1996和1996/1997两个赛季的数据。并将贝叶斯网络的预测结果和其他机器学习结果进行比较发现。通用模型中MC4学习者不相交训练和测试数据集的总体分类误差分别为专家选择数据的69.81%和61.35%。朴素贝叶斯学习者对于一般模型的非重叠训练和测试数据集上,分类误差率为61.19%,排名第二;专家选择的数据的分类误差为64.26%,排名第五。数据驱动的贝叶斯网络对于不相交训练和测试数据集的整体分类误差分别为普通模型67.69%和专家模型67.38%。KNN算法中一般模型和专家模型的分类误差分别为65.02%和62.94%。专家贝叶斯网络其分类误差超过了不相交训练和测试数据集的40.79%。不同学习者使用一般和专家模型数据预测比赛结果的相对准确性。当在整个赛季使用相同的训练和测试数据时,所有学习者的表现都比KNN作为最佳表现者的最常见假设要好得多。当使用不相交的训练和测试数据集时,KNN学习者的表现显著下降,结果表明,专家BN在预测准确性方面总体上优于该领域的其他技术。

基于决策树C4.5算法的预测模型

在文献[3]中,以球队进球率和球队积分两个数据集作为指标因素集,在这两个指标集的基础上,利用C4.5算法生成决策树,从而进行比赛结果的预测。

  1. 构建球队进球率模型

通过球队场平均进球数来反映球队进攻实力,即:

剩余内容已隐藏,请支付后下载全文,论文总字数:33130字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;