足球联赛的赛季成绩预测

 2022-07-10 19:32:56

论文总字数:23319字

摘 要

随着人们对各类足球比赛的关注度不断提高,足球彩票事业快速地发展起来,并很快得到了人们和国家的支持。比赛结果的预测也成为了当今学者研究的热点。主客队分别获胜的概率成为研究的主要趋势,且研究模型多种多样。本文的研究目的是根据历史数据来预测从赛季半程开始,每隔四轮,排名靠前的几个球队的夺冠概率和排名靠后的几个球队的降级概率。

本文以欧洲五大联赛近20年的数据为历史数据,通过建立合理的模型,利用历史数据来预测夺冠与降级概率,并用实例进行验证分析。研究工作主要包括以下内容:首先对足球赛事背景、常用的几个研究模型(研究现状)做了描述;其次分析影响夺冠或降级的主要因素与次要因素,并筛选出合理的历史数据做预处理,使得最终确定的模型的影响因素可以由处理后的矩阵直接计算得到;接着通过分析影响因素来建立模型并根据实例分析该模型的优缺点;最后对上述模型的局限性进行解释,并提出自己的意见。

以往的文献中多是预测一场比赛中主客双方获胜的概率,而本文是预测几轮比赛后,此时排名靠前的球队的夺冠概率和排名靠后的几个球队的降级概率,因此模型都是根据分析而建立的,具有一定的创新性与可实用性,但也存在一定的局限性。

关键词:夺冠与降级概率,拟合概率,最小二乘法

Abstract

As people's attention to various types of football matches continues to increase, the development of the football lottery business has rapidly developed and it has quickly gained the support of people and the country. The prediction of the game results has also become a hot topic for scholars today. The probability that the home and away teams win each other has become the main trend of research, and the research models are various. The purpose of this paper is to predict, based on historical data, the winning probability of the first few teams and the degrading probability of several teams ranked behind every four rounds starting from the half of the season.

This article uses the data of the five major leagues in Europe for nearly 20 years as historical data. By establishing a reasonable model, historical data are used to predict the probability of winning and degrading, and examples are used for verification and analysis. The research work mainly includes the following contents: First, it describes the background of football matches and several commonly used research models (research status); secondly, it analyzes the main factors and secondary factors that influence the championship or downgrade, and filters out and preprocess reasonable historical data, so that the influencing factors of the final model can be directly calculated from the processed matrix; then by analyzing the influencing factors to establish a model and based on examples to analyze the advantages and disadvantages of the model; Finally, the limitations of the above model are explained and I will propose my own opinion.

Most of the literature in the past is to predict the probability of wins between the home and away teams in a game. This article is to predict the winning probability of the first few teams and the degrading probability of several teams behind the ranking after several rounds of competition. Therefore, the models are based on analysis and have certain innovation and practicality, but they also have certain limitations.

KEY WORDS: Crown and Degradation Probability, Fitting Probability, Least Squares Method

目录

摘要 III

Abstract IV

第一章 引言 1

1.1 背景介绍 1

1.2 国内外研究现状 1

1.2.1 双变量泊松回归与有序概率模型 1

1.2.2 人工神经网络模型 2

1.2.3 Logistic回归模型 2

1.2.4 埃罗(Elo)预测法 2

1.2.5 进球率比较预测法 2

1.3 研究的主要内容 3

第二章 数据处理 4

2.1 影响因素 4

2.1.1 主要因素 4

2.1.2 其他因素 4

2.2 数据来源 4

2.3 数据预处理 4

第三章 技术基础 6

3.1 多元线性回归模型 6

3.2 非线性回归模型 6

3.3 归一化常用方法 7

第四章 建立模型 8

4.1 夺冠概率模型 8

4.1.1 模型一——线性模型 10

4.1.2 模型二——非线性模型 11

4.1.3 模型验证与分析1 12

4.1.4 模型验证与分析2 13

4.2 降级概率模型 15

4.2.1 模型一——线性模型 19

4.2.2 模型二——非线性模型 19

4.2.3 模型验证与分析 21

参考文献 25

附录 26

引言

以欧洲五大联赛为代表的足球比赛,以其独特的比赛规则和广泛传播的比赛文化成为当前世界上影响力最大的体育项目。每个赛季哪支球队夺冠、哪些球队降级,都牵动着亿万球迷的心。随着球迷对各种足球比赛的关注度不断提高,足球运动所能带来的商业价值开始被越来越多的人关注。足球博彩公司的相继成立推动了足球彩票的发展,而足彩的发展也为足球事业起到了不可忽视的作用。相关数据显示,我国足球彩票收入的一半左右用来支持社会体育事业的发展。可见,足球彩票不仅仅是一种商业产品,更是体育发展产业的重要经费来源。

背景介绍

随着人民生活水平的提高,体育相关事业的稳健前进,作为体育运动相关产业之一的体育彩票也得到了国家的支持和人们的关注。虽然足球彩票具有很高的商业价值,但决定这些商业利益的因素需要归结于足球比赛的结果。因此,对于足球比赛结果的预测成为当今体育运动商业化运作的一个热点,同时也是学术界所研究的一个重要问题。足球作为一项竞技体育运动项目虽然有其未知性,但足球比赛也有其可预测性,预测者并不是依靠运气来预测足球比赛的结果,而是依靠科学的分析与比赛结果的不确定性计算预测比赛的结果。因此,与足球赛事相关的数据分析和统计工作对学者们提出了更高的要求,也成为了当今研究的热点之一。

国内外研究现状

双变量泊松回归与有序概率模型

Maher(1982)早期使用单变量和二元泊松分布,对每个球队的进攻和防守参数进行事后估计(在收集了每个赛季的完整数据集后),但该模型无法预测事前(比赛进行前)个人比赛的得分或结果。Dixon和Coles(1997)开发了一种能够为得分和比赛结果产生事前概率的预测模型。主客场球队的得分遵循单变量泊松分布,对于低分数比赛,对概率的临时调整纠正了相互依赖性。另外,还有一些考虑了特定因素对比赛结果的影响的研究。Clarke和Norman(1995)量化了主场优势对比赛结果的影响。利用1998年国际世界杯锦标赛的数据,Dyte和Clarke(2000)研究了一系列赛前国家队的排名和球队在锦标赛中的实际表现之间的关系。

最近,一些应用计量经济学家已经使用离散选择回归模型来直接对胜-平-负比赛结果进行建模,而不是间接地通过进球数和失球数。Forrest和Simmons(2000a,2000b)调查了报纸评论员预测结果的预测质量,以及联合专家组在为推迟比赛提供假设结果方面的表现。Koning(2000)估计了一个模型来描述一系列事后比赛结果,作为对荷兰足球竞争平衡变化进行更广泛分析的一部分。

剩余内容已隐藏,请支付后下载全文,论文总字数:23319字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;