论文总字数:23647字
摘 要
股票市场被视为经济金融体系的重要支柱,对于个体投资人来说,为了增加投资收入,必须对股价后期趋势进行科学预判和把控,对于政府管理部门而言,具备活力的股票市场对于我国这样一个处于经济转轨制的国家其重要性也不言而喻。随着计算机技术和统计学理论的发展,越来越多的机器学习方法开始被应用于股市研究领域,其中,随机森林模型是一种经常被用于分类的新兴算法。相比较单棵决策树而言,其拥有运行速度快和预测精度高等一系列优点。基于此,本文重点从该模型着手,首先通过研究大量文献总结和归纳了随机森林模型的原理和建模步骤。然后结合股票市场探讨了利用随机森林对于预测股票次日涨跌的建模过程,并分别选取了近几年沪深300指数(600104.SH)于三种趋势(上升、水平、下降)的历史交易数据进行了实证分析,从而论证了随机森林模型对预测大盘的次日涨跌存在一定指导作用,且当股市整体走势为下降趋势时,其预测准确率最高。
关键词:股票预测,随机森林,沪深300
Abstract
The stock market is regarded as an important pillar of the economic and financial system. In terms of individual investors, the more accurate the prediction of future stock price changes is, the more confident it is to obtain profits and avoid risks. For the government, the stock is full of vitality. The importance of the market for China’s country in an economic transition system is also self-evident. With the development of computer technology and statistical theory, more and more machine learning methods are being applied in the field of stock market research. Among them, the random forest model is an emerging algorithm that is often used for classification. Compared to the decision tree, it has a series of advantages such as good operation and high prediction accuracy. Based on this, this paper focuses on the model. First, through the study of a large number of documents, the principle and modeling steps of the random forest model are summarized and summarized. Then, combining with the stock market, the modeling process of the random forest for forecasting the next day's ups and downs of stocks was explored, and historical transactions of the CSI 300 index in three trends (rise, level, and decline) were selected respectively in recent years. The empirical analysis of the data shows that the random forest model has a certain guiding role in predicting the next day's ups and downs of the broader market, and when the overall trend of the stock market is a downward trend, it has the highest forecast accuracy rate.
KEY WORDS: stock price forecast, random forest, CSI 300
目录
摘要 I
Abstract II
第一章 绪论 1
1.1研究背景和意义 1
1.1.1研究背景 1
1.1.2研究意义 3
1.2国内相关研究现状 3
1.2.1 关于股票市场的传统分析方法研究 3
1.2.3 基于统计理论或计算机技术的股市分析方法 6
1.3论文主要内容 9
第二章 随机森林模型概述 10
2.1随机森林模型的发展历程 10
2.2随机森林模型的原理 13
2.3随机森林模型的应用条件和过程 13
第三章 随机森林模型在预测股票走势中的应用 15
3.1随机森林模型对于预测盘整次日涨跌的适用性分析 15
3.1.1随机森林基分类器—单棵决策树的构建 15
3.1.2数据来源和参数说明 16
3.1.3预测效果分析 16
3.2不同趋势下随机森林模型对于盘整次日涨跌的适用性分析 18
3.2.1 三种股市趋势 18
3.2.2 沪深300指数处于三种趋势下的实证分析 19
第四章 总结与展望 24
致谢 25
参考文献 26
附录 27
第一章 绪论
1.1研究背景和意义
1.1.1研究背景
股票市场是观察和监测经济实时操作的最直接的指标,是国民宏观经济的“报警器”和“晴雨表”,被视作经济金融体系的重要支柱。这几年来,我国的股票市场迅速壮大和发展。
根据资料显示,1991年我国的上市公司数量仅有14家,经过了二十多年的发展,至今该数量已超过了3600家,股市的规模也从1992年的1048 亿元扩张到了如今的50多万亿元。我国已经成为全世界最主要的股票投资市场之一,其活跃度和交易规模一举上升至世界第二位。
表1-1 2000-2017年中国股票市场的规模变动
年份 | 上市公司总数 | 总市值(万亿元) |
2000 | 1088 | 5.07 |
2001 | 1160 | 4.63 |
2002 | 1224 | 4.09 |
2003 | 1287 | 4.56 |
2004 | 1377 | 3.99 |
2005 | 1381 | 3.49 |
2006 | 1434 | 10.35 |
2007 | 1550 | 40.12 |
2008 | 1625 | 14.83 |
2009 | 1718 | 29.07 |
2010 | 2063 | 30.52 |
2011 | 2342 | 25.01 |
2012 | 2494 | 26.78 |
2013 | 2489 | 27.23 |
2014 | 2687 | 37.26 |
2015 | 2827 | 50.33 |
2016 | 3052 | 53.13 |
2017 | 3485 | 56.62 |
数据来源:Wind资讯
由表1-1可看出,自从步入二十世纪以来,我国的上市公司总数和总市值都在不断上升,股票市场的规模也在不断地扩大。
剩余内容已隐藏,请支付后下载全文,论文总字数:23647字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;