论文总字数:25797字
摘 要
大数据的出现让研究者得以处理互联网上的数据进而设计金融舆情情绪指数体系,以此来把握投资者情绪,从而探究其与金融资产价格的关系。本文从财经新闻所隐含的媒体情绪入手,利用文本挖掘和深度学习技术研究了财经新闻报道与上证指数波动的关系。本文利用深度神经网络模型通过机器学习得到了一个财经新闻情绪指数模型,并以此探究了财经新闻媒体情绪指数和上证指数波动的关联。结果表明,很难通过媒体情绪对股市波动做出预测。进一步地,本文利用深度学习模型构建了一个深度神经网络模型,直接就新闻文本特征矩阵和上证指数时间序列的关联进行了学习,这去除了研究者主观因素对金融舆情情绪指数判断的影响,试图利用计算机的学习找出财经新闻与股价波动隐含的关联。结果表明,直接由新闻文本特征矩阵得到的预测值比媒体情绪指数更为可靠。
关键词:文本挖掘,媒体情绪,深度学习,上证指数
ABSTRACT
The emergence of big data allows researchers to process data on the Internet and design a financial sentiment index system to grasp investor sentiment and explore its relationship with financial asset prices. Starting from the media emotion implied in financial news, this paper studies the relationship between financial news report and the fluctuation of Shanghai stock index by means of text mining and deep learning techniques. This paper uses the deep neural network model to obtain a financial news sentiment index model through machine learning, and explores the correlation between financial news media sentiment index and Shanghai stock index fluctuation. The results show that it is difficult to predict stock market volatility through media sentiment. Furthermore, this paper constructs a neural network model with three implicit layers using the deep learning model, and directly studies the correlation between the news text feature matrix and the Shanghai index time series. It removes the influence of subjective factors on the judgment of financial sentiment index, and tries to use computer learning to find out the implicit correlation between financial news and stock price fluctuations. The results show that the predicted value obtained directly from the feature matrix of news text is more reliable than the media emotion index.
KEY WORDS:Text Mining,Media sentiment,Deep Learning,Shanghai Stock Index
目 录
摘要 ………………………………………………………………………………………………………Ⅰ
Abstract ……………………………………………………………………………………………… Ⅱ
- 绪论 ………………………………………………………………………………………………1
1.1 引言 ………………………………………………………………………………1
1.2相关研究 ………………………………………………………………………………2
1.2.1 网络舆情情绪指数相关研究 ………………………………………………2
1.2.2 网络舆情数据处理相关研究…………………………………………………2
1.2.3 网络舆情与金融市场相关研究………………………………………………3
1.3 本文的研究目的和主要研究内容 ……………………………………………………4
- 数据描述 ………………………………………………………………………………4
2.1 新闻文本数据集 …………………………………………………………………4
- 上证指数数据集 ……………………………………………………………………………5
- 研究技术及方法 ………………………………………………………………………5
3.1 有效市场假说 …………………………………………………………………………5
3.2 行为金融学理论 ……………………………………………………………………6
3.3 中文文本挖掘技术……………………………………………………………………8
3.1.1 N-gram模型 …………………………………………………………………8
3.1.2 词向量 ………………………………………………………………………8
3.1.3 TF-IDF公式 …………………………………………………………………8
3.4 深度神经网络(DNN)…………………………………………………………………8
3.2.1 神经元计算模型 ……………………………………………………………8
3.2.2 DNN模型………………………………………………………………………9
3.2.3 模型的优化 …………………………………………………………………10
- 实证研究 ………………………………………………………………………………11
4.1 金融舆情情绪指数与上证指数波动率的关系………………………………………11
4.1.1 金融与情数据采集 ………………………………………………………11
4.1.2 上证指数时间序列 …………………………………………………………11
4.1.3 金融舆情情绪指数 …………………………………………………………11
4.1.4 金融舆情情绪指数和上证指数价格 ………………………………………13
4.1.5 小结 …………………………………………………………………………14
4.2 财经新闻特征向量与上证指数的直接关联 …………………………………………15
4.2.1 财经新闻文本TD-IDF特征向量和上证指数波动率 ………………………15
4.2.2 小结……………………………………………………………………………17
结论 ………………………………………………………………………………………………19
致谢 ………………………………………………………………………………………………20
参考文献(References) …………………………………………………………………………21
第一章 绪论
剩余内容已隐藏,请支付后下载全文,论文总字数:25797字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;