论文总字数:21207字
摘 要
随着对数据分析越来越深入的研究,人们在生活中对于事物的判断越来越依赖于数据。本文用概率统计的算法,研究在量化股票交易中强势股票在强势期前一段时间内的数据特征。试图通过对大量数据分析,寻找出高概率暴涨股票的特征。
本文的思路是第一章先介绍选题的背景,指出股票交易中数据特征提取是有重要意义的,然后第二章给出设计的方案,说明是如何完成特征提取这一目标的。三、四章分别是参数的选择计算和数据的存储,在给出了大体方案之后,深入说明了是如何选取参数对数据样本进行分析的,以及对分析的数据如何存读。本文第五章介绍了特征的拟合方式,本文中提取的特征是不同于主流的那些显而易见的特征的,所以需要对拟合方法介绍,以此来说明是怎样判断特征的。之后的第六章是对未来的展望,在未来即将开展的数据回测、自动交易、虚盘交易测试进行了展望。本文按照逻辑的角度,从为何要出现开始叙述,然后叙述了方案,再然后对方案进行了更深度具体的论述,以及最后完成项目后对更大项目的展望,叙述了一个从发现困惑到解决问题的过程,希望能清楚地阐述本文的研究成果。
通过股票交易系统中数据特征提取的研究,希望能为量化交易系统提供一个有依据的更优策略。
关键词: 量化交易 股票 特征提取 数据
RESEARCH AND IMPLEMENTATION OF DATA FEATURE EXTRACTION
IN QUANTITIVE EXCHANGE SYSTEM
Abstract
With the more and more in-depth study of data analysis, the judgments of people in the life become more and more dependent on the data. In this paper, we study the data characteristics of some soaring stocks in the stock trading by using the algorithm of probability and statistics. Through the analysis of a large number of data, to find out the characteristics of the high probability of soaring stock.
The train of thought of this paper is below:
The first chapter explains why we have to find out the characteristic of some good stocks in stocks trading. Then in the second chapter, we introduce the design scheme that is how to complete the feature extraction. The third chapter is about the calculation and selection of parameter, and the forth chapter is about data storage. These two chapters show readers more details about the scheme. In the fifth chapter, the article introduces the method of characteristics fitting. The extracted features are different from the mainstream of the obvious characteristics, so the introduction of the fitting method is really in need to explain how to judge the characteristics . The sixth chapter is the outlook of the future, it tells something about data back to test, automatic transactions and virtual disk trading test which are coming in the seeing feature. In this paper, according to the logical point of view, this paper describes a process from the discovery of confusion to solve the problem, hoping to clearly explain the research results of this paper.
Through the study of data feature extraction in stock trading system, I hope to provide a better strategy for the quantitative trading system.
Keywords: quantitative trading ,stock, feature extraction, data
目录
摘要 1
Abstract 2
第一章 绪论 4
1.1 课题背景 4
1.2 股票预测面临的问题 4
1.3 python语言分析的优势 5
1.4 Numpy数据包和Pandas数据库包 5
1.5 研究目的与内容 6
1.6 本章小结 6
第二章 整体规划方案 7
2.1 量化交易软件系统整体框架和流程 7
2.2 特征提取的流程介绍 8
2.2.1 准确性的前提理论 8
2.2.2 具体流程 10
2.3 本章小结 11
第三章 特征提取的具体实现 12
3.1 股票特征参数的选取 12
3.2 股票参数的获取与计算 14
3.3 股票参数特征的表现方式 16
3.4 本章小结 19
第四章 数据的存储与取读 20
4.1 数据的类型与格式 20
4.2 数据的本地存储 21
4.3 数据的本地读取 22
4.4 数据的前后端交互 22
4.5 本章小结 22
第五章 特征的拟合 23
5.1欧氏距离的应用 23
5.2 拟合特征算法 23
5.3 本章小结 24
第六章 未来工作的展望 25
6.1 数据回测 25
6.2 自动交易功能的实现 25
6.3 虚盘交易测试 26
6.4 本章小结 26
第七章 总结 27
致谢 28
参考文献........................................................................................................................................29
第一章 绪论
1.1 课题背景
在信息技术如此迅猛发展的今天,信息和数据在各个行业中都不断在爆炸和膨胀。对这些海量的数据,如果不能好好地分析这些数据,那这些数据就变成了一堆豪无意义的数据。但如果对这些海量的数据进行分析,提取出那些隐藏在数据中很难被发现的有价值的信息,那便是完成了数据的挖掘。因为金融数据具有很强的随机性和复杂性,所以很多时候传统的因果分析法在中国市场条件下由于并不存在理想环境,总是很难实现的。
股票交易是金融交易中的一个典型,现在每个工作日沪深股市的总交易额能在一两千亿之间波动。由于市场的不确定性,很多传统的金融分析手段在股市中的有效性很低。于是更多的人开始关注计算机对数据的处理,开始分析数据之间的关系并希望从中得到突破。
剩余内容已隐藏,请支付后下载全文,论文总字数:21207字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;