• No results found

A Prediction of Stock Trading Signals Based on Interval Turning Points

N/A
N/A
Protected

Academic year: 2021

Share "A Prediction of Stock Trading Signals Based on Interval Turning Points"

Copied!
17
0
0

Loading.... (view fulltext now)

Full text

(1)

10384

23220141153379 UDC

A Prediction of Stock Trading Signals Based on Interval

Turning Points

2017

4

2017

5

2017

2017

厦门大学博硕士论文摘要库

(2)
(3)

厦门大学学位论文原创性声明

本人呈交的学位论文是本人在导师指导下,独立完成的研究

成果。本人在论文写作中参考其他个人或集体已经发表的研究成

果,均在文中以适当方式明确标明,并符合法律规范和《厦门大

学研究生学术活动规范(试行)

》。

另外,该学位论文为( )课

题(组)的研究成果,获得( )课题(组)经费

或实验室的资助,在( )实验室完成。(请在以

上括号内填写课题或课题组负责人或实验室名称,未有此项声明

内容的,可以不作特别声明。)

声明人(签名):

年 月 日

厦门大学博硕士论文摘要库

(4)
(5)

厦门大学学位论文著作权使用声明

本人同意厦门大学根据《中华人民共和国学位条例暂行实施

办法》等规定保留和使用此学位论文,并向主管部门或其指定机

构送交学位论文(包括纸质版和电子版)

,允许学位论文进入厦门

大学图书馆及其数据库被查阅、借阅。本人同意厦门大学将学位

论文加入全国博士、硕士学位论文共建单位数据库进行检索,将

学位论文的标题和摘要汇编出版,采用影印、缩印或者其它方式

合理复制学位论文。

本学位论文属于:

( )1.经厦门大学保密委员会审查核定的保密学位论文,

于 年 月 日解密,解密后适用上述授权。

( )2.不保密,适用上述授权。

(请在以上相应括号内打“√”或填上相应内容。保密学位

论文应是已经厦门大学保密委员会审定过的学位论文,未经厦门

大学保密委员会审定的学位论文均为公开学位论文。此声明栏不

填写的,默认为公开学位论文,均适用上述授权。

声明人(签名)

年 月 日

厦门大学博硕士论文摘要库

(6)
(7)

摘要

摘 要

近年来,对股票拐点的预测成为了股票预测中的热点问题。一种结合分段线 性化和加权支持向量机(PLR-WSVM)的预测方法在股票拐点预测领域展现出其 性能的优越性。然而,在取得良好成果的同时,该方法也存在许多不足。例如, PLR-WSVM 预测产生的拐点数较少使得模型的稳定性受到影响;该方法在分段 线性化过程中对所有股票在全区间上采用统一阈值缺乏合理性等。 针对 PLR-WSVM 的不足,本文提出了一系列改进。首先,本文重新建立输 入特征向量,去除了大部分绝对指标,选用对模型建立和预测更有帮助的相对指 标。其次,本文将拐点看成一个区间,而不是单个点,先通过分段线性化生成序 列的核心拐点(CTP),再根据核心拐点生成区间拐点(ITP)。拐点区间化改善了 原方法中的类不平衡问题,并为模型提供了更多有价值的信息。再次,针对分段 线性化过程设置统一阈值不合理的问题,本文提出一种新的分段线性化阈值选择 方法,该方法通过给定训练集上期望的拐点比例对阈值进行动态选择,既提高了 阈值的合理性,又能更容易被普通投资者所理解。此外,本文还提出了结合长期 趋势和短期趋势确定拐点买卖性质的划分方法,提升了拐点的预测准确性。最后, 本文提出了一种带有校正功能的交易策略,进一步减少实际投资过程中损失的可 能性。 本文通过多组对比实验,验证了改进方法的有效性和优越性。同时,本文还 对改进后的模型进行了长达 3 年的收益率测试,结果表明该模型在长期投资上具 有较稳定的收益能力。此外,改进的模型还在随机数据集上表现出良好的泛化性 能。 关键字:支持向量机;拐点区间化;技术指标

厦门大学博硕士论文摘要库

(8)
(9)

Abstract

Abstract

The prediction of stock trading signals is one of most popular topic at stock prediction field. Recently, a method combined piecewise linear representation and weighted support vector machine (PLR-WSVM) has shown good performance in the prediction of stock trading signals. Meanwhile drawbacks of PLR-WSVM exist particularly in a real world setting. For example, the performance of PLR-WSVM is unstable because of lack of trading signals, and it is not reasonable to specify same threshold value for all stocks in PLR.

In this paper, we conduct a set of improvements to PLR-WSVM. Firstly, we reconstruct input variables, most of absolute technical indicators in input variables are substituted with relative indicators since the relative indicators are generally more helpful in predicting trading signals. Secondly, we propose the concept of interval turning points (ITP). We generate core turning points (CTP) by PLR, then interval turning points are generated according to the range of adjacent core turning points. The interval turning points improves the problem of class imbalance, and also provide more valuable information for classifier. Thirdly, a procedure of selecting a threshold in PLR is provided. The threshold is automatically selected by a given percentage of turning points in a training set. The percentage of turning points is easier to understand by investors compare weigh the threshold. In addition, this paper integrates prior tendency knowledge to identify either buying or selling signals from predicted turning points, which improves accuracy of trading signals identification. At last, we propose an investment strategy with correction function to reduce the possibility of loss.

This paper conduct sets of experimental study, and the result confirm the expected performance of improved PLR-WSVM. Besides, the improved PLR-WSVM show steady profits in the long time data sets as well as good generalization on new data sets.

Key Words: SVM, interval turning points, technical indicator

(10)
(11)

目录

目 录

第一章 绪论 ... 1

1.1 研究背景及研究意义 ... 1 1.2 国内外研究现状 ... 3 1.3 本文的主要工作和结构安排 ... 7

第二章 理论基础 ... 9

2.1 机器学习 ... 9 2.1.1 机器学习问题描述... 9 2.1.2 机器学习的主要类型... 9 2.2 统计学习理论 ... 10 2.2.1 VC 维及推广性的界 ... 10 2.2.2 结构风险最小化... 11 2.3 支持向量机理论 ... 12 2.3.1 支持向量机模型... 12 2.3.2 加权支持向量机... 14 2.4 时间序列分析 ... 14 2.4.1 时间序列分析法... 14 2.4.2 时间序列表示法... 15 2.5 PLR-WSVM 框架介绍 ... 17 2.6 本章小结 ... 18

第三章 基于 ITP-WSVM 的拐点预测 ... 19

3.1 输入变量的选择 ... 20 3.2 拐点的产生 ... 27 3.2.1 分段线性化阈值的选择... 27 3.2.2 拐点区间化... 28 3.3 测试集拐点的划分 ... 33 3.4 交易策略 ... 36 3.4.1 校正策略... 36

厦门大学博硕士论文摘要库

(12)

基于区间拐点的证券交易信号预测 3.4.2 买卖策略... 37 3.5 ITP-WSVM 算法 ... 38 3.6 本章小结 ... 39

第四章 实验与分析 ... 40

4.1 改进的有效性检验 ... 40 4.2 长期投资有效性检验 ... 50 4.3 本章小结 ... 52

第五章 总结与展望 ... 53

5.1 全文总结 ... 53 5.2 研究展望 ... 54

参考文献 ... 55

附 录 ... 60

致 谢 ... 61

厦门大学博硕士论文摘要库

(13)

CONTENTS

CONTENTS

CHAPTER 1 Introduction ... 1

1.1 Background and Significance ... 1

1.2 Research Status ... 3

1.3 Main Work and Manuscript Organization ... 7

CHAPTER 2 Research Foundation ... 9

2.1 Machine Learning ... 9

2.1.1 A Brief Introduction ... 9

2.1.2 Main Types of Machine Learning ... 9

2.2 Statistical Learning Theory ... 10

2.2.1 VC Dimension and Generalization Bound... 10

2.2.2 Structual Risk Minimiazation ... 11

2.3 Time Series Analysis ... 12

2.1.1 A Brief Introduction ... 12

2.1.2 Time Series Representation... 14

2.4 Support Vectore Machine ... 14

2.1.1 Definition of SVM ... 14

2.1.2 Weighted Support Vector Machine ... 15

2.5 Introduction of PLR-WSVM ... 17

2.4 Brief Summary ... 18

CHAPTER 3 Introduction of ITP-WSVM ... 19

3.1 Input Variables Selection ... 20

3.2 Generating Turning Points ... 27

3.2.1 The Selection of Threshold ... 27

3.2.2 Interval Turning Points ... 28

3.3 Turning Points Classfication at Test Sets ... 33

3.4 Trading Strategy ... 36

3.2.1 Correct Strategy ... 36

厦门大学博硕士论文摘要库

(14)

基于区间拐点的证券交易信号预测

3.2.2 Trading Strategy ... 37

3.5 The Algorithm of ITP-WSVM ... 38

3.6 Brief Summary ... 39

CHAPTER 4 Experiment and Analysis ... 40

4.1 The Result of Improvement Experiment ... 40

4.2 The Result of Permanet Investment Experiment ... 50

4.3 Brief Summary ... 52

CHAPTER 5 Conclusion ... 53

5.1 Overview ... 53 5.2 Further Works ... 54

References ... 55

Appendix ... 60

Acknowledgement ... 61

厦门大学博硕士论文摘要库

(15)

第一章 绪论 1

第一章 绪论

1.1 研究背景及研究意义

从上世纪 90 年代,我国建立证券市场以来,经过 20 多年的摸索发展,截至 2016 年底,沪深两市上市公司已达到 3052 家,总市值达到 50.8 万亿元,流通 市值超过 39.3 万亿元[1] 。与此同时,随着人们思想观念的进步和转变,越来越多 的普通投资者也参与到证券市场中,截至 2015 年中旬,两市开户数已达到 30000 万户,投资机构的数目同样也不断攀升。不论是机构还是个人对证券投资都热情 高涨,投资者希望能够准确的分析出未来股票市场的走势,高抛低吸从而得到理 想的收益。然而,股票市场受到众多因素影响,个人的判断常常无法把握市场走 势从而带来较大的投资风险。 对于股票市场是否可以被预测,学术界有过争议。有效市场假说理论[2] 认 为,当所有影响股价的信息充分、准确且及时地得到响应时,投资者不可能对 股价进行有效的预测。然而有效市场假说是基于理想而严苛的前提下提出的假 说,现实中很难满足,实际证券市场并非完全随机,而是一定程度可预测的。 随着信息化技术的进步,近十年来量化投资、程序化交易已是欧美众多基金的 常态交易模式,2015 年中国“股灾”后,中国证监会制定办法严管程序化交 易,这些事实从一个侧面佐证了证券市场的可预测性。当然,证券市场的预测 具有很高的难度,但这也正好为机器学习等预测方法带来了很好的舞台,有力 于促进机器学习技术的发展。 对于股票的预测研究主要分为两个大方向:预测股票价格[3-7] 和预测交易点 [8-13] 。预测股票价格主要是预测短期的价格变化,而股票数据具有高频特性,因 此预测准确率受到了限制,难以运用于实际投资中。预测交易点即预测股票发生 趋势变化的点,这样的点称之为拐点(Turning Point,TP)。通常情况下,对拐 点的识别是基于一个较长时间区间的,这也减少了高频特性对预测的影响。投资 者通常更关心的是趋势变化。因此,相比预测股票价格而言,预测股票的拐点更 有吸引力。

厦门大学博硕士论文摘要库

(16)

基于区间拐点的证券交易信号预测 2 通过什么样的方法对股票走势进行预测和分析一直是投资者研究的重点,传 统的分析方法包括基本面分析和技术分析两大流派[14] 。基本面分析的思路是格雷 厄姆(1934)在《证券分析》中提出的,其主要的思想是利用金融学、经济学等 知识,对影响股票投资价值的要素,如宏观经济水平,通胀率,行业发展变革等 进行分析,从而获得对股票走势的判断及估值[15] 。时至今日,很多投资者依旧采 用基本面分析,然而基本面分析需要具备深厚的金融背景,并能够先于市场获取 最新的咨询,对于绝大部分中小投资者而言是无法实现的,因此基本面分析比较 适用于对一个长期走势的把控分析。而技术分析认为,股票未来的走势可以通过 历史价格、成交量的历史数据进行预测,其中包括一些经典的分析方法,如 K 线 分析法、波浪理论、指标分析法、形态分析法、切线分析法等[16] 。技术分析具有 比较强的时效性,因此比较适合用于短期的预测分析。 在时间序列分析理论出现之后,时间序列模型被研究者运用到证券市场分析 中。股票市场的时间序列分析法主要是通过历史交易数据寻找股票走势随时间的 变化规律,从而建立统计学模型进行预测。诸如自回归滑动平均模型(ARMA)、 自回归积分滑动平均模型(ARIMA)、自回归条件异方差模型(ARCH)和基于广义 自回归条件异方差模型(GARCH)等[4,17-20] ,都是常被用来进行股票走势分析的模 型。时间序列分析法的出现使得股票预测从主观理论判断阶段进入数理模型预测 阶段,这使得投资者在掌握较少金融知识的情况下亦可以利用时间序列分析辅助 决策。然而时间序列分析法是建立在一系列假设条件之上的,实际运用中常常因 无法满足这些假设而达不到预期效果。 上世纪 80 年代,伴随着数据挖掘技术与人工智能的不断发展,投资者开始 将人工智能理论应用到金融领域的分析中[21-22] 。与传统统计模型相比,人工神经 网络(ANN)具有良好的全局逼近能力,在学习过程中实现了经验最小风险原则, 性能显著优于传统统计模型,因此人工神经网络被广泛运用在证券市场时间序列 的建模中[23-29] 。人工神经网络通过对股票历史数据进行学习,获得各影响因子间 的关系,对股价波动建立函数关系从而达到预测股价的目的。常用的神经网络模 型包括径向基神经网络(RBF)[5,30-32] 、反向传播神经网络(BP)[33-34] 、模糊神经 网络(FNN)[21,35-37] 和 Elman 神经网络等[38-40] 。然而神经网络也存在一些缺陷,比

厦门大学博硕士论文摘要库

(17)

Degree papers are in the “Xiamen University Electronic Theses and Dissertations Database”. Full texts are available in the following ways:

1. If your library is a CALIS member libraries, please log on http://etd.calis.edu.cn/ and submit requests online, or consult the interlibrary loan department in your library.

2. For users of non-CALIS member libraries, please mail to etd@xmu.edu.cn for delivery details.

References

Related documents

The study sought to estimate mortgage valuation accuracy in South Africa and as such focused on the top four financial institutions in the financing of property in South Africa

ensure the equity of tax assessments and fairness of compensation for expropriation; ensure both market and non-market value are taken into account when buying, selling and

Depending on the roof space available, choose between a compact machine solution or a machine equipped with a mast.. +

◦   21 hours Individualized Program of Study (At least 9 credit hours from 2 different disciplinary areas and 3 additional credit hours). "   Disciplinary area of

Employees have different communications needs, so working with a communications partner that gives our employees the power to realise their potential is invaluable.” Henry

Prior to joining the Boys & Girls Clubs of Greater Memphis, Keith served as the Chief Professional Officer of the Boys & Girls Club of Alachua County in Gainesville, Florida

The LIWC word categories (a) differentiation words, (b) conjunctions, and (c) words longer than six characters, (d) prepositions, (e) cognitive process words, (f) casual words,