基于VMD-EEMD-LSTM模型的沪深300指数预测研究

奥鹏网院作业 · 发表于 2020-8-31 14:46:47

基于VMD-EEMD-LSTM模型的沪深300指数预测研究
郭金录
(高等教育出版社文科事业部，北京 100029)
摘要：股指序列的非平稳、非线性和长记忆等特性使其预测难度较大，为了改善已有模型的预测精度，本文首次提出一种新的融合二层分解技术及长短期记忆深度神经网络的沪深300股指收益率组合预测模型，该组合模型由变分模态分解(VMD)、集合经验模态分解(EEMD)两种分解技术及长短期记忆神经网络(LSTM)组成。选取沪深300指数2016年3月1日至2019年8月30日，共858个交易数据作为建模对象，并采用后50个交易日数据作为测试样本。实证结果表明，本文提出的VMD-EEMD-LSTM组合模型预测评估指标RMSE、MAE、MAPE取值分别为0.553 2、0.461 3、1.284 2，显著优于已有二次分解及单次分解组合模型，具有显著的预测优势。本文的研究结果可助益于金融市场监管当局及时开展风险预警工作，制定合理的风险管理政策；同时也可帮助投资者采取有效的投资策略，降低投资风险。
关键词：股指预测；二次分解；变分模态分解；长短期记忆神经网络
一、引言
股票市场是中国金融市场的重要组成部分，股票市场的风险管理一直是金融监管当局、各类投资主体关注的焦点。一国经济发展和金融稳定离不开强有力的金融市场风险管控，借助精确的预测技术可以及时监测股市存在的系统性风险和资产价格泡沫，为监管者提供前瞻性预警信息，助益于股票市场的风险管理。同时，精确的股票价格预测模型可以为投资者提供合理的决策依据。而中国股票市场的大多数投资者正面临投资损失，其中一个主要原因是大多数投资者对股票价格走势的信息和预测能力有限。因此，如何构建一个有效的选股模型来提高投资者的可预测性是一个有意义的课题。在金融市场中找到一种可靠的价格预测解决方案是一项非常困难且具有挑战性的任务。由于所有可用的信息都反映在价格中，因此股票价格一直是投资者和研究人员感兴趣的主题之一。精确的预测模型可以构成金融市场决策的基础。对精确预测模型的需求不断增长，涌现了越来越多的文献研究。
然而，人们普遍认为股票市场预测是一项艰难的任务，因为股票市场价格的波动受到宏观基本面、经济和政治等复杂因素的影响，其价格波动存在不确定性[1-3]。股指收益率变化相比个股具有更为复杂的演变模式，具有非平稳、非线性和长记忆等特性。股票价格预测一直是众多学者的研究重点。一些研究人员坚持认为股票市场是不可预测的，根据有效市场假说(Efficient Markets Hypothesis，EMH)，研究股票市场预测是浪费时间[4]。EMH是指影响证券价格的所有信息都包含在价格中，只有新的信息才能导致价格变化。由于新的信息不可预测，股票市场价格服从几何布朗运动，市场价格呈现随机游走形态，股票市场无法预测。然而，行为金融学及计算实验金融实证研究结果表明，金融市场具有一定的概率可预测性。如，道氏理论认为股票市场的涨落具有可重复性和周期性，因此，可以根据市场价格时间序列的历史值来预测未来价格的趋势[5-6]。
梳理已有文献发现，关于金融市场资产价格时间序列预测方面的研究颇为丰富，但仍存在不足之处：以往采用VMD分解技术构建的单次及二次分解组合预测模型，直接丢弃了VMD分解后剩余残差项所携带的丰富信息，导致模型预测精度受限。因此，本文的创新点基于以上不足之处展开。在VMD分解技术的基础上，对其剩余残差项进行二次分解，提出VMD-EEMD-LSTM二次分解组合模型，改善组合模型的整体预测精度。
二、文献综述
目前，国内外学者针对时间序列预测方法进行了广泛的研究，所运用的方法主要分为三类：传统计量模型方法、人工智能预测方法及组合模型预测方法。传统计量模型如ARMA[7-8]模型、ARIMA模型[9-10]、GARCH[11-12]模型、向量自回归模型、Grey-Markov模型[13]等。传统计量模型的优势在于，模型基于完整的统计理论构建，可根据经典的统计原理对模型和参数进行检验，但是在建立统计模型前，对象必须满足某些统计假设(例如数据平稳性等)，这将限制模型在实际经济和管理问题中的应用，且股指价格时间序列属于典型的非平稳且非线性序列，传统计量模型无法完整刻画时间序列的非平稳、非线性特征, 其在处理非线性、非平稳时间序列方面具有较强的局限性[14-16]。
针对传统计量模型不能有效捕捉非线性模式的不足，人工智能技术不需要满足统计假设，能够更好地处理非平稳非线性时间序列。人工智能方法采用机器学习技术对历史数据进行训练，在非线性时间序列数据方面有着更高的预测精度，已经成功地应用于解决非线性回归估计问题。典型的模型代表有人工神经网络(Artificial Neural Network, ANN)，遗传算法，支持向量机(Support Vector Machine, SVM)、随机森林及Adaboost模型等[17-21]。然而传统人工智能技术无法刻画时序数据的前后相依性，其时序数据预测精度有限。其采用的浅层学习思路依靠人工经验抽取样本特征，模型学习后获得的是没有层次结构的单层特征。苏治等(2017)[22]的研究指出利用传统人工智能方法存在的许多不足制约了其对金融市场数据分析的预测性：由于金融市场的特殊性，其往往会受到众多因素的影响，传统的模型方法并不能很好地描述一个金融市场；传统方法通常掺杂了研究者的主观因素，并且设计具有过度针对性和不完整性；即使是较为有效的人工神经网络方法，也存在备受诟病的过拟合问题以及导致模型无效的梯度消失或梯度爆炸等问题。这些都制约了对金融市场数据的分析与预测。
深度循环神经网络(Recurrent Neural Network, RNN)因内嵌反馈、循环结构，能处理时序数据间的前后相依性[23]。张帆(2013)[24]基于Elman神经网络模型对沪深300指数隔夜开盘价进行预测取得了较好的效果。然而，RNN无法解决长时依赖问题，作为RNN网络的变体，长短期记忆神经网络(Long Short-Term Memory，LSTM)[25-26]通过在网络结构中引入记忆单元，能有效刻画时序数据间的长时依赖特性。Yoshihara等(2014)[27]首次利用循环神经网络和受限玻尔兹曼机建立的深度循环神经网络模型对新闻事件文本信息进行处理，从而预测股票市场趋势。他们不仅仅关注了与事件相关的语义信息，还考虑了过去重要事件的时间效应。Xiong等(2016)[28]将长短期记忆模型应用到股票市场波动性的研究中，基于能够反映公众情绪和宏观经济因子的谷歌趋势对2004年至2015年期间标普500指数波动性的影响因素进行研究,取得了不错的效果。LSTM在与其他预测方法的比较方面，冯宇旭和李裕梅(2019)[29]将LSTM用于沪深300指数的股价预测，结果表明LSTM模型预测效果优于SVR模型和Adaboost模型。Liu(2019)[30]采用LSTM网络预测S&P 500指数的波动率，结果表明，表明LSTM网络在较长区间的波动率预测方面表现优于传统的GARCH模型、SVR模型。上述文献表明，LSTM模型在预测复杂时序数据方面具有一定优势，因此，本文选取LSTM作为模型的主体框架部分。
为了克服传统人工智能模型的局限性，第三类预测方法——组合模型预测方法取得了较好发展。随着预测技术的发展，组合模型因其良好的预测性能引起了学界极大的关注[31]。在多数组合模型中，信号处理方法用于分解时间序列，运用人工智能方法对分解后的各分量进行预测。比较典型的方法有：Wang等(2005)[32]提出的TEI@I复杂系统研究方法论，其通过各个击破、先分解，后集成的思想，显著地提升了模型整体预测精度。
信号处理方法是组合模型的重要组成部分，可直接影响模型的预测性能。典型的序列预处理方法有小波分解 (Wavelet Decomposition, WD)[33]与经验模态分解(Empirical Mode Decomposition, EMD)[34]，EMD分解算法不依赖任何基函数，与小波分解具有本质区别，在处理非平稳、非线性复杂信号具有显著优势。如秦宇(2008)[35]运用EMD算法对沪市股价日序列进行了趋势分解和周期性的波动分析，分解所得的各分量的波动与宏观重大事件的发生时间几乎同步，说明这些分量一定程度上反映了股市的各种周期规律。Wei(2016)[36]基于EMD分解算法，结合FNN模型提出了ANFIS算法，并对台湾TAIEX和恒生指数进行预测，结果显示这种算法具有更高的预测精度。但是由于EMD分解易出现模态混叠现象,为此 Wu和Huang(2004)[37]提出了集合经验模态分解算法 (Ensemble Empirical Mode Decomposition, EEMD)。集成经验模态分解(EEMD)已经在金融预测领域广泛应用。姚卫东和王瑞(2016)[38]运用EEMD方法对上证综指进行研究,发现上证综指是高频分量、低频分量和趋势项分量三者所构成的,而上证综指的几次大幅波动由高、低频分量所体现，进而通过事件分析法测度重大政策事件对股市的影响,结果显示,分解而得的低频分量存在政策效应。由于EEMD方法具有缺乏数学基础、无法分离频率相近的分量以及过包络、欠包络等问题，导致其分解效果有限[39]。变分模态分解(Variational Mode Decomposition，VMD)作为一种改进的分解技术，在频域上能自适应地分解出各中心频率对应的有效成分，其分解精度更高。VMD分解方法在建模预测模型中对特征选择更有效，已成功应用于预测金融市场、能源市场资产价格走势[40]。因此，本文采用VMD分解技术作为主要分解技术进行建模。
目前，学者在组合预测建模方面取得了丰富的研究成果，其实证结果均表明组合模型预测效果均优于单一人工智能方法，并且采用VMD分解技术的组合模型取得了最佳预测效果。如，何凯等(2014)[41]利用集成经验模态分解(EEMD)与支持向量机(SVM)的混合模型对上证基金指数进行预测，研究证实，与直接进行SVM预测相比, EEMD-SVM组合预测法有更高的预测精度。He等(2019)[42]提出了基于VMD和长短期记忆网络的混合模型预测气温变化，并通过贝叶斯优化算法进行优化，结果表明，相比于单个长短期记忆网络、支持向量回归、多层感知器回归、线性回归和随机森林回归，该混合模型的预测精度显著提高。Bisoi等(2019)[43]采用DE-VMD-RKELM组合算法，对标普500指数(BSE)、恒生指数(HSI)和金融时报证券交易所100指数(FTSE)的每日价格来进行预测，获得的价格预测结果分别与ELM和EMD-RELM得出的预测结果对比，证明了VMD-RKELM模型优于其他单一预测方法。Wang等(2017)[44]采用基于粒子群优化算法的反向传播神经网络，提出了四种不同分解技术的混合模型来预测农产品期货价格：EMD、VMD、小波包变换和固有时间尺度分解，选择小麦、玉米和大豆三种期货价格作为研究对象验证混合模型的适用性和有效性，实验结果表明，所有与分解技术相结合的混合模型均具有比单个模型更好的性能，其中VMD在提高预测能力方面贡献最大。为进一步改善分解组合技术的预测效果，众多学者尝试提出二次分解(Secondary Decomposition，SD)技术。Yin等(2017)[45]研究了二次分解结构，其中EMD提供的IMF1被WPD进一步分解以获得最终的子序列。殷豪等(2019)[46]在EEMD分解的基础上，运用VMD技术将高频子序列进一步分解，运用神经网络实现对电力价格的多步预测，结果表明基于二层分解技术的混合预测模型相较于单分解混合模型具有更高的预测精度。罗宏远等(2018)[47]在EEMD分解技术的基础上，采用VMD分解方法对EEMD分解后的最高频分量进行二次分解，将其应用于PM2.5浓度预测研究，实证结果表明，采用了二次分解技术的组合模型预测效果优于单纯采用EEMD、VMD分解技术的情形。综上文献所述，无论是采用VMD单次分解技术还是EEMD-VMD二次分解技术，以往研究均忽略了对VMD分解后的残差项进行建模[48-51]。
纵观前文所述已有研究可知，在单一人工智能模型的预测方面，LSTM模型取得了优异的预测效果；同时，所有组合模型的预测效果均优于单一人工智能方法；最后，本文发现在已有采用VMD分解进行组合模型预测的研究中，均忽略了原始序列经VMD分解后的残差项所包含的重要分量信息。因此，本文考虑对VMD分级后残差项所包含的复杂信号进行二次分解，提高残差项的预测精度，并提出一种基于新的融合VMD-EEMD二次分解技术和长短期记忆深度网络的股票指数预测模型，进而改善序列整体的预测精度。
三、模型概念及机理说明
在构建EEMD-VMD-LSTM组合模型对沪深300指数收益率进行预测研究之前，需对模型组合的各组成部分：EEMD、VMD分解技术及LSTM长短期记忆神经网络进行简要说明。
(一)集成经验模态分解
为了规避EMD分解容易出现模态混叠的现象，Wu和Huang(2004)[37]将极小幅度的白噪声序列添加到原始时间序列上，扩展出EEMD分解技术。该分解算法充分利用白噪声具有频率均衡分布的特性，对经过多次EMD分解得到的本征模态函数(Intrinsic Mode Function, IMF)取平均值来抵消添加的白噪声，从而改善模态混叠问题。其分解步骤如下。
步骤一，将满足正态分布的白噪声等长度序列ni(t)多次添加到原始时间序列x(t)中，即
xi(t)=x(t)+ni(t)
(1)
式中，xi(t)为第i次添加白噪声后的时间序列。
步骤二，对添加白噪声之后的时间序列进行EMD分解，得到IMF分量Ci,j(t)和残差项，Ci,j(t)为第i次加入白噪声后EMD分解所得到的第j个IMF分量。

(2)
步骤三，利用互不相关的随机序列之间均值为零的特性，将各分量Ci,j(t)取平均值以抵消多次添加的白噪声对真实IMF分量的影响，最终得到IMF分量分解结果

(3)
式中，Cj(t)为经EEMD分解后得到的第j个IMF分量，N为白噪声序列的数目。
步骤四，进一步得到EEMD 最终分解结果，即

(4)
IMF分量Cj(t)为时间序列从高到低不同频率段的信息走势，r(t)为整体残差项。
(二)变分模态分解
VMD分解技术的核心原理是采用自适应、准正交的分解方法，将原始输入信号分解为k个服从中心频率及有限带宽的模态分量uk，并最小化所有模态的带宽估计值之和[40]。VMD信号分解过程同时也是变分约束问题的求解过程。其变分约束问题的模型表达式如式(5)所示

(5)
式中，{uk}:={u1,…,uk}为分解后得到的模态分量VMF；{wk}:={w1,…,wk}分别为VMF对应的中心频率。*为卷积符号；∂t表示对t求偏导，δ(t)为冲击函数；f为原始输入信号。通过Hilbert变换得到与之相关uk(t)的解析信号进而获取其单边谱；通过乘以指数项e-jwkt调整各模态中心频率的估计值，将模态的频谱调整到基频带上。为了获取上述约束变分问题的最优解，需将其转换为无约束问题进行求解。通过引入拉格朗日乘法算子λ(t)及二次惩罚因子α，该约束性变分问题便转换为如下形式的非约束性变分问题
L({uk},{wk},λ):=
(6)
式中，二次惩罚因子α可以确保存在高斯噪声的情况下，信号重构的准确度；拉格朗日算子可用于维持严格的约束条件。进一步利用交替方向乘子算法(Alternate Direction Method of Multipliers, ADMM)迭代搜索，求取上述拉格朗日函数的鞍点，即得到式(6) 约束变分问题的最优解，其VMFuk及中心频率wk的表达式分别为

(7)

(8)
VMD分解方法具体实现步骤如下。
步骤一，设置模态分量及中心频率等参量的初始化取值并选取适当的模态分量个数K。
步骤二，根据式(7)、式(8)分别更新uk、wk的取值
步骤三，更新λ的取值

(9)
步骤四，给定判定精度ε>0，若满足条件

(10)
则停止迭代，否则返回步骤二。
上式中，和分别为和λn所对应的傅里叶变换。
(三)长短期记忆神经网络
传统循环神经网络由于考虑了时间序列的自关联特性，其在处理时间序列方面取得了不错的效果，但是RNN使用的反向传播算法会带来梯度爆炸或梯度消失问题，无法刻画长时依赖问题。虽然传统的RNN可以处理整个时间序列信息，但其着重考虑最后输入信号对输出结果的影响。在RNN中，前期信号的影响强度随着时间的推移会越来越低，最后只起到一点辅助作用，这种缺陷使得RNN难以处理长期依赖问题。
LSTM拟在解决长时依赖问题，无需依靠特别复杂的方式调试超参数，其能够刻画较长时间的信息对输出结果的影响。LSTM结构的核心思想引入记忆单元及门控单元，其记忆单元可以随着时间的推移保持状态，其非线性门控单元可用于调节信息的流入和流出。图1是一个典型的LSTM模型结构，LSTM算法主要由输入门(Input Gates)，遗忘门(Forget Gates)和输出门(Output Gates)构成，LSTM算法通过这三类门结构进行记忆单元状态的维持和更新[23]。

图1 长短记忆神经网络结构
记忆单元的信息遗忘由遗忘门的Sigmoid层决定，输入为当前层的输入xi，和上一层的输出ht-1，记忆单元状态在t时刻的输出为
ft=σ(W(f)xi+U(f)ht-1+b(f))
(11)
在记忆单元状态中存储信息，主要由两部分组成：(1)输入门的Sigmoid层的结果，作为将更新的信息；(2)由tanh层新创建的向量ut，将添加在记忆单元状态中。将旧的记忆单元状态ft乘以ct-1用以遗忘信息，与新的候选信息it·ui的和，生成记忆单元状态的更新。
it=σ(W(i)xi+U(i)ht-1+b(i))
(12)
ut=tanh(W(u)xi+U(u)ht-1+b(u))
(13)
ct=it⊗ut+ft⊗ct-1
(14)
输出信息，由输出门决定。首先，Sigmoid层用于确定要输出记忆单元状态的部分信息，然后通过tanh处理记忆单元状态，输出值为这两部分信息的乘积。
ct=it⊗ut+ft⊗ct-1
(15)
ht=ot⊗tanh(ct)
(16)
LSTM模型在序列生成、机器翻译、语音、视频分析、语言模型、手写识别等领域中均实现了成功的应用[28]，LSTM模型更真实地表征或模仿了人类行为、逻辑发展和神经组织的认知过程。在深度学习模型中，LSTM模型对于处理时间跨度交长、存在序列依赖的时间序列具有良好的效果。因此，本文选取LSTM模型作为模型主题框架的一部分。
(四)VMD-EEMD-LSTM模型构建
如前文所述，股指收益率序列具有典型非平稳、非线性等复杂特性，采用单一预测方法精度有限。由于VMD分解技术能将复杂信号分解为若干个复杂性更低的规则性模态分量，采用常见预测方法对VMD分解后各模态分量分别进行预测建模时，其预测精度会大幅度提高。然而，以往研究仅仅对VMD分解后各估计的模态分量进行建模，直接丢弃了模态分解后剩余残差项所蕴含的复杂信息[48-51]。不同于EEMD分解技术中的规则性残差，VMD分解后的剩余残差项复杂性较高，若直接丢弃这一部分信息，将降低模型整体预测精度。因此本文，提出一种针对VMD分解剩余残差项的二次分解技术，即采用EEMD分解技术对其残差项进行二次分解，以提高残差项的预测精度，进而提高模型整体的预测精度。结合LSTM神经网络在刻画时间序列自相关、长记忆方面的优良表现。本文借鉴TEI@I复杂系统研究方法论提出VMD-EEMD-LSTM组合预测模型，其详细建模步骤如下。
步骤一，采用VMD分解技术分解原始的股指收益率序列，得到各模态分量VMF，并用原始时间序列数据减去各VMF数据的和得到VMD分解剩余残差项。
步骤二，针对分解的VMF进行归一化处理，并适当选取训练样本与测试样本。对各VMF采用LSTM训练，得到各VMF分量子序列的预测结果。
步骤三，采用EEMD分解技术二次分解VMD分解后的剩余残差项，并对EEMD分解后各IMF子序列运用LSTM分别进行单独预测，进一步叠加子序列的预测结果得到残差项的最终预测结果。
步骤四，叠加VMD分解后各VMF分量及残差项的预测结果，得到原始序列的最终预测结果。
其建模流程如图2所示。

图2 VMD-EEMD-LSTM建模流程图
四、实证分析
(一)数据来源
本文以中国沪深300指数HS300为代表来测试VMD-EEMD-LSTM组合模型的实际预测表现。样本指数时间跨度从2016年3月1日至2019年8月30日，共858个交易数据，剔除了16年年初熔断机制对数据结构的干扰。数据来源于东方财富旗下Choice金融终端。定义第t个交易日的收益率为rt=100*[ln(pt)-ln(pt-1)]，t=1,2,……,n，pt为第t个交易日的指数收盘价。其收益率数据如图3所示。

图3 HS300指数收益率
(二)VMD分解与数据归一化处理
在对HS300收益率序列进行VMD分解之前，必须确定合适的VMF个数。其分解的分量个数对模型整体预测效果影响较大，若是分量过少，则分解精度较差，其原始序列的复杂性不能得到有效降低；若分量过大，则分量的中心频率会出现混叠现象，造成过度分解[52]。本文通过观察不同分量个数对应模态的平均瞬时频率的变化来确定最佳分量个数，理想的VMD分解应使得VMF频率从高至低，其平均瞬时频率依次降低，并且不同分量间瞬时频率的均值不宜过于接近。HS300收益率序列不同分量个数对应瞬时频率均线的变化见图4。
从图4可以看出，当分量个数取9时，曲线出现了明显的弯折，即第8、9个模态分量的平均瞬时频率基本一致，出现了过分解现象。因此，合理的模态分量个数应为8。接下来分别对HS300指数原始收益率序列分别进行VMD、EEMD分解，其分解结果如图5所示。

图4 不同模态分量个数对应的平均瞬时频率
从图5可明显发现，VMD分解的各模态分量相比EEMD分解更具规则性，其复杂性更低，尤其是前几个高频模态分量。然而，VMD的剩余残差项复杂性仍然较高，其包含了丰富的信息含量，若在建模时直接丢弃残差项，会影响模型的整体预测效果。因此，在建模时，可考虑对其进行二次EEMD分解，以进一步降低残差项的复杂性。

图5 HS300指数VMD、EEMD分解结果
为了确保LSTM模型的训练效果，需要对各模态分量子序列数据进行归一化处理，本文采用Min-Max离差标准化方法对数据进行线性变化，其表达式为
沥青混合料的施工使用经常会出现离析现象，其是由材料比例不均问题造成的，会严重降低沥青材料作用于施工实践的性能质量。如，粗集料的比例分配不均严重降低了搭配密度的科学合理性，导致施工使用过程出现了离析现象。此外，目前公路沥青路面基层施工使用的原材料性能质量水平较低，此环境下，采用间歇式的沥青拌合机也无法规避冷料仓进料时所产生的离析现象。具体来说，当冷料仓的出料口为矩形时，皮带传送过程就会受到较大的阻力进而导致机械设备的运行使用出现故障。在皮带的转速方面，其会受斗门大小的影响，一旦无信号提示进料过程就将出现不同程度的波动现象。经分析统计，公路沥青路面基坑施工最常出现的离析现象类型为纵向离析[2]。

(17)
(三)VMD-EEMD-LSTM预测建模与分析
1.预测结果评价指标
本文分别选取均方根误差(Root Mean Square Error，RMSE)、平均绝对误差 (Mean Absolute Error，MAE)及平均绝对百分比误差(Mean Absolute Percentage Error，MAPE)三种评价指标来检验模型的预测效果，其计算公式为

(18)
式中，分别为HS300指数真实值与预测值，n为测试样本规模，i为测试样本点序列编号，eRMSE、eMAE、eMAPE指标值越小，表明模型预测精度越高。
2.非组合模型比较分析
为了验证本文提出模型的预测效果，本文设计了非组合模型与组合模型两组方法进行预测检验对比分析。所有模型均采用前6天时序数据预测第7天数据，以此类推，并将后50天数据作为测试样本，最终得到802组训练样本，50组测试样本。
对非组合模型，即单独对各类算法进行预测对比分析。HS300在AdaBoost Regression、Random Forest、ARIMA、支持向量回归(SVR)、人工神经网络(ANN)、Elman网络、LSTM网络下前向一步、三步和五步的预测结果如表1、表2和表3所示。
由表1、表2和表3中的结果可知，在向前一步、三步和五步的预测结果中，LSTM模型在HS300预测中的三个结果指标中相比于其他对比模型，评价指标eRMSE、eMAE、eMAPE均取得了最低取值，且两个深度网络整体上均取得了优于参照组的表现，同时，绝大多数人工智能组合模型预测效果均优于传统计量模型ARIMA。综上分析，LSTM模型在HS300指数预测的结果中，相比于传统的其他模型表现出了预测性能的优越性和稳健性。接下来将采用LSTM模型结合分解技术进行组合模型预测分析，图6直观展示了不同模型的向前一步预测效果。
表1 非组合模型向前一步的预测结果

注：*表示在所有模型中取得最优结果。下同。
表2 非组合模型向前三步的预测结果

表3 非组合模型向前五步的预测结果

图6 不同非组合模型预测效果
从图6可看出，所有的非组合模型的预测输出值与实际值的离散程度均较高。由于原始时间序列具有较高的复杂性，仅仅依靠传统单一模型对其直接预测，精度十分有限。因此，接下来，引进组合分解技术作进一步对比分析。
3.组合模型比较分析
根据前文分析，采用VMD技术预先分解HS300原始收益率序列，得到不同VMF分量及残差项u，接着对残差项u进行EEMD二次分解，并结合LSTM模型进行组合预测分析。以一步向前预测为例，其预测结果如表4所示。
从表4可看出，对残差项u进行EEMD-LSTM组合预测，其评价指标均有明显改进。接下来对不同组合模型预测效果进行比较分析，其向前一步、三步和五步的预测表现对比结果如表5、表6和表7所示。
表4 VMD分解剩余残差项u预测结果

表5 不同组合模型向前一步预测结果

表6 不同组合模型向前三步预测结果

表7 不同组合模型向前五步预测结果

表5至表7中，EEMD-LSTM模型为采用EEMD技术作为序列预处理技术，结合LSTM方法构建的组合预测模型；同理VMD-LSTM模型为采用VMD技术作为序列预处理技术，结合LSTM方法构建的组合预测模型；VMD-u-LSTM亦为采用VMD技术作为序列预处理技术，结合LSTM方法构建的组合预测模型，然而其区别于VMD-LSTM组合模型之处在于：VMD-u-LSTM不仅包含VMD分解各VMF分量，还将残差项u纳入建模过程，而VMD-LSTM组合仅仅将VMD分解中各VMF分量纳入建模过程。EEMD-VMD-LSTM表示对EEMD分解后的第一个高频分量(IMF1)进行VMD二次分解的组合预测模型，其分解原理类似于图2所示VMD-EEMD-LSTM建模流程。
从表5至表7中可看出，组合模型的预测精度相比非组合模型取得了压倒性优势，尤其是采用VMD作为主要分解技术的组合模型，其评价指标取值相比非组合模型改善近60%。同时，包含残差项u的VMD-u-LSTM组合模型的评价指标取值均低于未包含残差项的VMD-LSTM组合模型，前者整体表现优于后者。表明将包含复杂信息的残差项u纳入模型进行预测分析，将有助于提升模型的整体预测效果。进一步，将VMD分解后的剩余残差项u进行EEMD二次分解、集成，构建VMD-EEMD-LSTM组合模型进行预测分析，发现VMD-EEMD-LSTM组合模型的评价、指标、取值相比所有参照组合模型均取得了最佳表现。其预测表现不仅优于VMD-u-LSTM组合，而且优于EEMD-VMD-LSTM二次分解组合。原因在于，其对残差项u进行二次分解、组合预测，能最大限度地降低原始数据的复杂性，进而改善模型整体的预测精度。
在表6向前三步和五步和表7向前五步预测结果结果中，组合模型精度相比非组合模型依然表现出了压倒性优势，包含残差项u的VMD-u-LSTM组合模型的、指标取值表现整体优于VMD-LSTM组合模型，表明将包含复杂信息的残差项u纳入模型进行预测分析的方法不仅适用于短期预测，也适用于长期的多步预测。此外，在向前一步预测中VMD分解技术的优势依然延续到多步预测的表现结果之中，而本文所提出的VMD-EEMD-LSTM则在所有预测情境下均取得了最优的表现，进一步证实了本文所构建模型的稳健性和预测性能上的优越性。
图7展示了不同组合模型向前一步的预测值与实际值的吻合情况。其预测值、实际值的吻合程度相比图6有显著地提升，尤其是VMD-EEMD-LSTM组合，其预测值与实际值较为接近。

图7 不同组合模型预测效果
五、结论与展望
为了提高预测精度，人们提出了各种基于软计算的预测模型。然而，现有的一些模型只强调模型的分类器，很少关注数据的再处理。由于高维原始数据中存在噪声和冗余信息，数据预处理是预测模型中至关重要的一步。在本文研究中，引入分解算法作为预处理工具来降低维数并提取输入原始数据的内在特征。分解算法和深度学习在自然语言处理、计算机视觉等领域取得了许多成就。然而在金融领域，尤其是在金融时间序列预测方面，最近进展甚微。由于中国股票市场的不成熟性、时间序列的非线性不稳定性以及缺乏开放可靠的数据集，现有股票价格的预测准确率并不高。因此，为了进一步提高趋势预测的性能，本文借鉴TEI@I复杂系统方法论中的分解集成技术，提出了融合二次分解及人工智能算法的组合模型对沪深300股指收益率序列进行预测研究，实证分析得出以下结论：
(1)借鉴复杂系统方法论，采用分解集成技术，将HS300指数分解成不同频率的子序列，分别对每个子序列进行单独预测，最后叠加、重构各子序列的预测结果形成整体预测结果。其相比传统单一模型，能大幅度提升原始序列的预测精度。
(2)VMD分解技术相比EEMD分解，其分解精度更高。采用VMD分解集成技术，将HS300指数收益率序列分解成不同频率的子序列，分别对每个子序列进行单独预测，最后叠加、集成各子序列的预测结果形成对原始时间序列的预测，能大幅度改善预测精度。运用VMD分解技术结合LSTM算法构建组合预测模型，既充分利用了VMD分解集成技术预测非平稳、非线性等高度复杂时间序列的优势，又借鉴了LSTM网络的循环网络结构及对时间序列长记忆特性的刻画能力，具有显著的预测优势。
(3)VMD-EEMD-LSTM二次分解组合模型预测能力显著强于一次分解组合模型。VMD-EEMD二次分解技术能将非平稳、非线性等高度复杂时间序列分解为若干个更具规则性的子序列，其组合模型预测具有明显优势。
最后，虽然本文构建的模型在一定程度上提高了沪深300指数的预测效果，但在历史数据的输入方面仍存在一些不足。股票价格的涨落不规则且复杂，其金融资产价格序列走势受多维复杂因素影响。比如宏观层面的经济发展水平、地缘政治冲突、国际市场间联动效应等；中观层面的产业发展规模、企业经营状况等；微观层面的投资者情绪、投资者关注度等行为因素，导致准确的预测金融资产价格未来走势甚为艰难，因此未来的研究中可将本文提出的模型与多维复杂影响因素结合起来建模，以进一步提升整体预测效果。
参考文献
[1]黄飞雪,等.金融危机前后的全球主要股指联动与动态稳定性比较[J].系统工程理论与实践, 2010,30(10): 729-1740.
[2]沈传河,王向荣.金融市场联动形态结构的非线性分析[J].管理科学学报,2015, 18(2):66-75.
[3]张贵生, 张信东. 基于近邻互信息的SVM-GARCH股票价格预测模型研究[J]. 中国管理科学, 2016,24(9):11-20.
[4]MALKIEI B G, FAMA E F. Efficient capital markets:a review of theory and empirical work [J]. Journal of Finance,1970,25(2):383-417.
[5]MURPHY J J. Technical analysis of the financial markets: a comprehensive guide to trading methods and applications [J]. New York Institute of Finance,1999.
[6]FELSEN J. Learning pattern recognition techniques applied to stock market forecasting [J]. IEEE Transactions on Systems Man & Cybernetics, 1975, 5(6):583-594.
[7]BURLANDO P, ROSSO R, CADAVID L G, et al. Forecasting of short-term rainfall using ARMA models [J]. Journal of Hydrology, 1993, 144(1-4):193-211.
[8]CONTRERAS J, ESPINOLA R, NOGALES F J, et al. ARIMA models to predict next-day electricity prices [J]. IEEE Transactions on Power Systems, 2003, 18(3):1014-1020.
[9]WANG C Y. Forecast on price of agricultural futures in China based on ARIMA model [J]. Asian Agricultural Research, 2016, 8(11):9-16.
[10]DAREKAR A, REDDY A. Predicting market price of soybean in major India studies through ARIMA model [J]. Journal of Food Legumes,2017,30(2):73-76.
[11]BOLLERSLEV T. Generalized autoregressive conditional heteroskedasticity [J]. Journal of Econometrics, 1986,31(3):307-327.
[12]杨继平, 冯毅俊, 王辉. 基于结构转换PTTGARCH模型沪深股市波动率的估计[J]. 系统工程理论与实践, 2016, 36(9):2205-2215.
[13]CHI G, LI Z. Forecast model of stock index futures prices based on small sample [J]. ICIC Express Letters. 2014,5(3):657-662.
[14]LIN K P, PAI P F, YANG S L. Forecasting concentrations of air pollutants by logarithm support vector regression with immune algorithms [J]. Applied Mathematics and Computation, 2011, 217(12):5318-5327.
[15]TAYLAN O. Modelling and analysis of ozone concentration by artificial intelligent techniques for estimating air quality [J]. Atmospheric Environment,2017,150:356-365.
[16]王帅, 汤铃, 余乐安. 基于单变量分解集成的牛奶消费需求预测研究[J]. 系统科学与数学, 2013,33(1):11-19.
[17]CHEN M Y, CHEN B T. A hybrid fuzzy time series model based on granular computing for stock price forecasting [J]. Information Sciences, 2015, 294:227-241.
[18]MA X J, JIN Y, DONG Q L. A generalized dynamic fuzzy neural network based on singular spectrum analysis optimized by brain storm optimization for short-term wind speed forecasting [J]. Applied Soft Computing, 2017, 54:296-312.
[19]YE F R, ZHANG L M, ZHANG D F, et al. A novel forecasting method based on multi-order fuzzy time series and technical analysis [J]. Information Sciences, 2016, 367:41-57.
[20]SHUKUR O B, LEE M H. Daily wind speed forecasting through hybrid KF-ANN model based on ARIMA [J]. Renewable Energy, 2015, 76:637-647.
[21]KRISTJANPOLLER W, MINUTOLO M C. Gold price volatility: a forecasting approach using the Artificial Neural Network-GARCH model [J]. Expert Systems with Applications, 2015, 42(20):7245-7251.
[22]苏治，卢曼，李德轩．深度学习的金融实证应用：动态、贡献与展望[J]．金融研究， 2017(5)：111-126．
[23]ELMAN J L. Finding structure in time [J]. Cognitive Science, 1990,14(2):179-211.
[24]张帆. 基于神经网络模型的沪深300指数预测[J]. 统计与决策, 2013(7):79-82.
[25]GREFF K, SRIVASTAVA R K, KOUTNIK J, et al. LSTM: a search space odyssey [J]. IEEE Transactions on Neural Networks & Learning Systems, 2017, 28(10):2222-2232.
[26]GERS F A, SCHMIDHUBER J, CUMMINS F. Learning to forget:continual prediction with LSTM [J]. Neural Computation, 2000, 12(10):2451-2471.
[27]YOSHIHARA A, FUJIKAWA K, SEKI K, et al. Predicting stock market trends by recurrent deep neural networks [J]. Springer International Publishing, 2014, 8862:75-769．
[28]XIONG R, NICHOLS E P, SHEN Y．Deep learning stock volatilities with google domestic trends [J]. Papers, 2016.
[29]冯宇旭, 李裕梅. 基于LSTM神经网络的沪深300指数预测模型研究[J]. 数学的实践与认识, 2019, 49(7): 308-315.
[30]LIU Y. Novel volatility forecasting using deep learning-Long short term memory recurrent neural networks [J]. Expert Systems with Applications, 2019,132:99-109.
[31]ESEYE A T, ZHANG J H, ZHENG D H, et al. Short-term wind power forecasting using a double-stage hierarchical hybrid GA-ANFIS approach:2017 IEEE 2nd International Conference on Cloud Computing and Big Data Analysis (ICCCBDA) [C]. [S. l]:IEEE, 2017:499-503.
[32]WANG S Y, YU L A, LAI K K. Crude oil price forecasting with TEI@I methodology [J]. Journal of Systems Science and Complexity, 2005, 18(2): 145-166.
[33]WALCZAK B, MASSART D L. Noise suppression and signal compression using the wavelet packet transform [J]. Chemometrics and Intelligent Laboratory Systems, 1997,36(2):81-94.
[34]HUANG N E, ZHENG S, LONG S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis [J]. Proceedings of the Royal Society A,1998,454(1971):903-995.
[35]秦宇. 应用经验模态分解的上海股票市场价格趋势分解及周期性分析[J]. 中国管理科学, 2008(S1):219-225.
[36]WEI L Y. A hybrid ANFIS model based on empirical mode decomposition for stock time series forecasting [J]. Applied Soft Computing, 2016,42:368-376.
[37]WU Z, HUANG N E. A study of the characteristics of white noise using the empirical mode decomposition method [J]. Proceedings of the Royal Society A,2004,460(2046):1597-1611.
[38]姚卫东,王瑞君.结构分解视角下股市波动与政策事件关系的实证研究——基于EEMD算法[J].上海经济研究,2016(1):71-80.
[39]向玲,鄢小安.汽轮机转子故障诊断中LMD法和EMD法的性能对比研究[J]. 动力工程学报,2014,34(12):945-951.
[40]DRAGOMIRETSKIY K, ZOSSO D. Variational mode decomposition [J]. IEEE Transactions on Signal Processing, 2014, 62(3):531-544．
[41]何凯,苏梽芳,何卫平.上证基金指数波动结构分解与短期预测:基于EEMD模型[J].金融理论与实践,2014(1):80-85.
[42]HE F F, ZHOU J Z, FENG Z K, et al. A hybrid short-term load forecasting model based on variational mode decomposition and long short-term memory networks considering relevant factors with Bayesian optimization algorithm [J]. Applied Energy, 2019, 237:103-116.
[43]BISOI R, DASH P K, PARIDA A K. Hybrid Variational Mode Decomposition and evolutionary robust kernel extreme learning machine for stock price and movement prediction on daily basis [J]. Applied Soft Computing Journal, 2019 (74):652-678.
[44]WANG D Y, YUE C Q, WEI S, et al. Performance analysis of four decomposition-ensemble models for one-day-ahead agricultural commodity futures price forecasting [J]. Algorithms, 2017,10(3):108.
[45]YIN H, DONG Z, CHEN Y L, et al. An effective secondary decomposition approach for wind power forecasting using extreme learning machine trained by crisscross optimization [J]. Energy Conversion and Management, 2017, 150:108-121.
[46]殷豪,等.二层分解技术在电价预测中的应用研究[J].计算机应用研究,2019,36(4):1101-1105.
[47]罗宏远,等.基于二层分解技术和改进极限学习机模型的PM2.5浓度预测研究[J]. 系统工程理论与实践, 2018, 38(5):1321-1330.
[48]LAHMIRI S. A variational mode decompoisition approach for analysis and forecasting of economic and financial time series [J]. Expert Systems with Applications, 2016, 55:268-273.
[49]JIAN W, BAO Y L, YE J M. Crude oil price analysis and forecasting based on variational mode decomposition and independent component analysis [J]. Physica A:Statistical Mechanics and its Applications, 2017, 484:412-427.
[50]LAHMIRI S. Comparing variational and empirical mode decomposition in forecasting day-ahead energy prices [J]. IEEE Systems Journal, 2017,11(3):1907-1910.
[51]ABDOOS A A. A new intelligent method based on combination of VMD and ELM for short term wind power forecasting [J]. Neurocomputing, 2016, 203:111-120.
[52]肖怀硕,等.灰色理论—变分模态分解和NSGA-Ⅱ优化的支持向量机在变压器油中气体预测中的应用[J].中国电机工程学报,2017, 37(12):3643-3653.
Research on the Forecast of CSI 300 Index Based on VMD-EEMD-LSTM Model
GUO Jin-lu
(Liberal Arts Division, Higher Education Press, Beijing 100029, China)
Abstract：The non-stationary, non-linear, long memory and other characteristics of the stock index series make it difficult to predict. In order to improve the prediction accuracy of existing models, this paper combines a two-layer decomposition technique and a long-term and short-term memory deep neural network, and proposes a new forecasting model of Shanghai and Shenzhen 300 stock index returns for the first time. The combined model is composed of Variational Modal Decomposition (VMD), Ensemble Empirical Mode Decomposition (EEMD) and two long-term and short-term memory neural networks (LSTM). A total of 858 transaction data from the CSI 300 Index from March 1, 2016 to August 30, 2019 were selected as the modeling objects, and the data from the last 50 trading days were taken as the test sample. The empirical results show that the RMSE, MAE and MAPE of the VMD-EEMD-LSTM model are 0.553 2, 0.461 3, and 1.284 2, respectively, which are significantly better than the existing secondary decomposition and single decomposition combination models, and have significant prediction advantages. The research results can help the financial market regulatory authorities to carry out risk early warning work in time and formulate reasonable risk management policies, at the same time, it can also help investors adopt effective investment strategies and reduce investment risks.
Key words：stock index forecasting; secondary decomposition; variational modal decomposition (VMD); long-term and short-term memory neural networks (LSTM)
中图分类号：F832
文献标识码：A
文章编号：1005-1007(2020)08-0031-14
收稿日期：2020-02-15
基金项目：国家自然科学基金项目(71573042,71973028)。
作者简介：郭金录，高等教育出版社文科事业部经管分社副社长，副编审，主要从事金融科技和创业金融研究。
责任编辑廖筠

		自动登录	找回密码
密码			立即注册