关键词:
出口预测
Prophet模型
LSTM模型
层次时间序列
摘要:
对外贸易出口作为我国与其他国家相关联的经济纽带,发展状态直接关系到国家发展水平,健康平稳的对外贸易出口对我国国家竞争实力的提升具有不可忽视的重要作用,当前和今后一段时期,我国仍处于重要战略机遇期,实现对外贸出口的准确预测有利于帮助政府制定外贸指导政策,对促进国家经济长期向好发展而言意义十分重大。
我国对外贸易出口额是国际、国内多种复杂因素相互作用的结果,在实际中对出口进行预测时面临着两方面问题:一方面,从上至下、从广到细的任何维度的预测都具有一定的应用价值,不同颗粒度的出口额时间序列数量庞大且具有非线性、非平稳、强波动性、弱规律性的特点,传统的时间序列模型很难普适性地满足大量不同出口额时间序列的预测需求;另一方面,出口额时间序列之间往往存在层次关系,相互具有关联影响,针对层次序列中的任意序列进行预测时,更合理的做法是对不同层次的出口额时间序列预测后按层次结构调整,以保证各层级的预测总和正确。
基于此,提出针对我国对外贸易出口额层次时间序列的Prophet-LSTM分层预测模型。一方面,Prophet模型灵活、高效,对具有不同数据特征的不同出口额时间序列都能达到高效的拟合和预测,而LSTM模型具有学习时间序列非线性波动规律的优势,能够作为对Prophet模型的优化补充,从Prophet时间序列分解模型和LSTM深度学习模型的融合策略角度,更全面地捕捉出口额时间序列的线性和非线性成分,以提高预测效果;另一方面,分层预测理论的应用保证模型更好地把握时间序列数据间的层次关系,协调数据的结构特征,扩宽预测分析的广度和深度,保证预测合理性。
首先,基于2002年1月至2022年8月海关总署统计月报中按国别分布和商品类章分类的出口数据,构建了具有“总体-区域-商品”三层关系的出口额层次时间序列,“总体”作为A层,“区域”作为B层,“商品”作为C层。其中,在“区域”层,将43个主要国家和地区归类为亚洲、非洲、欧洲、拉丁美洲、北美洲、大洋洲六大洲,在“商品层”,将HS二位编码下98章商品归类为资源密集型商品、劳动密集型商品、资本密集型商品和技术密集型商品,最终形成31个层次时间序列。通过分析总结了我国对外贸易出口额层次时间序列的数据特点:明显的非线性特点,序列波动强、噪声大,数据频率不高,有效数据点较少,得出了建模预测过程需要参数调优手段的配合,以及需要对突变点的提前分析量化并纳入模型的结论。
其次,依次针对31个出口额层次时间序列构建Prophet模型,拟合分段线性趋势项,年周期项,加入金融危机和新冠疫情特殊事件项,结合超参数优化选取最佳模型,将序列分解为趋势项、周期项、特殊事件项和残差项,重点分析了TOTAL序列的分解和预测效果,发现Prophet模型对于时间序列异常点、特殊事件波动的拟合具有优异的表现。同时,针对31个层次时间序列进行平稳性检验后发现原始序列不平稳,部分2阶差分序列仍不平稳,后建立ARIMA模型,结合超参数优化选取最佳模型,将Prophet模型预测结果与ARIMA模型预测结果对比后发现,在A、B、C三层,Prophet模型的测试集MAPE误差平均值均优于ARIMA模型。综合来看,Prophet在两方面优于ARIMA模型,一是ARIMA模型对序列平稳性要求高,然而出口额层次时间序列不具备平稳性,Prophet模型受限小,更加适用于若干非平稳序列的建模预测;二是Prophet模型的设定丰富,使用灵活,整体预测精度优于ARIMA模型。
然后,以Prophet模型的残差项作为输入数据构建LSTM模型,使用LSTM模型2层堆叠模型,结合超参数优化选取最佳模型,将LSTM对残差项的预测值与Prophet趋势项、周期项、特殊事件项的预测值相加,得到最终Prophet-LSTM模型的预测结果,并与单一Prophet模型、单一LSTM模型以及Prophet和LSTM线性组合模型的预测结果进行对比,发现Prophet-LSTM模型是在31个层次时间序列上表现最好的模型,测试集MAPE误差平均值为12.18%,单一Prophet模型次之,Prophet和LSTM线性组合模型第三,而LSTM模型最后。组合策略下,Prophet-LSTM模型比单一Prophet的MAPE误差平均值降低了2.06%,证明使用LSTM模型对残差进行补充预测是有效的集成策略,LSTM模型对提升Prophet模型预测性能起到正向作用。
最后,针对Prophet-LSTM模型预测结果,根据31个出口额时间序列的A、B、C层次关系,使用分层预测方法中的自上而下法、自下而上法和组合调节法分别对三层出口额预测结果进行协调调节,最终对比选择按照预测比例的自上而下方法的调整结果,调整后的测试集MAPE误差平均值为10.88%,并保证了各层级的预测总和正确,结合整体和局部角