人工智能45:CGAN应用于资产配置

类别:金融工程 机构:华泰证券股份有限公司 研究员:林晓明/李子钰/何康 日期:2021-04-21

  人工智能系列45:将条件生成对抗网络cGAN 应用于大类资产配置本文将生成对抗网络(GAN)的使用场景拓展至投资实践,采用GAN 的变式条件生成对抗网络(cGAN)预测未来20 个交易日各类资产收益率协方差矩阵,并应用于量化资产配置。cGAN 的核心思想是将随机数和资产收益率真实历史序列结合,训练条件生成器生成模拟未来序列,再训练条件判别器区分模拟和真实未来序列。重复生成多次进而得到多资产预期收益率协方差矩阵。对沪深300、中债-国债总财富指数、黄金9999 三类资产进行资产配置策略实证,自2012 年初至2021 年3 月底,cGAN 相比于传统风险平价模型夏普比率从1.41 提升至1.62,Calmar 比率从0.60 提升至1.19。

      cGAN 从贝叶斯学派视角重新定义风险,克服了传统方法的不足资产协方差矩阵是开展风险管理的基础。传统方法基于历史收益率序列计算资产协方差矩阵。其基本思想是适应性预期。然而,历史通常不等于未来。

      其次,传统方法估计的资产协方差矩阵通常只包含历史序列中的线性成分,而丢弃了其中蕴含的非线性信息,导致评估结果与真实情况发生偏差。针对传统方法的不足,本文使用cGAN 从贝叶斯学派视角重新定义风险。cGAN基于市场未来隐状态和过去一段时间内的市场规律,预测未来一段时间的收益率后验分布,并根据收益率后验分布计算资产协方差矩阵。

      条件生成器借鉴自编码器结构,充分利用条件序列蕴含的有效信息条件生成器借鉴了自编码器的结构,旨在根据条件序列生成预测序列。其中,卷积层能够从条件序列中提取浓缩了资产收益率信息的特征序列,转置卷积层通过对特征序列与随机数序列的拼接序列进行上采样,生成预测序列。考虑到不同资产在不同时期的收益率及其波动差异较大,不利于模型训练,因此在输入条件生成器之前,需要对条件序列进行3σ 标准化,并且对生成序列使用相同的标准化参数进行反标准化。

      条件判别器使用WGAN-GP 损失函数,缓解训练不稳定与模式崩溃条件判别器的主体结构是卷积层,旨在对生成序列的真实性进行评价。为了缓解cGAN 在交替训练的过程中可能出现的训练不稳定与模式崩溃等问题,条件判别器使用WGAN-GP 损失函数,来稳定梯度分布。出于与条件生成器相同的考虑,条件序列以及对照序列或生成序列在输入条件判别器之前均需要进行3σ 标准化。为了不引入未来函数,三者均应使用条件序列的均值和标准差进行标准化。

      cGAN 优于传统风险平价方法,且在不同因素改变时彰显出鲁棒性本研究以多资产风险平价组合为例,对比cGAN 与传统风险平价模型在回测表现上的优劣。选取沪深300 指数、中债-国债总财富指数、SGE 黄金9999 作为大类资产的代表,采用滚动窗口的方式进行回测。结果表明,改变模型训练代数(分别取300、400、500、600 代)、训练过程随机数种子(分别取0 和1)、生成过程随机数种子(分别取0 和1)、回测起始日期(延后10 个交易日)、多资产组成(改为中证800 指数、标普500 指数、英国富时100 指数),cGAN 的表现均优于传统方法,彰显出较高鲁棒性。

      风险提示:cGAN 模型的训练结果对随机数种子较为敏感;cGAN 模型换手率较高,而本文回测未考虑交易成本的影响;模型根据历史规律总结,历史规律可能失效;模型结论基于统计工具得到,在极端情形下或存在解释力不足的风险。