神经网络因子挖掘(四):因子风格暴露与标签中性化
2024年神经网络类量价因子依旧可观我们回顾了2024 年神经网络量价因子的表现,发现其在沪深300 指数中的预测能力显著超过历史平均水平,而在中证全指成分股内,合成因子的5 日收益率RankIC 为11.28%与历史平均水平较为接近,但20 日收益率RankIC 为10.69%,相对于历史平均水平14.90%有较大下滑,这可能与2024 年行业轮动和风格轮动的速度加快有关。
Alpha 预测是提升收益稳定性的关键
通过将预测目标调整为市值行业Barra 中性化收益率(Alpha1),模型风格暴露显著降低。以残差波动因子为例,Alpha1 与Barra 风格因子相关系数均值从Baseline 的-29.45%降至-15.04%。因子严格中性化后Alpha1 的Top 组超额收益达20.19%,较Baseline 提升3.15%,且在2024 年2 月及9 月的极端行情中回撤更小。
因子存在一定的风格择时能力
严格中性化后,我们的合成因子RankIC 普遍下滑三分之一,表明原模型收益部分依赖Beta 暴露(如小市值、低流动性)。但Beta 收益并非完全无效,沪深300 内因子通过风格择时(如2019-2020 年偏大市值,2022-2023 年偏小市值)实现长期超额。因此,需结合事前剔除(软中性)与事后约束(硬中性),平衡Alpha 与Beta 收益的获取。
Alpha 收益率和原始收益率作为预测目标各有利弊对比Alpha1 与Baseline 的多头净值比,二者在2019-2021 年表现趋同,但2024 年Alpha1在市值因子剧烈切换时优势显著。对比二者后,我们发现不同策略在全年收益相近(中证全指23.75%),但是在路径上有较大区别。
预测Beta 收益或可进行风格择时
我们以Beta 预测值与每个风格因子的IC 时间序列为基础,再计算其IC 值的20 日差分作为对应风格方向择时指标,计算该指标与风格因子是否反向的混淆矩阵,目的在于观察我们的预测值是否有风格异常时的提示能力。从精确率和召回率的角度来看,有一定的效果,但也无法作为一个高胜率的指标来使用。
将Alpha 预测值和Beta 预测值按照3:1 比例线性加权后与原始收益率预测值较为接近,但多头超额可进一步提升,最终相比于Baseline 提升3.07%。
风险提示
1、深度学习模型训练过程中有随机性,可能导致预测结果有误差;2、模型总结的市场规律是基于历史数据的,存在失效风险;3、日频交易策略回测结果仅供参考;
4、数据处理细节上的差异对策略有一定的影响。