打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
CausalStock: 利用新闻和因果发现解释股票走势变化

原文链接:「链接」

论文链接:
https://arxiv.org/pdf/2411.06391v1

在新闻驱动的多股票走势预测任务中存在两个未被现有工作很好解决的问题。一是“关系发现”在利用其他股票价格信息实现准确股票走势预测时至关重要,因果关系更适合捕捉股票间的影响。二是新闻数据存在大量噪声,难以提取有效信息。为此提出CausalStock框架用于新闻驱动的多股票走势预测,它能发现股票间的时序因果关系。设计了滞后相关的时序因果发现机制来建模时序因果图分布,采用功能因果模型封装发现的因果关系并预测股票走势,还提出去噪新闻编码器利用大模型(LLMs)从海量新闻数据中提取有用信息。实验结果表明,CausalStock在六个真实数据集上的新闻驱动多股票走势预测和多股票走势预测任务中均优于强基准模型,并且具有良好的可解释性。

1 背景

金融服务行业在运用数据科学方法辅助投资决策方面一直处于领先地位,其中量化交易备受学术界和工业界关注。多年来,研究人员探索了多种预测股票走势(股价涨跌)的方法,如单股票走势预测、多股票走势预测、新闻驱动股票走势预测等。在新闻驱动多股票走势预测任务中,常见的模型范式是将多股票的历史价格特征和股票相关新闻作为输入,利用精心设计的神经网络进行股票走势预测。这一任务的两个关键建模点是对股票关系建模以提高预测准确性,以及构建文本挖掘模块从新闻数据中提取有效信息以利于股票走势预测。尽管已有研究取得了显著进展,但仍存在一些需要进一步关注的问题。在股票关系建模方面,现有工作多基于注意力或图来建模相关关系,但因果关系更适合描述股票间的影响。在文本挖掘方面,传统的文本表示方法存在局限性,而大型语言模型(LLMs)在处理新闻文本数据中的噪声方面具有独特优势。

2 问题定义

本文聚焦于新闻驱动的多股票走势预测任务,目标是针对目标交易日T,将D只股票过去L个时间滞后信息(包括新闻语料表示和历史价格特征表示)作为模型输入,预测所有股票在T日的调整后收盘价走势(上涨或下跌),即最大化条件概率分布p(y_T|X_{<T})的对数似然,从而生成最可能的y_T。

3 方法

3.1 CausalStock模型概述

整体过程分为时序因果图发现p(G|X_{<T})和给定因果关系下的预测过程p(y_T|X_{<T},G)两部分联合训练。

CausalStock主要由三个组件构成:

市场信息编码器(MIE):对新闻文本和股票价格特征进行编码。其中,基于大模型(LLM)的去噪新闻编码器(DNE)是一大创新点。

滞后相关的时序因果发现(Lag - dependent TCD)模块:基于给定的股票市场信息,利用变分推理挖掘因果关系,即对p(G|X_{<T})进行建模。

功能因果模型(FCM):根据发现的因果图对未来价格走势进行预测,即对p(y_T|X_{<T},G)进行建模。

3.2 市场信息编码器(MIE)

价格编码器:对于第i只股票,将交易日t的原始调整收盘价、最高价、最低价、开盘价、收盘价和交易量P_{t}^{i}输入嵌入层,得到历史价格的表示。

基于LLM的去噪新闻编码器(DNE):新闻编码器旨在嵌入股票相关新闻文本。由于新闻文本数据存在大量噪声,这里提出基于LLM的去噪新闻编码器。利用LLM并设计一系列提示,从新闻与股票的相关性、新闻的情感极性、新闻事件的重要性、新闻对股价的潜在影响、新闻影响的持续时间这五个维度分析新闻文本与特定股票的关系,每个维度进行评分,将第t天的第i个文本表示为五维表示C_{t}^{i},经过嵌入层后得到最终的去噪新闻嵌入。

3.3 滞后相关的时序因果发现(Lag-dependent TCD)

图先验:p(G)由图稀疏先验和特定领域知识先验两部分组成,未归一化的图先验公式为

其中lambda_{s}和lambda_{d}是权重,G^{p}是可选的特定领域知识图。

变分近似图后验:将q_{phi}(G)按照与p(G)相同的方式分解,对G中的每个潜在因果链接G_{l,ji},令其后验q_{phi}(G_{l,ji}|G_{l-1,ji})服从伯努利分布B。

通过一系列变换得到因果链接存在概率张量,从而得出变分后验q_{phi}(G)。在训练阶段,采用Gumbel-softmax重参数化来随机估计关于phi的梯度。另外,设计了可学习的因果权重图hat{G}来衡量因果程度。

3.4 功能因果模型(FCM)

设计一个FCM来对p_{theta}(y_T|X_{<T},G))进行建模,聚焦于加性噪声FCM生成y_T。设计了一个新的FCM来基于发现的因果图G和因果权重图hat{G}聚合包括新闻和价格在内的市场信息,公式为

,其中sigma_{i}、l和psi都是神经网络。对外生噪声z_{T}^{i}采用高斯分布建模,根据变量替换公式得出条件分布p_{theta}(y_T^{i}|P a_{G}^{i}(<t)),进而得到对数似然log p_{theta}(y_T|X_{<T},G)。

3.5 训练目标

通过最大化条件对数似然log p_{theta}(y_T|X_{<T})来训练模型。模型目标的变分证据下界(ELBO)推导得出,

还采用二元交叉熵损失BCE(g_T,y_T)作为另一个目标来提高学习性能,

最终的训练损失为

,其中lambda是平衡损失项的权重。

4 实验

4.1 实验设置

数据集:在六个数据集上训练和评估模型及基准模型,其中ACL18、CMIN - US、CMIN - CN包含历史价格和文本数据,用于新闻驱动多股票走势预测任务评估;KDD17、NI225、FTSE100仅含历史价格,用于无新闻的多股票走势预测任务评估。

评估指标:通过准确率(ACC)和马修斯相关系数(MCC)评估模型的预测性能,还采用累计投资组合价值(APV)和夏普比率(SR)评估投资模拟。

基准模型:针对新闻驱动多股票走势预测任务有HAN、Stocknet、PEN、CMIN等基准模型;针对多股票走势预测任务有LSTM、ALSTM、Adv-ALSTM、DTML等基准模型。

4.2 预测准确性结果

在新闻驱动多股票走势预测任务中,CausalStock在三个数据集上的ACC和MCC均优于所有基准模型,表现出鲁棒性。在多股票走势预测任务中,CausalStock在三个数据集上也超过了所有基准模型,性能稳定。

4.3 消融研究

在ACL18、CMIN - CN和CMIN - US上进行了几种模型变体的消融研究,包括对主框架的五种变体(如去除因果发现模块、去除新闻编码器、仅建模因果链接存在可能性、替换滞后相关的时序因果发现模块、添加变量相关的因果机制),以及用不同传统新闻编码器替换去噪新闻编码器,还用不同的LLMs作为去噪新闻编码器进行探索。结果表明有新闻编码器的CausalStock性能优于无新闻的;滞后相关的TCD机制有价值;变量相关的因果机制有提升模型性能的潜力但计算复杂;去噪新闻编码器比传统新闻编码器有更高的ACC和MCC。

4.4 可解释性结果

去噪新闻编码器模块:给出三个案例,表明去噪新闻编码器能够有效辨别和量化新闻对股票价格的潜在影响。

滞后相关的TCD模块发现的因果图:将因果强度图定义为因果图G和因果权重图hat{G}的点积,通过可视化因果强度矩阵发现不同市值的股票因果关系模式,计算公司市值与股票因果强度之间的斯皮尔曼等级相关系数,结果显示在不同数据集上市场价值和因果影响力之间有很强的正相关,表明CausalStock能很好地揭示股票市场内的因果关系。

4.5 投资模拟

按照先前工作的方法,通过选择预测概率最高的三只股票构建投资组合策略,计算累计投资组合价值(APV)和夏普比率(SR)。CausalStock在三个数据集上实现了更高的利润,表明其在平衡风险和回报方面具有出色能力。

5 结论

提出了名为CausalStock的新闻驱动多股票走势预测框架,设计了滞后相关的时序因果发现机制来揭示股票间的因果关系,采用功能因果模型封装因果关系并预测未来走势。通过在多个真实数据集上的实验证明了CausalStock的有效性,并且CausalStock能提供具有可解释性的清晰预测过程。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变
【源头活水】GALAXY:基于半监督学习的任务型对话预训练模型
CVPR 2021 前景背景分开建模,UCLA 视觉研究组提出用于视频预测的动态语义模型
多所知名高校合著综述论文、Nature新子刊创刊首发,这是你常听到的贝叶斯统计与建模
TPAMI 2024 | SSML深度解析:未来多模态模型的发展机遇与挑战!爱丁堡大学,剑桥等机构发布自监督多模态学习综述!
arXiv 精选:一文看尽六月最热五篇论文
更多类似文章 >>
生活服务
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服