全市场都下跌了，这套LLM智能体选出的策略累计收益超50%，重点是代码开源！

发布时间：2024 年 09 月 10 日

金融 量化交易

Automate Strategy Finding with LLM in Quant investment

尽管深度学习在金融交易领域取得了显著进展，但现有模型仍面临不稳定和高不确定性的挑战，限制了其实际应用。我们提出了一种结合大型语言模型（LLM）和多代理架构的新框架，用于量化股票投资和阿尔法挖掘。该框架通过集成 LLM 生成多样化的阿尔法，并利用多代理系统动态评估市场状况，解决了现有模型的不足。我们的框架首先从多模态金融数据中提取预测信号，然后通过集成学习构建多样化的交易代理池，最后利用动态权重机制根据实时市场条件优化策略。实验结果显示，该框架在中国股票市场上显著优于现有最先进模型，证明了 LLM 与多代理架构结合的有效性。这项研究不仅为量化投资策略提供了新的思路，也为金融交易中整合先进机器学习技术设定了新标准，具有广泛的应用前景。

https://arxiv.org/abs/2409.06289

如遇无法添加，请+ vx: iamxxn886

picture.image

应大家要求，开一个金融科技的群

背景

在量化交易领域，Alpha因子挖掘是核心焦点之一：探索和提炼那些能够预测资产收益的预测信号。

picture.image

尤金·法玛提出了有效市场假说（Efficient Market Hypothesis，EMH），指出股票价格是所有市场可用信息的反映，股票价格应当全面反映市场内所有可获取的信息。

随着研究的深入，当前 Alpha 挖掘过程存在三大主要挑战：

-（1）传统方法的僵化性：金融领域中识别 Alpha 因子的传统方法往往依赖于启发式规则和金融专业知识。这些基于规则的方法通常仅在特定市场条件下表现出色，缺乏适应不同市场动态的灵活性。

-（2）数据的多样性与整合：近期研究探索了运用机器学习技术从诸如经济新闻、社交媒体趋势和历史价格走势等多样数据源中挖掘 Alpha 因子。

-（3）对市场变化的适应性：市场动态变幻莫测，在一种环境中表现良好的策略在另一种环境中可能失效。

近年来，运用深度学习方法来预测市场并形成策略逐渐成为主流。在不同市场条件下有效地挖掘和利用 Alpha 因子仍是一项重大议题。

为解决这一问题，作者提出了一个新框架，借助大型语言模型（LLMs）的能力来进行 Alpha 挖掘和策略优化。

实现思路

作者提出的新框架，目前已经作为开源代码发布在：https://anonymous.4open.science/r/Automate-Strategy-Finding-with-LLM-in-Quant-investment-ADA2/

picture.image

如上图所示，新框架由三个核心组件构成：

• 种子阿尔法工厂 （Seed Alphas Factory）：利用大型语言模型（LLMs）来过滤和分类多模态数据，从而构建出强大的种子Alpha集合。
• 多智能体决策流程 （Multi-Agent Decision-Making Process）：运用多模态多智能体决策流程。多智能体方式能够纳入不同的风险观点，增强策略在不同市场条件下的适应性和稳健性。此阶段产生的成果是生成适合当前市场状态和风险偏好的Alpha因子列表。
• 权重优化方式 （Weight Optimization Approach）：通过深度神经网络（DNN）优化所选阿尔法的权重以预测未来收益，为动态且适应性强的投资策略奠定基础。

2.1 种子阿尔法工厂：LLM 过滤与分类

利用大型语言模型（LLMs）的总结和分类能力，加速对近期阿尔法挖掘研究的理解，并为进一步发展构种子阿尔法工厂。

使用了名为“Alpha Grail”的 ChatGPT 定制版本来执行 LLM 过滤和分类任务。Alpha Grail 的主要作用是通过处理与阿尔法相关的研究文档，协助量化研究人员构建种子阿尔法工厂。

给 Alpha Grail 的具体指令是：

总结文档信息，帮助量化研究人员依照传统金融类别构建种子阿尔法工厂，确保每个类别的种子阿尔法相互独立。

picture.image

作者提供了 11 份阿尔法挖掘研究不同背景的文档，具体文档如上图。通过这些文档，Alpha Grail 生成了9个列别 100 个种子 Alpha 因子（如下图），如动量、均值回归、波动率和基本面分析。

picture.image

LLM 过滤与分类阶段也融合了多模态处理能力。通过纳入研究文档中的文本、图像、表格和图形等多模态数据源，LLM 能够对种子阿尔法进行更全面的分析和分类。多模态方法增强了 LLM 捕捉研究中复杂细节和关系的能力，有利于生成更强大和多样化的种子Alpha因子库。

2.2 多模态和多智能体评估Alpha因子集

通过多模态和多智能体系统对阿尔法因子进行全面评估和筛选。通过整合不同的数据源并利用多个分析视角，确保对种子阿尔法进行多元化和深入的评估。

使用了包含文本、数字、视觉和多媒体输入的多模态数据，使得整个评估过程更为丰富和全面。通过整合这些不同的数据类型，能够全面了解市场状况和阿尔法因子的表现。

picture.image

上表列出了评估框架中使用的五种数据类型。这种整体性方法有助于对市场动态进行细致的理解，并增强评估过程的稳健性。

多智能体系统由各种智能体组成，每个智能体都具有不同的风险偏好和投资策略。

智能体主要任务包括：

• 分析多模态数据，并依据各自的标准评估种子阿尔法。
• 进行风险偏好分析，根据其预定义的风险参数评估种子阿尔法。
• 选择符合其风险偏好和市场分析的阿尔法因子，确保在不同市场情形下的相关性和稳健性。

为了提高所选阿尔法因子的可靠性，实施了置信度评分机制。每个智能体根据其分析和历史表现为阿尔法因子分配置信度分数，反映智能体对阿尔法因子预测能力和稳健性的评估。

所选的阿尔法因子运用历史市场数据进行严格的回测，以评估它们在各种市场条件下的表现。对于确定最终策略中最具潜力的阿尔法因子至关重要。

关键评估指标包括信息系数（IC）和夏普比率等性能指标。每个类别的种子阿尔法因子必须达到特定的置信度分数阈值才能被纳入最终选择，以确保只选取最可靠和稳健的阿尔法因子。

为了实现选择过程的自动化，设计了基于类别的阿尔法选择算法。该算法依据置信度分数从不同类别中识别和挑选阿尔法。输入包括多个类别，每个类别包含一组阿尔法和一个置信度阈值。算法从一个空的选定阿尔法集合开始，并遍历每个类别，使用 SelectBestAlphas 函数确定最有前景的候选者。评估每个阿尔法的置信度分数，超过阈值的被纳入最终集合。

这个过程对所有类别重复进行，确保从所有类别中严格挑选出符合置信度标准的阿尔法。最终输出是一组成功通过置信度评估的选定阿尔法。

2.3 最优权重阿尔法策略

为优化所选种子阿尔法的权重，运用深度神经网络（DNN）将阿尔法值拟合至未来收益。

网络架构包含三层：输入层、隐藏层和输出层。

• 输入层将从历史收盘价得出的每日阿尔法计算作为输入特征。
• 隐藏层配备了十个节点，采用 ReLU 激活函数引入非线性并增强模型的学习能力。
• 输出层由单个节点构成，用于预测未来收益。

为确保模型的泛化能力并防止过拟合，使用了单独的验证集。

构建了一个基于历史阿尔法值预测未来收益的强大框架，从而形成有效的投资策略。DNN 模型通过隐藏层处理输入数据，利用学习到的权重和偏差进行转换。最终输出通过在输出层应用另一组权重、偏差和激活函数生成。

效果评估

RQ1：该框架能否根据市场条件差异捕获新的阿尔法？

picture.image

作者提出了一种提示架构（如上图），将多模态市场信息融入大型语言模型（LLM），以达成多模态知识提取，并在不同的市场条件下选取最优的种子阿尔法。

通过整合来自金融新闻情绪的文本数据、公司财务报表的数值数据和交易图表的视觉数据，新框架提供了全面的股票分析。这种数据融合确保了全面的市场观点，增强了决策能力。上下文分析依照市场趋势和行业表现调整参数，确保相关且准确的阿尔法选择。实验证实了该框架在不同市场条件下进行多模态知识提取和动态阿尔法选择的有效性。

picture.image

如上图，在案例 1 中，运用 2021 年 12 月 31 日至 2022 年 9 月 30 日的上证 50 公司公告、财务报表、K 线图和交易图表，所选的阿尔法包含动量和基于成交量的指标，如价格动量、相对强弱指标（RSI）、平滑异同移动平均线（MACD）、移动平均线、布林带、成交量、市值和每股收益调整。

在案例 2 中，着重于增量更新的上证 50 相关新闻、股票评论和中国宏观经济指数，所选的阿尔法强调了波动性和经济因素，包括平均真实波动幅度（ATR）、布林带比率、带延迟的基于成交量的指标、毛利润和营业收入比率以及高低价格比较。

表明通过整合不同的数据源并采用先进的分析模型捕捉新的投资机会。这种动态方式确保所选的阿尔法与当前市场条件相关并做出响应，增强了投资策略的稳健性和有效性。

RQ2：由LLM驱动的Alpha因子挖掘框架是否优于现有框架？

在评估所选种子阿尔法信号的性能时，主要指标是信息系数（IC，Information Coefficient）。这些指标可以用来衡量阿尔法值对未来回报的预测能力。

信息系数（IC）衡量预测的Alpha值与实际未来回报之间的相关性。通过皮尔逊相关系数进行量化，该系数评估两个变量之间的线性关系。较高的 IC 表明更强的预测关系，意味着阿尔法值在预测回报方面更有效。

评估了四个最常见的阿尔法类别：动量、均值回归、波动性、基本面和增长。

picture.image

上图展示了每个类别的平均 IC 值。结果表明，由大语言模型驱动的框架在所有类别中始终取得了更高的平均 IC 值，特别是在波动性和基本面方面，表明与传统框架相比具有更出色的交易有效性。

RQ3：新框架选出的策略能否持续跑赢市场？

picture.image

上表展示由新框架生成的 12 个阿尔法的示例组合，在上证 50 成分股进行评估。

权重组合 IC 值颇高，为-0.0587。尽管部分种子阿尔法单独的 IC 值相对较低，但将其移除会致使重新训练的组合权重显著降低，表明它们在整体性能中起着关键作用。

例如，如果移除阿尔法#6，权重组合将降至-0.055；一旦移除阿尔法#11，权重组合将仅为 0.0491。表明由大型语言模型选取的种子阿尔法集有效地协同运作，提供了强大的预测能力。

为了回答新框架能否持续跑远市场这个问题，作者在 2023 年 1 月 1 日至 2023 年 12 月 31 日期间，在上证 50 数据集上运用了一种简易的投资方法进行了回测。

根据股票的阿尔法值进行排序，挑选表现最优的股票进行投资。在选定的股票中均匀分配资金，为降低交易成本，每天的交易数量限制在5只以内。

picture.image

在实验中，设定每日选股上限为13只，交易上限为5只。测试期间各策略净值的变化如上图所示。尽管并未专门追求绝对收益的最大化，但在回测中却展现出了卓越的表现，相较于其他方法，实现了最高的盈利。

2023年的回测结果显示，累计回报率达到了53.17%，与此同时，指数下跌了11.73%，EFund下跌了9.17%，Boshi Fund下跌了8.81%。还将新框架与其他阿尔法挖掘方法进行了对比，结果表明，新框架在市场中能够获得最大的利润。

• 论文原文: https://arxiv.org/abs/2409.06289
• 获取更多最新 Arxiv 论文更新: https://github.com/HuggingAGI/HuggingArxiv!
• 加入社群，+v: iamxxn886
• 点击公众号菜单加入讨论

picture.image