前言:人工智能在金融领域的崛起
近年来,人工智能(AI)技术的发展对各行各业都产生了深远的影响,金融领域也不例外。华尔街的交易员们开始关注一个紧迫的问题:人工智能是否会取代他们的工作?佛罗里达大学金融学助理教授亚历杭德罗·洛佩兹-利拉(Alejandro Lopez-Lira)对此进行了深入研究,他通过实验验证了ChatGPT、DeepSeek和Grok等AI模型在股票投资方面的潜力。他的研究成果表明,当前可用的AI聊天机器人已在股票交易领域展现出令人印象深刻的能力,这无疑为金融行业的未来发展描绘了新的图景。本文将详细探讨DeepSeek以及其他AI模型在股票预测中的表现、其工作原理、面临的挑战以及未来展望,旨在为读者提供一个全面且深入的视角,以理解人工智能如何重塑投资格局。
AI解读市场:从新闻标题到投资决策
洛佩兹-利拉教授的研究始于一个简单的实验:人工智能能否准确判断新闻标题对股票的影响?在OpenAI公司于2022年发布ChatGPT后不久,他便开始了这项测试。他希望了解ChatGPT以及更广泛意义上的人工智能是否具备股票选择的能力。为了回答这个问题,洛佩兹-利拉从第三方数据提供商那里获取了超过134,000条新闻稿和新闻文章标题,涵盖了4,000多家公司。这些海量数据通过Python编程语言被输入到ChatGPT中。ChatGPT的任务是判断每个标题对公司是积极的、消极的还是未知影响。
实验结果令人惊讶。如果ChatGPT认为某个标题是积极的,研究人员就会模拟一次股票购买;如果是消极的,则模拟一次卖空操作,即押注股价下跌。如果ChatGPT不确定,则不采取任何行动。这是一项学术模拟,没有实际股票交易发生,但软件将模拟的性能与历史结果进行了比较。每天都会进行股票选择,平均购买70只股票,卖空20只股票。
为了确保AI的判断是基于推理而非已知结果,洛佩兹-利拉教授采取了一个巧妙的“回测”策略。他利用OpenAI在2022年训练ChatGPT时使用的截止到2021年9月的数据,对2021年10月之后的新闻标题进行测试。这样,ChatGPT无法预知未来的市场走势,只能依靠其内部逻辑和对经济信息的理解来做出判断。
他的研究成果于2023年4月在SSRN预印本平台发布,题为《ChatGPT能否预测股票价格走势?资产市场中的回报可预测性和大型语言模型》。这项研究发现,ChatGPT对资产市场的经济结果具有“显著的预测能力”。其中,GPT-4版本在2021年10月至2023年12月期间,平均每日回报率为0.38%,累计复合回报率超过650%。
从学术模拟到实战应用:DeepSeek的登场
这项学术研究虽然令人鼓舞,但也存在局限性。在现实世界中,交易会面临各种“摩擦”,包括券商交易成本和费用、股票的可用性、税收以及价格影响(即大额交易对股价的影响)。此外,约76%的收益来自卖空操作,而卖空策略通常更为复杂,因为它涉及卖空利息费以及寻找可借入并卖出的股票。因此,洛佩兹-利拉教授指出,其研究结果在纸面上看起来比实际投资表现更为乐观。然而,这种积极的回报倾向足以让他得出结论:ChatGPT确实理解经济市场,并具备预测股票走势的能力。
预印本发布约一个月后,洛佩兹-利拉教授获得了将实验从学术领域带入现实世界的机会。一家名为Autopilot的投资应用联系了他,该应用旨在模仿知名公众人物的交易。他们邀请洛佩兹-利拉教授帮助创建一个基于ChatGPT投资选择的投资组合。这对他来说是一个宝贵的实践机会,可以观察其学术实验在现实世界中的表现。
到2023年9月,他开始每月向Autopilot应用提供ChatGPT的投资选择。Autopilot团队会上传这些选择,用户可以将自己的券商账户与这些股票选择关联起来。这一次,由于涉及真金白银,洛佩兹-利拉教授需要做更多的工作,不仅仅是向ChatGPT提供一些新闻标题。他必须为其提供广泛的信息,以确保AI模型能够根据宏观经济环境和公司财务状况做出决策。
洛佩兹-利拉教授指出,目前可用的AI模型还不能直接用于投资决策。整个过程仍然需要人类的参与,为AI模型提供所需的信息,以便其在做出决策前进行考量。这主要是因为AI模型并非基于实时数据进行训练,这意味着它们的知识通常是过时的,甚至包括股票的最新交易价格等基本信息。尽管AI模型能够进行实时网络搜索,但它们并不总是知道要搜索哪些信息才能做出最明智的决策。洛佩兹-利拉教授强调:“大型语言模型很难处理,它们可能会编造信息,有时它们没有正确的信息。所以你必须知道如何提示AI。”
深化DeepSeek在AI投资组合中的应用
由ChatGPT管理的投资组合包含15个头寸,其中10个必须是标普500指数的股票,另外5个必须是与特定行业或部门相关的交易所交易基金(ETF)。为了实现这一目标,洛佩兹-利拉教授使用Python从第三方数据提供商和新闻网站获取宏观经济环境、地缘政治风险、公司财务状况以及标普500指数股票最新价格等信息。然后,他要求ChatGPT综合考虑这些信息,并给公司分配一个1到100的分数,分数越高代表投资价值越高。一旦AI完成了评分,它就会根据这些信息创建一个股票和ETF投资组合。
最近,在今年2月,洛佩兹-利拉教授进一步扩展了实验,在Autopilot上增加了使用Grok和DeepSeek的投资账户。
从那时起,这位佛罗里达大学的教授逐步取消了对这三个AI模型的限制。例如,在3月,这些模型被允许自主决定每个持仓的权重。在4月,这些模型被赋予了更大的自由度,可以在初始的10只股票和5只ETF的参数之外,自行选择多达15个头寸的组合。它们还可以选择包含其他资产类别(如债券和商品)的ETF,但排除了使用杠杆、衍生品和卖空头寸的ETF。
目前,运行这些投资账户的最新AI模型包括OpenAI的o3、xAI的Grok 3和DeepSeek R1。这些模型会根据最新可用版本进行定期更新。洛佩兹-利拉教授还会轮流使用不同的AI模型来总结宏观经济风险和根据1到100的评分标准对公司进行评分,但所有三个模型接收的输入信息都是相同的,无论哪个模型进行了筛选。
以下是每个AI应用程序在4月1日(即唐纳德·特朗普总统宣布关税“解放日”的前一天)至5月5日(重新平衡选择时)期间选择的15个头寸的示例。这些选择基于洛佩兹-利拉教授提供给AI模型截止到3月31日的数据,并使用Grok 3对数据进行了整理。所有三个AI应用程序都获得了相同的信息,但根据洛佩兹-利拉的说法,OpenAI的o1 pro和Grok 3能够包含来自网络搜索的信息。下表显示了每个模型的选择,包括权重、理由(论点)、头寸的优势(优势)和相关的风险。
DeepSeek的选股表现:
DeepSeek的权重分配存在不足,总计为99%。当洛佩兹-利拉教授指出这一点时,DeepSeek给出了两个可能的理由:一是四舍五入问题,二是它可能决定保留1%的现金分配。然而,DeepSeek无法确认哪一个理由是准确的。这表明,即使是先进的AI模型,在某些情况下也可能存在解释其决策过程透明度的问题。
风险与回报:AI投资的现实考量
与任何投资策略一样,AI投资也伴随着风险,过去的表现并不能保证未来的持续。洛佩兹-利拉教授预计,只要这些投资组合是买入股票或坚持多头头寸,它们的表现将与标普500指数持平,或者略有超额或低于大盘。然而,需要注意的是,在非税收优惠账户中每月轮换股票可能会导致短期资本利得的税务责任,短期资本利得的税率通常高于持有超过一年的资产。
尽管洛佩兹-利拉教授的研究结果表明AI可以模仿专业投资组合经理的服务,但一些分析师对此持不同意见。量化资产管理(Quantitative Asset Management)一书的作者迈克尔·罗宾斯(Michael Robbins)指出,虽然每个模型的投资策略看起来都有效,但无法确定其在所有情况下的表现。例如,在新的AI时代,尚未发生大规模的股市崩盘或2008年金融危机等事件,因此无法确定由AI主导的投资账户将如何应对。
罗宾斯认为,虽然人类也会受到自身记忆和经验的影响,但人类是亲身经历这些事件的。这意味着人类在没有预见的情况下,甚至可能凭借一些直觉,度过了这些事件。而机器是预先训练的。因此,他将AI的技能比作刚刚进入职场的投资经理,他们只具备教科书知识。此外,他指出,尽管人类和机器都会犯错误,但AI可能会产生“幻觉”,导致其犯下更极端且不可接受的错误。
还需要注意的是,Autopilot上的三个AI投资账户每月才进行一次再平衡,因此它们无法对任何突发变化做出及时反应。最后,洛佩兹-利拉教授仍然参与其中,监督AI的选择并确保考虑了适当的信息。为此,他从选择加入该账户的订阅收入中获得一小部分分成。
AI投资组合的实际表现数据
洛佩兹-利拉教授于2023年9月开始管理ChatGPT的投资组合。根据Autopilot的数据,从2023年9月到2025年5月30日,该投资组合的收益率为43.5%,这是基于客户投资组合的汇总结果。根据道琼斯市场数据,同期标普500指数的总回报率为34.7%。
相比之下,根据Autopilot的数据,Grok的投资组合自今年2月11日成立至5月30日,回报率为2.3%。根据道琼斯市场数据,同期标普500指数的总回报率下降了2.2%。
而DeepSeek的投资组合自2月3日成立至5月30日,回报率为负0.25%。根据道琼斯市场数据,同期标普500指数的总回报率为负0.93%。
这些实际表现数据进一步验证了AI在投资领域的潜力,尽管不同AI模型的表现存在差异。DeepSeek虽然略有亏损,但在市场整体下跌的情况下,其跌幅小于标普500指数,这表明其在一定程度上具备风险抵御能力。
结论:AI与人类协作的未来
洛佩兹-利拉教授的研究清晰地表明,人工智能在股票投资领域具有显著的潜力,尤其是在处理和解释大量非结构化数据方面。DeepSeek以及其他模型能够从新闻标题中提取情绪,并将其转化为可操作的投资信号,这在过去需要大量人工分析才能完成。
然而,当前的AI模型并非万能。它们需要人类的“在环”(human-in-the-loop)干预,提供最新的实时数据和指导,以确保决策的准确性和合理性。AI的“幻觉”问题以及在极端市场条件下的未知表现,也提醒我们不能完全将投资决策权交给机器。
未来,我们很可能会看到AI与人类交易员和投资组合经理之间更加紧密的协作。AI将承担数据分析、模式识别和初步决策建议等重复性、计算密集型任务,从而解放人类专家,让他们能够专注于更复杂的策略制定、风险管理和人际互动。这种协作模式将有望提升投资效率和决策质量,为金融市场带来新的机遇。