2025年1月,中国AI研究实验室DeepSeek发布了其高效的开源AI模型DeepSeek-R1,引发了AI界的震动,并导致Nvidia(纳斯达克代码:NVDA)股价一度暴跌17% 。该模型在性能上与OpenAI的O1和Meta的Llama AI等更成熟的模型相匹配,同时运行成本更低、资源效率更高。这被视为对Nvidia股票的威胁,因为较低的计算需求可能转化为GPU需求增长的放缓。然而,随着市场重新评估其长期前景,Nvidia股价很快反弹,尽管在美中科技贸易战升级的背景下面临新的压力。现在,正当这些逆风似乎正在消退时,有报道称DeepSeek的下一个模型,名为R2,可能即将推出。Nvidia投资者应该担心吗?New York Post+1福布斯+1
DeepSeek R2 的创新
DeepSeek的模型强调软件驱动的资源优化而非对硬件的依赖。这些优化使得与传统的大型语言模型相比,成本大幅降低。R1能够在有限的计算能力下提供竞争性的性能,得益于这些先进的技术。DeepSeek优化了芯片之间的通信,采用了节省内存的方法,并利用强化学习来减少资源需求。这种成本效率体现在DeepSeek-R1的API定价上,每百万输入标记仅需0.55美元,每百万输出标记为2.19美元,远低于OpenAI的API费率15美元和60美元 。
R2 的潜力
据报道,新的R2模型采用了所谓的混合专家(MoE)架构,将AI模型划分为根据输入选择性激活的独立子网络。这种方法可能进一步降低预训练的计算成本,并实现更快的推理性能。据报道,该模型总共有1.2万亿个参数,使其比OpenAI的GPT-4o的训练成本低97.3% 。BGR
DeepSeek据称正在使用中国自己的华为Ascend 910B芯片训练R2,而不是Nvidia的GPU。基于Ascend芯片的系统与类似规模的Nvidia A100集群相比,效率高达91%。DeepSeek还据称正在建立本地硬件供应链,进一步减少对美国制造芯片的依赖。这与R1版本形成对比,后者显然使用了数万块Nvidia的H100和H200 GPU来训练其模型,尽管存在美国的出口管制。虽然中国公司在获取Nvidia芯片方面面临限制,但据报道,他们通过新加坡和马来西亚等国家绕过这些限制来采购芯片。如果DeepSeek成功转向中国芯片,其他中国的大型科技公司可能会效仿。
对Nvidia的影响
在过去两年中,公司投入了大量资源来构建AI模型,使Nvidia在2024财年的收入增长超过125%,达到610亿美元,净利润率接近50%。收入在2025财年进一步飙升至超过1300亿美元。如果行业开始借鉴DeepSeek的开源模型开发方法,我们可能会看到对AI计算能力需求的降温。此外,如果像华为等公司的芯片被DeepSeek的创新代码更好地利用,它可能使公司能够将需求从Nvidia的芯片多样化,这些芯片的价格越来越高。也就是说,更精简和更高效的模型也可能产生相反的效果,在一定程度上帮助Nvidia。更精简的模型有助于减少计算需求,可能最终使AI的访问民主化,带来新的用户和用例,最终扩大总需求。我们对Nvidia股票的估值约为每股101美元,略低于当前市场价格约10% 。
结论
DeepSeek的R2模型代表了AI领域的一个重要进展,可能对Nvidia的市场地位构成挑战。然而,Nvidia的强大生态系统和持续的创新能力可能使其能够适应这些变化。投资者应密切关注DeepSeek的发展以及其对AI硬件需求的潜在影响。虽然短期内可能存在波动,但从长远来看,AI领域的增长潜力仍然巨大。