中国的DeepSeek并非硅谷的终结

中国初创企业DeepSeek的全球影响力引发了关于其对人工智能发展和地缘政治影响的争论。DeepSeek的崛起是全球化但日益两极化的人工智能生态系统的必然结果。尽管它挑战了美国在人工智能领域的主导地位,但硅谷不会停滞不前。

关于DeepSeek,有三个误解必须破除。推理模型DeepSeek-R1发布后,评论员立即声称美国半导体出口管制——这对于限制中国获取最先进人工智能芯片至关重要——已经失效。但出口管制并非旨在彻底遏制中国,而是旨在制造一道如今已然可见的天花板。

尽管美国正在调查DeepSeek是否使用了走私芯片,但其大部分训练芯片都是Nvidia H800 ,这些芯片是在2022年第一轮出口管制后专门为中国市场设计的,现在也受到限制。DeepSeek在有限的计算能力(或称“计算”)下取得成功,可能需要调整出口管制。但现有的管制措施很快就会产生影响,阻碍中国国内芯片产能日趋成熟的未来发展。

另一个常见的误解是,模型出口管制是遏制中国人工智能崛起的解决方案。为了回应DeepSeek的进展,美国参议员乔什·霍利提出了“将美国人工智能能力与中国脱钩法案”,该法案将禁止所有开放模型的进出口。确保中国用户不会下载这些模型,可能需要繁琐且普遍的“了解你的客户”验证流程,这将扼杀国内创新,损害美国在开源人工智能领域的领导地位,同时也无法降低滥用风险。

与实体商品不同,模型权重等数据很容易被转移或窃取,无需跨境走私。借助DeepSeek以及阿里巴巴支持的Qwen推出的更高效的新模型,中国将减少对美国开源模型的依赖。对美国模型的分发施加繁琐的限制,只会促使开发者转向全球通用的中国模型。尽管DeepSeek因受到审查而受到批评,但全球开发者并不会效忠任何阵营——他们会倾向于选择最便宜、最好的模型。

如果美国想要在人工智能领域保持全球领导地位,就应该鼓励负责任的发布政策,在保持开放模型开放的同时,确保其得到负责任的部署。分层发布策略加上外部审计,有助于防止滥用,同时确保安全分发。

声称硅谷在“芯片、人才和能源基础设施”上投入的“资金护城河”已经消失,这又是一个误解。在DeepSeek之前,这些投资足以确保美国模型在性能上遥遥领先,但DeepSeek相对低廉的成功引发了担忧。最初的报告称,DeepSeek的性能提升仅花费了约600万美元,约占Meta AI Llama模型训练成本的1%。

但这个数字只是单次预训练运行的 GPU 成本,而不是整个模型的成本。如果没有硅谷,DeepSeek 的进步就不可能实现。谷歌最初推进了DeepSeek 创新的“专家混合”架构,而OpenAI 的 o1 模型则率先使用测试时计算来提高效率。据报道,DeepSeek 的研究人员还“提炼”了 ChatGPT——将其用作生成训练数据的捷径。

DeepSeek 或许已经为硅谷的护城河铺设了一块木板,但硅谷会利用这块木板进一步拓宽自己的护城河。美国大型科技公司将迅速吸收 DeepSeek 的开源技术,再次享受其优越计算资源带来的好处。如果欧洲公司也效仿,它们或许也能撼动整个格局。

DeepSeek 的成功并非个例,而是全球竞争性信息系统的必然产物。这一成功表明发展动力正在发生变化,因为中国已明显实现了到 2025 年人工智能达到“世界领先水平”的目标,至少在开源领域是如此。最值得注意的是,DeepSeek 表明中国对国内人才的投资正在获得回报。自 2018 年以来,中国已新增2300 多个本科人工智能专业。随着美国对中国人工智能人才的吸引力下降,这笔投资只会不断增加。

中国现在必须有效实施其新的开源模式,才能充分发挥其优势。中国股市“严重受公众情绪驱动”,导致许多公司“乘风破浪”,不顾实际效果,将新技术应用于产品中。地方政府也面临着新技术实施的激励机制扭曲的问题。DeepSeek 的一些部署被描述为“宣传噱头”。中国如何缩小实施差距,将决定人工智能竞赛的未来。

尽管中国正努力构建一个平行的开源生态系统,但美国和中国的开源生态系统依然紧密交织。即使两国各自使用各自的开源工具和模式,开发者们仍将继续相互汲取灵感。尽管DeepSeek为硅谷的护城河铺设了一条厚木板,但硅谷已经在进一步加宽这条护城河。计算能力并非万能,但硅谷的“铁锹”将继续成为优势。

美国不能想当然地认为它将保持优势,尤其是在中国努力提升计算能力的情况下。不过,目前的问题不在于美国能否参与竞争,而在于它能否牢记快速且负责任地挖掘和开发。