DeepSeek 的“技术狂人”创始人正威胁美国在 AI 领域的主导地位

这家中国初创公司的突然崛起,显示出尽管美国努力打压,中国的 AI 行业仍在蓬勃发展。


1. “技术狂人”梁文峰:内敛而锋利的创始人

DeepSeek 的创始人梁文峰,个子瘦小、话不多,常常沉默寡言。但员工很快会发现,他的沉思背后隐藏着极其犀利的问题,涵盖 AI 模型结构、算力成本等核心技术细节。尽管性格低调,他却常亲自下场,推动年轻实习生承担大胆的实验性项目。

一名前员工形容他:“有时候,我觉得他比研究员更懂研究。”


2. 震惊全球的 R1 模型

2025 年 1 月,DeepSeek 发布了 R1 模型,在多项标准测试中超越 OpenAI 等西方巨头,而其成本仅为 GPT-4 的约 5%。此举在美股市场引发约 1 万亿美元的抛售,也令美国出口管制政策面临质疑。


3. 中国 AI 实力快速追赶

杭州(DeepSeek 总部所在地)和其他中国科技中心出现了大量“AI 小龙”。MiniMax、Moonshot AI 等初创公司迅速走红,阿里、百度、华为的 AI 模型也跻身全球前列。

尽管中国曾一度严控互联网行业,如今国家领导人习近平正在重新加大对 AI 和半导体等领域的扶持。面对美国出口限制,中国工程师们反而因“芯片稀缺”激发出“低成本高性能”的创新能力。


4. 西方的怀疑与指控

美国政界和 OpenAI、Anthropic 等竞争对手对 DeepSeek 的崛起持强烈怀疑态度,称其可能窃取了 OpenAI 数据,并非法获取了 Nvidia 芯片。

但中国驻美大使馆称相关指控“毫无根据”,Nvidia 则表示 DeepSeek 所用芯片符合出口合规标准,并警告更严的限制反而将推动中国本土芯片和基础设施发展。


5. 神秘的企业文化与“黑匣子”运营

DeepSeek 对外公开大量模型细节和代码,却极少透露成本、算力来源或数据来源。其创始人梁文峰在过去 10 个月从未接受媒体采访,深居简出,业内人称他为“技术疯子”。

即便像 Perplexity AI 这样的美国公司,也在没有任何对接的情况下直接使用 DeepSeek 的模型,并重新训练去除可能含有中共意识形态的数据。


6. 高度定制的“价值观切换”技术

DeepSeek 在 2024 年 Nvidia 开发者大会上展示了一种能快速调整模型价值观(如赌博、安乐死、性产业等合法性设定)的原型。这种“点选式”切换方式被视为其技术灵活性的重要体现。


7. 从量化金融走向 AI

梁文峰早年在浙江大学攻读信号处理和机器学习,2008 年全球金融危机期间自学量化交易并大赚一笔。2015 年创立量化公司 High-Flyer Quant,吸引大批谷歌、Facebook 的人才,文化自由、强调技术至上。DeepSeek 的团队便是从这套系统中逐渐演变而来。


小结:

DeepSeek 和创始人梁文峰的成功背后,反映出中国 AI 行业在高压政策与技术封锁下逆势崛起。其技术实力、研发效率和执行力正在挑战美国在全球 AI 领域的领先地位,而西方对其既惊讶又警惕。DeepSeek 的“黑匣子式”操作和创始人的神秘人格,也为中美科技竞争的格局增添了更多未知数。