DeepSeek 到底开放了什么?

1. 开源的内容

  • 模型权重(Weights)
    • DeepSeek-V3、R1、R1-Zero 都已经发布了完整的模型参数。
  • 模型架构(Architecture)
    • 架构细节均可查看,并可在 Hugging Face 上运行。
  • 推理接口 & 模型卡(Model Cards)
    • 给出了运行模型所需的基本信息与用途说明。
  • 评估结果与技术报告(Benchmark Results & Reports)
    • 包括对比闭源模型的详细结果,如 MMLU、CMMLU、Codeforces、AIME 等。

✔️ 总结:代码 + 模型参数 + 评估结果 + 模型结构 是完全可获取的。


2. 没有开放的内容

  • 训练代码
  • 训练数据集
  • 完整的数据处理/评估脚本

❌ 这意味着你无法完整地复现 DeepSeek 模型的训练过程。


🔐 它真的是开源的吗?

这个问题的答案取决于你如何定义“开源”。

按照 LF AI&Data 提出的【模型开放三层级】标准:

开放层级说明DeepSeek 的表现
L1开放模型权重✅ 是
L2开放推理代码和模型使用方法✅ 是
L3完整开放训练代码、训练数据和细节❌ 不是

✔️ DeepSeek 目前介于 L2 和 L3 之间,但尚未达到最完整的开放(L3)。


📜 DeepSeek 使用什么许可证?

1. MIT 许可证(R1 / R1-Zero 等):

  • 无使用限制,真正的“开源”。

2. DeepSeek 许可证(其余模型):

  • 基于 Responsible AI License(RAIL) 改造
  • 有使用限制,包括:
    • 禁止军事用途;
    • 禁止违反法律、散播假信息等用途;
    • 分发时需包含原始许可证说明。

本质上是“有约束的开源”,不适用于所有商业用途,尤其是涉及安全或军事的场景。


❓DeepSeek 有没有“假开源”?

你提到它“可能自己也没有完全遵守其应当遵守的开源许可证”,这确实是一个争议点,原因可能包括:

  • DeepSeek 使用了部分未披露数据或未经授权的数据源进行训练;
  • 发布模型使用了 MIT 协议,但训练数据未开放,可能违反某些开源精神。

但目前尚无确凿证据指向其明显侵权。


📌 总结一句话

DeepSeek 是目前开放层级最高、性能最强的中文主导大模型之一,虽然未做到完全开源(如训练代码和数据集),但在模型能力与透明度上已具有显著领先地位。