1. 开源的内容
- 模型权重(Weights):
- DeepSeek-V3、R1、R1-Zero 都已经发布了完整的模型参数。
- 模型架构(Architecture):
- 架构细节均可查看,并可在 Hugging Face 上运行。
- 推理接口 & 模型卡(Model Cards):
- 给出了运行模型所需的基本信息与用途说明。
- 评估结果与技术报告(Benchmark Results & Reports):
- 包括对比闭源模型的详细结果,如 MMLU、CMMLU、Codeforces、AIME 等。
✔️ 总结:代码 + 模型参数 + 评估结果 + 模型结构 是完全可获取的。
2. 没有开放的内容
- 训练代码
- 训练数据集
- 完整的数据处理/评估脚本
❌ 这意味着你无法完整地复现 DeepSeek 模型的训练过程。
🔐 它真的是开源的吗?
这个问题的答案取决于你如何定义“开源”。
按照 LF AI&Data 提出的【模型开放三层级】标准:
开放层级 | 说明 | DeepSeek 的表现 |
---|---|---|
L1 | 开放模型权重 | ✅ 是 |
L2 | 开放推理代码和模型使用方法 | ✅ 是 |
L3 | 完整开放训练代码、训练数据和细节 | ❌ 不是 |
✔️ DeepSeek 目前介于 L2 和 L3 之间,但尚未达到最完整的开放(L3)。
📜 DeepSeek 使用什么许可证?
1. MIT 许可证(R1 / R1-Zero 等):
- 无使用限制,真正的“开源”。
2. DeepSeek 许可证(其余模型):
- 基于 Responsible AI License(RAIL) 改造
- 有使用限制,包括:
- 禁止军事用途;
- 禁止违反法律、散播假信息等用途;
- 分发时需包含原始许可证说明。
❗ 本质上是“有约束的开源”,不适用于所有商业用途,尤其是涉及安全或军事的场景。
❓DeepSeek 有没有“假开源”?
你提到它“可能自己也没有完全遵守其应当遵守的开源许可证”,这确实是一个争议点,原因可能包括:
- DeepSeek 使用了部分未披露数据或未经授权的数据源进行训练;
- 发布模型使用了 MIT 协议,但训练数据未开放,可能违反某些开源精神。
但目前尚无确凿证据指向其明显侵权。
📌 总结一句话
DeepSeek 是目前开放层级最高、性能最强的中文主导大模型之一,虽然未做到完全开源(如训练代码和数据集),但在模型能力与透明度上已具有显著领先地位。