DeepSeek-V3：开源大模型的性能与速度全面突破

/ DeepSeek App / 作者： deepseekcn2025 / 2025年5月18日

2024年12月26日，DeepSeek正式发布了其全新自研的开源大模型DeepSeek-V3，在性能和速度上实现了全面突破。维基百科+2AIHub | AI导航+2DeepSeek API Docs+2

领先的性能表现AIHub | AI导航

DeepSeek-V3在多个领域展示出顶尖的性能，包括：AIHub | AI导航

知识类任务：在MMLU、MMLU-Pro和SimpleQA等评测中，DeepSeek-V3达到与Claude-3.5-Sonnet相当的水平。
长文本处理：在DROP、FRAMES和LongBench v2等测试中，DeepSeek-V3超越了大部分模型，特别擅长处理长文本和复杂语境。
代码生成：在算法类代码（Codeforces）场景中，DeepSeek-V3远远领先于市面上所有非O1类模型，在工程类代码（SWE-Bench Verified）中与Claude-3.5-Sonnet-1022接近。
数学推理：在美国数学竞赛（AIME 2024）和全国高中数学联赛（CNMO 2024）中，DeepSeek-V3大幅领先于所有开源和闭源模型。维基百科+3AIHub | AI导航+3DeepSeek API Docs+3

卓越的中文能力华尔街见闻+2AIHub | AI导航+2DeepSeek API Docs+2

DeepSeek-V3在中文任务中同样表现突出，尤其在C-Eval教育类测评和C-SimpleQA知识类任务中，表现超过了Qwen2.5-72B，展现了其对中文的深刻理解和处理能力。DeepSeek API Docs+2AIHub | AI导航+2华尔街见闻+2

三倍提升的生成速度华尔街见闻+2AIHub | AI导航+2DeepSeek API Docs+2

通过算法和工程上的优化，DeepSeek-V3在生成吐字速度上实现了从20 TPS到60 TPS的三倍提升，极大改善了用户的交互体验和模型响应速度。华尔街见闻+2AIHub | AI导航+2DeepSeek API Docs+2

开源与本地部署AIHub | AI导航+1DeepSeek API Docs+1

DeepSeek-V3开源了原生FP8权重，支持社区和开发者进行本地部署。通过与SGLang、LMDeploy、TensorRT-LLM和MindIE等工具的兼容，用户可以在不同硬件平台上高效运行DeepSeek-V3，进一步扩展其应用场景。AIHub | AI导航+1DeepSeek API Docs+1