在一片喧囂的 AI 產業中,來自中國的 DeepSeek 再次以其獨特的「低調」策略,掀起了全球範圍內的波瀾。幾天前,DeepSeek 悄無聲息地發佈了其 R1 模型的最新版本 R1-0528,沒有預熱,沒有發佈會,卻憑藉其驚人的性能提升,在海外 AI 社區引發了熱議,甚至讓不少外國網民感嘆「蚌埠住了」。這次更新不僅再次證明了 DeepSeek 在 AI 基礎模型領域的強勁實力,更促使人們重新審視全球 AI 競爭格局,尤其是「專有模型」與「開源模型」之間的未來走向。
超越預期:R1-0528 的「不鳴則已,一鳴驚人」
DeepSeek R1-0528 的發佈,再次印證了「不鳴則已,一鳴驚人」的道理。海外媒體迅速捕捉到其核心亮點:幻覺率大幅削減約 45%-50%,且性能直逼 OpenAI 的 O3 和 Google 的 Gemini 2.5 Pro。這意味著在可靠性和智能水平方面,DeepSeek 的開源模型正在迅速縮小與頂級商業模型的差距。
在 Reddit 等主流 AI 社區,DeepSeek R1-0528 成為熱議話題。用戶們在 r/LocalLLaMA 和 r/SillyTavernAI 等子社區中,積極分享他們的基準測試結果和實際使用體驗。一篇帖子標題直接宣稱:「全新升級的 DeepSeek R1 在 LiveCodeBench 上的表現幾乎與 OpenAI 的 O3 模型不相上下!開源的巨大勝利!」這簡潔有力的標題,道出了許多開發者的心聲。
實際測試者的反饋更為具體:
- 數學與編程能力的躍升: 許多開發者對 R1 在數學問題和編程方面的表現讚不絕口,尤其是在處理複雜的積分或遞歸函數時。他們觀察到 R1-0528 擁有「更長遠的思考能力」,「表現出主動性」且「不會那麼快放棄」。一位常駐用戶驚訝地表示,測試後發現其處理的「相當複雜的代碼」質量已達到「o3 級別」,直呼「WOW」。
- 官方數據的驗證: DeepSeek 官方的說法與用戶體驗高度吻合。他們表示,更新後的 R1 模型在數學、編程與通用邏輯等多個基準測評中取得了「當前國內所有模型中首屈一指的優異成績」,並且「在整體表現上已接近其他國際頂尖模型,如 O3 與 Gemini-2.5-Pro。」
- 思維深度與創造力提升: 新版本顯著提升了模型的思維深度與推理能力,並支持工具調用。雖然在工具調用方面與頂級模型仍有差距,但其在創意寫作方面的優化,能夠輸出篇幅更長、結構內容更完整、更貼近人類偏好的長篇作品,則展現了其在生成式 AI 領域的潛力。此外,在前端代碼生成和角色扮演等領域,R1 的能力也同步更新和提升。
- 語境持久性的突破: 在 AI 角色扮演社區,R1 的超長記憶跨度和語境持久性獲得了極高評價。用戶分享了角色能夠「記住過去細微的細節,並以自主行為做出回應」的案例,甚至有角色在爭論中「提起過去發生的三個細節」,這種主動性與連貫性,在以往的 AI 模型中極為罕見。
- 「滿分」表現的震撼: 一名 Reddit 用戶甚至發帖稱,更新後的 DeepSeek R1-0528 在他的所有測試中都能獲得滿分。他強調這些測試是「在實際商業應用中經常使用的任務,從中挑選了一些比較複雜的邊緣案例」,而非「不切實際的測試」。他對此表示「印象深刻,但也有點麻木,一時難以找到合適的詞來形容。一個來自去年還默默無聞的實驗室,做出的免費開源模型,竟然比商業前沿的模型做得更好,這真是太不可思議了。」這種近乎哲學式的反思,道出了許多人面對 DeepSeek 崛起時的複雜心情。
在 X 平台,對 DeepSeek 編程能力的熱情同樣高漲。有用戶稱用 DeepSeek R1-0528 構建遊戲後,直言「它的編程能力簡直太強了」,並預言「如果這隻是 R1…DeepSeek R2 將會非常瘋狂。」
專業分析機構 Artificial Analysis 的數據進一步鞏固了 DeepSeek 的地位。該機構在其獨立的「智能指數」上稱 DeepSeek R1「超越 xAI、Meta 和 Anthropic」,並與 Google 的 Gemini 2.5 Pro 相當。特別是在編程方面,R1 在人工分析編碼指數中與 Gemini 2.5 Pro 相當,僅落後於 O4-mini(high)和 O3。Artificial Analysis 更直言:「DeepSeek 剛剛證明,他們能夠跟上 OpenAI 的 RL 計算能力擴展步伐。」這無疑是對 DeepSeek 技術實力最權威的肯定。
「開源」的力量:AI 未來格局的關鍵變量
儘管有零星的批評,例如上下文窗口限制或內容審核的爭議,但 DeepSeek 最大的優勢,也是其在海外社區獲得大量好感的重要來源,始終是其「開放權重」的策略。雖然在技術上,DeepSeek 的模型屬於「開放權重」而非完全「開源」(因為未發佈訓練代碼和數據),但在許多開發者看來,這已足夠具有顛覆性。
與 OpenAI 等巨頭限制頂級模型的完整訪問權限或採取高昂定價不同,DeepSeek 提供了更低的成本,甚至免費提供可下載的模型權重。一位海外用戶直接宣稱:「DeepSeek 是真正的 OPEN AI」。這反映了部分社區對 AI 巨頭閉源策略的不滿,以及對開放、普惠 AI 的渴望。
Reddit 上一篇題為「開源人工智能正在迎頭趕上!」的熱帖,直指核心:「DeepSeek 似乎是唯一一家真正在前沿模型領域競爭的公司。其他公司總是有所保留…」該用戶毫不客氣地指出:「閉源 AI 公司總是說開源模型無法趕上他們。如果沒有 DeepSeek,他們可能是對的。但感謝 DeepSeek 成了一個異數!」這不僅是對 DeepSeek 的讚美,更是對整個 AI 產業格局的拷問:開源模型是否能打破專有模型所構建的技術壁壘和商業壟斷?
在該帖子下,有評論更加激進:「他們這樣做是因為價格實惠的智能將推動一場革命,而 DeepSeek 將被公眾銘記為人工智能的真正先驅,而不是世界上充斥著廣告的 Google、ClosedAI 或虛假的安全 Anthropics。」這種言論反映了海外部分用戶對於 AI 技術普惠性的高度期待,以及對商業巨頭「安全」和「道德」說辭背後商業考量的質疑。
甚至有 Reddit 用戶將 DeepSeek R1 的表現與 OpenAI 的承諾進行對比,諷刺道:「這讓我想起了 ClosedAI 承諾發佈『O3-mini 級別模型』卻未能兌現,現在新款 R1 已經超越了 O3-mini (high) 不少,已經接近完整的 O3 (high)。」這種對比,不僅是技術層面的較量,更是品牌聲譽和用戶信任的對決。
即便是一些保持淡定的網民,也承認:「雖然它不再讓我感到驚訝了。每次我都得等到所有營銷噱頭平息後才能進行全面測試。但無論如何,DeepSeek 仍然擁有開放權重的優勢,這無疑是一個優點。」這說明 DeepSeek 的「開放權重」策略,已成為其核心競爭力之一,即便在性能上可能存在微小差距,其開放性也能為其帶來獨特的市場價值。
DeepSeek 的崛起,無疑給了以往的 AI 巨頭巨大的壓力。一些網民甚至開始擔心其對 AI 產業價格體系的衝擊,認為 DeepSeek 將「迫使 AI 公司在價格方面展開競相壓價的競爭」。這種「競價」背後,或許就是 DeepSeek 追求 AI 普惠的另一個目標。最高讚的回覆則選擇感謝所有模型製作者,認為無論其動機如何,用戶都能從中獲益。這種務實且樂觀的心態,代表了許多開發者和用戶對 AI 發展的普遍態度。
最後,業界對 DeepSeek R2 的期待達到了一個新高點。在這次 R1 更新時,許多網民紛紛詢問 R2 的進展,甚至猜測「DeepSeek-R1-0528」是否就是實際上的「R2」,只是用了 R1 系列命名。這表明 DeepSeek 已在全球 AI 領域樹立了強大的品牌形象和技術領先地位,其未來的一舉一動都將牽動著整個行業的目光。DeepSeek 的這次低調更新,不僅是一次技術實力的展示,更是一場關於 AI 未來格局、開放與專有、成本與性能之間深層對話的開啟。