在全球 AI 產業風起雲湧、巨頭紛紛將目光投向 AI 代理(Agent)應用,並以此作為下一輪商業化浪潮的核心時,一家名為DeepSeek的中國新創 AI 公司,卻以其獨特的戰略選擇,在全球 AI 賽道上繪製出一條與眾不同的發展軌跡。當微軟、Google、百度、騰訊、聯想等科技巨擘紛紛湧入 AI 代理的藍海,並吸引了資本市場的高度青睞,甚至有投資人直言「現在只講大型模型已難以獲得資金青睞,必須要有 AI 代理商業故事」時,DeepSeek 的創始人梁文鋒卻選擇了一條看似逆勢而行的道路——堅定不移地投入通用人工智慧(AGI)的長期研發,並專注於核心模型的深度優化。
這種選擇不僅是商業策略上的差異化,更深層次地反映了DeepSeek 對於 AI 發展本質的深刻理解和長遠願景。梁文鋒明確指出,DeepSeek 的目標並非追求短期盈利,而是致力於參與全球科技創新,推動 AGI 的長期發展。這句話不僅是DeepSeek 企業願景的體現,更是對當前 AI 產業「應用為王,商業為先」主流思潮的一種反思和挑戰。
AGI 的長期主義與短期商業化之間的抉擇
當前 AI 領域的 AI 代理應用熱潮,本質上是大型語言模型(LLM)能力的進一步延伸和商業化落地。AI 代理被賦予了執行複雜任務、自主決策、與環境互動等能力,這使得它們在客戶服務、內容創作、自動化辦公等諸多領域展現出巨大的商業潛力。這種潛力不僅吸引了科技巨頭的重金投入,也成為資本市場追逐的下一個風口。許多投資人認為,AI 代理是將模型能力轉化為具體商業價值的關鍵環節,是實現 AI 盈利模式的必經之路。
然而,DeepSeek 卻在這樣的熱潮中保持了清醒和克制。他們並非不了解 AI 代理的潛力,而是基於對 AGI 發展路徑的深刻洞察,認為過早或過度地追逐應用層面的商業化,可能會分散企業在基礎研究和核心技術突破上的精力。梁文鋒所說的「我們認為當下最重要的,是參與全球科技創新。長期以來,中國企業習慣於利用海外的技術創新,並通過應用層面進行商業化,但這種模式是不可持續的」,恰恰揭示了DeepSeek 戰略選擇的深層邏輯。他認為,如果中國 AI 企業僅僅滿足於在應用層面進行創新和商業化,而缺乏在底層技術和基礎理論上的突破,那麼在長遠發展中將會受制於人,難以真正參與全球科技競爭的最高層次。
這是一種典型的「長期主義」思維,它要求企業具備足夠的耐心和定力,願意在短期內放棄一部分商業利益,將資源和精力集中於那些看似遙遠但卻具有顛覆性影響的基礎性研究。對於 AGI 而言,這意味著需要在模型架構、算法優化、數據效率、算力利用等諸多方面進行持續且深入的探索,而不是簡單地將現有模型包裝成各類應用。
DeepSeek 的技術深化之路:R1-0528 的突破與驗證
DeepSeek 對於 AGI 的堅守,並非空泛的理論,而是體現在具體的技術研發成果上。今年 5 月 29 日,DeepSeek 低調推出了旗下 R1 模型的升級版本 R1-0528。這一次升級沒有採用全新的模型架構,而是透過「後訓練技術」,對現有模型的推理與邏輯思維能力進行了深度強化。這一選擇再次證明了DeepSeek 團隊專注於技術深化的決心,而非盲目追逐市場熱點。
R1-0528 的技術亮點令人矚目:
- 推理深度顯著提升: 官方數據顯示,R1-0528 每題平均字元(token)使用量從 12K 增至 23K,這意味著模型在處理複雜問題時,能夠進行更長時間、更深入的「思考」,其思考鏈條更完整,邏輯推理能力更強。在數學、程式設計等需要高難度推理任務的場景中,這一提升尤為關鍵。
- AI 幻覺率大幅降低: 在摘要、改寫等容易產生「幻覺」的任務中,R1-0528 的錯誤率降低達 45%-50%。AI 幻覺一直是大型語言模型面臨的核心挑戰之一,它限制了模型在嚴謹應用場景中的可靠性。DeepSeek 在這方面的突破,極大地提升了模型的穩定性和可信度。
- 小模型高效能表現: 透過「思維鏈技術」(Chain-of-Thought),DeepSeek 的 8B 小模型在性能上竟然逼近了 Qwen3-235B 這樣的超大型模型。這是一個非常重要的突破,意味著在保持高性能的同時,能夠顯著降低模型部署和運行的成本,這對於模型的大規模應用和普及具有重要意義。它表明,模型的性能提升不僅僅依賴於模型的規模,更在於訓練方法和推理策略的優化。
這些技術成果不僅僅是實驗室數據,R1-0528 模型已經引起了中國市場的廣泛關注。騰訊旗下的元寶應用與 QQ 瀏覽器等多項產品,均已全面接入了新版模型。這不僅是對DeepSeek 技術可靠性的有力證明,也顯示了DeepSeek 堅持的 AGI 路線正逐漸獲得產業的認可和支持。這些頭部應用方的接入,將為 R1-0528 提供大量的實際應用場景和用戶數據,進一步推動模型的迭代和優化。
中國 AI 企業的創新模式反思與DeepSeek 的示範作用
梁文鋒的直言不諱:「長期以來,中國企業習慣於利用海外的技術創新,並通過應用層面進行商業化,但這種模式是不可持續的。」這句話道出了中國科技產業發展中一個長期存在的痛點。過去數十年,中國企業在應用創新和商業模式創新方面取得了舉世矚目的成就,但在底層技術和原創理論方面,與西方發達國家相比仍存在一定差距。這種差距使得中國在一些關鍵技術領域面臨「卡脖子」的風險。
在 AI 時代,這種「應用化」的模式如果延續,將可能限制中國 AI 產業的長期發展。如果中國企業只是在海外巨頭的基礎模型之上進行應用層的開發,那麼就難以在全球 AI 競賽中掌握話語權和主導權。DeepSeek 選擇了另一條道路,他們在 AGI 這一最基礎、最具挑戰性的領域投入重兵,希望通過原創性的技術突破,真正參與到全球科技創新的最前沿,貢獻中國智慧。
DeepSeek 的這種戰略選擇,為中國 AI 企業提供了一個重要的啟示:在追求短期商業利益的同時,也必須有更宏大的視野和更長遠的規劃,敢於投入基礎研究,敢於挑戰最艱難的技術問題。只有在底層技術上取得突破,才能真正擺脫對外部技術的依賴,構建起自主可控的 AI 生態體系,並在全球 AI 產業中佔據應有的位置。
DeepSeek 的實踐證明,即使在 AI 代理熱潮的衝擊下,堅持 AGI 的長期主義,專注於核心模型的技術深化,依然能夠取得令人矚目的成就,並獲得產業的認可。這種模式不僅為DeepSeek 自身贏得了競爭優勢,也為整個中國 AI 產業的未來發展指明了一條更為穩健和可持續的道路。未來,或許將有更多中國 AI 企業受到DeepSeek 的啟發,不再盲目追逐短期熱點,而是將目光投向更為深遠的科技前沿,共同推動中國 AI 產業邁向新的高度。