DeepSeek V4 打破慣例：拒絕 Nvidia、AMD，優先華為適配

中國 AI 公司 DeepSeek 打破了行業慣例。在即將發布的 V4 旗艦模型中,該公司沒有按照慣例將預發布版本交付 Nvidia、AMD 等美國芯片製造商進行優化,而是給了華為等中國芯片廠商數週的優先適配時間。這個決定改變了 AI 產業的合作模式。

打破行業慣例的戰略轉向

根據路透社 2 月 26 日報導，兩位了解情況的消息人士透露，DeepSeek 在即將進行重大模型更新之前，未向美國芯片製造商展示其即將推出的旗艦模型 V4。這打破了 AI 行業的標準做法。

通常情況下，AI 開發者會將主要模型的預發布版本分享給 Nvidia 和 AMD 等芯片製造商，以確保其軟體在廣泛使用的硬體上高效運行。DeepSeek 之前也曾與 Nvidia 的技術人員密切合作。

然而這次，DeepSeek 選擇了不同的路徑。該公司給予包括華為在內的中國廠商數週的時間來適配其芯片，使其昇騰 AI 產業鏈得以率先完成底層軟體優化與性能調校。

DualPath 推理框架：技術突破

就在同一時期，DeepSeek 與北京大學、清華大學聯合發布了一篇論文，介紹了專為 V4 設計的全新推理框架：DualPath。

DualPath 的核心創新在於解決了長文本推理場景中的 I/O 瓶頸。傳統的單路徑加載模式（Storage-to-Prefill）容易造成預填充引擎的存儲網卡帶寬飽和，而解碼引擎的存儲網卡卻處於閒置狀態。

DualPath 引入了第二條路徑（Storage-to-Decode），利用解碼引擎閒置的存儲網卡帶寬讀取緩存，然後通過高速計算網絡（RDMA）傳輸到預填充引擎。這種雙路徑設計實現了集群存儲帶寬的全局池化和動態負載均衡。

在實際測試中，DualPath 在 660B 規模的生產級模型上取得了以下性能提升：

離線推理吞吐量提升 1.87 倍
在線服務吞吐量平均提升 1.96 倍
首 Token 時間（TTFT）顯著優化
Token 生成速度（TPOT）幾乎不受影響

V4 技術特性

根據多方消息匯總，DeepSeek V4 將帶來多項技術突破：

超長上下文窗口

V4 的上下文窗口超過 100 萬 tokens，可以在單次處理中容納整個代碼庫。這使得真正的多文件推理成為可能，模型可以理解組件之間的關係、追蹤依賴關係，並在大規模重構操作中保持一致性。

架構創新

V4 引入了三項核心架構改進。Engram 條件記憶允許模型根據任務上下文選擇性地保留和調用信息。mHC 架構（Manifold-Constrained Hyper-Connections）重新設計了信息在 Transformer 網絡中的流動方式。DeepSeek 稀疏注意力（DSA）在保持能力的同時,將計算成本降低約 50%。

編程能力優化

V4 專門針對編程任務進行了優化，內部測試聲稱在 HumanEval 上達到 90% 的分數，在 SWE-bench 上超過 80%。這些數據雖然尚未經過獨立驗證，但如果屬實，將使 V4 成為最強大的編程 AI 模型之一。

硬件要求親民

與追求更大硬件配置的趨勢不同，V4 被設計為可以在消費級硬件上運行：

消費級：雙 NVIDIA RTX 4090 或單個 RTX 5090
企業級：標準數據中心 GPU 配置

這種可訪問性符合 DeepSeek 民主化 AI 能力的理念，使開發者能夠在標準工作站上運行最先進的編程模型。

發布時間線與最新動態

DeepSeek V4 的發布時間線經歷了多次調整：

原計劃：2026 年 2 月中旬（農曆新年前後）
2 月 11 日：DeepSeek 靜默將現有模型的上下文窗口從 128K 擴展到 1M tokens，並將知識截止日期更新至 2025 年 5 月，被廣泛推測為 V4 預覽
2 月 17 日（農曆新年）：其他中國 AI 實驗室（阿里巴巴 Qwen、字節跳動、智譜 GLM-5）在此日期前後發布了新模型，但 DeepSeek 並未正式推出 V4
2 月 26 日：消息源透露 DeepSeek 正在測試 V4 Lite 模型，代號為「Sealion-lite」，支持 100 萬 tokens 上下文窗口，並原生支持多模態推理

目前社區共識指向 Q1-Q2 2026 的發布窗口。

地緣政治因素與行業影響

DeepSeek 的這一決策發生在敏感時期，背後有多重地緣政治因素：

美國的指控

美國川普政府的一位高級官員向路透社表示，DeepSeek 的最新 AI 系統可能是使用 Nvidia 最先進的 Blackwell 芯片在中國大陸訓練的。如果屬實，這可能違反了限制向中國出售高端 AI 芯片的美國出口管制規定。

該官員進一步聲稱，DeepSeek 可能會試圖隱藏顯示其使用美國芯片的技術跡象，並可能公開聲稱依賴華為的芯片。

Anthropic 的數據提取指控

DeepSeek 的美國競爭對手 Anthropic 最近指控該公司和另外兩家中國公司（Moonshot AI 和 MiniMax）不當地從其旗艦 AI 模型 Claude 中提取數據。

根據 Anthropic 的說法，這些公司進行了所謂的「蒸餾攻擊」。這涉及與另一個 AI 系統進行數百萬次交互，以從其輸出中學習並改進競爭模型。Anthropic 聲稱創建了超過 24,000 個虛假帳戶，與其 Claude 模型進行了超過 1,600 萬次交換以提取能力。

國產算力板塊的反應

這一消息在中國資本市場引發了積極反應。2 月 27 日，國產算力板塊表現尤為突出，相關股票大幅上漲。投資者將此視為核心技術自主可控前景的信心重塑。

產業格局的深遠影響

DeepSeek 選擇優先適配國產算力平台,用實際行動回應了外界對國產 AI 產業鏈的質疑。這證明本土產業鏈可以支撐世界級大模型的研發與部署。

這個決策的影響超出了單一企業合作。它改變了「美國芯片配中國應用」的產業格局,推動「中國芯片配中國模型」閉環生態的形成。

研究機構分析指出,提前數週進行的適配優化可使模型性能提升 30% 以上。DeepSeek 的做法可能會被更多 AI 企業效仿,加速國產替代進程。

華為突破了技術封鎖,DeepSeek 重構了行業慣例。中國 AI 產業正在擺脫技術依附地位。這個過程涉及技術突破和產業信心的建立。隨著模型與硬件協同優化的深入,自主可控的 AI 生態系統正在逐步建立。

參考來源：

Reuters: “DeepSeek withholds new AI model from NVIDIA and AMD”
36Kr: “DeepSeek’s New Paper Unveils V4 Framework”
The China Academy: “DeepSeek Withholds V4 Model from US Chipmakers”
Outlook Business: “DeepSeek Ditches Nvidia, AMD for V4 Launch”