SynapseWire

DeepSeek V4 打破慣例:拒絕 Nvidia、AMD,優先華為適配

DeepSeek 在即將發布的 V4 旗艦模型中打破行業慣例,未向美國芯片巨頭提供預發布版本,轉而給予華為等中國廠商數週優先適配期,標誌著 AI 產業鏈格局的重大轉變。

作者: SynapseWire 編輯部 發布於:
DeepSeek V4 與華為合作示意圖

中國 AI 公司 DeepSeek 打破了行業慣例。在即將發布的 V4 旗艦模型中,該公司沒有按照慣例將預發布版本交付 Nvidia、AMD 等美國芯片製造商進行優化,而是給了華為等中國芯片廠商數週的優先適配時間。這個決定改變了 AI 產業的合作模式。

打破行業慣例的戰略轉向

根據路透社 2 月 26 日報導,兩位了解情況的消息人士透露,DeepSeek 在即將進行重大模型更新之前,未向美國芯片製造商展示其即將推出的旗艦模型 V4。這打破了 AI 行業的標準做法。

通常情況下,AI 開發者會將主要模型的預發布版本分享給 Nvidia 和 AMD 等芯片製造商,以確保其軟體在廣泛使用的硬體上高效運行。DeepSeek 之前也曾與 Nvidia 的技術人員密切合作。

然而這次,DeepSeek 選擇了不同的路徑。該公司給予包括華為在內的中國廠商數週的時間來適配其芯片,使其昇騰 AI 產業鏈得以率先完成底層軟體優化與性能調校。

DualPath 推理框架:技術突破

就在同一時期,DeepSeek 與北京大學、清華大學聯合發布了一篇論文,介紹了專為 V4 設計的全新推理框架:DualPath。

DualPath 的核心創新在於解決了長文本推理場景中的 I/O 瓶頸。傳統的單路徑加載模式(Storage-to-Prefill)容易造成預填充引擎的存儲網卡帶寬飽和,而解碼引擎的存儲網卡卻處於閒置狀態。

DualPath 引入了第二條路徑(Storage-to-Decode),利用解碼引擎閒置的存儲網卡帶寬讀取緩存,然後通過高速計算網絡(RDMA)傳輸到預填充引擎。這種雙路徑設計實現了集群存儲帶寬的全局池化和動態負載均衡。

在實際測試中,DualPath 在 660B 規模的生產級模型上取得了以下性能提升:

  • 離線推理吞吐量提升 1.87 倍
  • 在線服務吞吐量平均提升 1.96 倍
  • 首 Token 時間(TTFT)顯著優化
  • Token 生成速度(TPOT)幾乎不受影響

V4 技術特性

根據多方消息匯總,DeepSeek V4 將帶來多項技術突破:

超長上下文窗口

V4 的上下文窗口超過 100 萬 tokens,可以在單次處理中容納整個代碼庫。這使得真正的多文件推理成為可能,模型可以理解組件之間的關係、追蹤依賴關係,並在大規模重構操作中保持一致性。

架構創新

V4 引入了三項核心架構改進。Engram 條件記憶允許模型根據任務上下文選擇性地保留和調用信息。mHC 架構(Manifold-Constrained Hyper-Connections)重新設計了信息在 Transformer 網絡中的流動方式。DeepSeek 稀疏注意力(DSA)在保持能力的同時,將計算成本降低約 50%。

編程能力優化

V4 專門針對編程任務進行了優化,內部測試聲稱在 HumanEval 上達到 90% 的分數,在 SWE-bench 上超過 80%。這些數據雖然尚未經過獨立驗證,但如果屬實,將使 V4 成為最強大的編程 AI 模型之一。

硬件要求親民

與追求更大硬件配置的趨勢不同,V4 被設計為可以在消費級硬件上運行:

  • 消費級:雙 NVIDIA RTX 4090 或單個 RTX 5090
  • 企業級:標準數據中心 GPU 配置

這種可訪問性符合 DeepSeek 民主化 AI 能力的理念,使開發者能夠在標準工作站上運行最先進的編程模型。

發布時間線與最新動態

DeepSeek V4 的發布時間線經歷了多次調整:

  • 原計劃:2026 年 2 月中旬(農曆新年前後)
  • 2 月 11 日:DeepSeek 靜默將現有模型的上下文窗口從 128K 擴展到 1M tokens,並將知識截止日期更新至 2025 年 5 月,被廣泛推測為 V4 預覽
  • 2 月 17 日(農曆新年):其他中國 AI 實驗室(阿里巴巴 Qwen、字節跳動、智譜 GLM-5)在此日期前後發布了新模型,但 DeepSeek 並未正式推出 V4
  • 2 月 26 日:消息源透露 DeepSeek 正在測試 V4 Lite 模型,代號為「Sealion-lite」,支持 100 萬 tokens 上下文窗口,並原生支持多模態推理

目前社區共識指向 Q1-Q2 2026 的發布窗口。

地緣政治因素與行業影響

DeepSeek 的這一決策發生在敏感時期,背後有多重地緣政治因素:

美國的指控

美國川普政府的一位高級官員向路透社表示,DeepSeek 的最新 AI 系統可能是使用 Nvidia 最先進的 Blackwell 芯片在中國大陸訓練的。如果屬實,這可能違反了限制向中國出售高端 AI 芯片的美國出口管制規定。

該官員進一步聲稱,DeepSeek 可能會試圖隱藏顯示其使用美國芯片的技術跡象,並可能公開聲稱依賴華為的芯片。

Anthropic 的數據提取指控

DeepSeek 的美國競爭對手 Anthropic 最近指控該公司和另外兩家中國公司(Moonshot AI 和 MiniMax)不當地從其旗艦 AI 模型 Claude 中提取數據。

根據 Anthropic 的說法,這些公司進行了所謂的「蒸餾攻擊」。這涉及與另一個 AI 系統進行數百萬次交互,以從其輸出中學習並改進競爭模型。Anthropic 聲稱創建了超過 24,000 個虛假帳戶,與其 Claude 模型進行了超過 1,600 萬次交換以提取能力。

國產算力板塊的反應

這一消息在中國資本市場引發了積極反應。2 月 27 日,國產算力板塊表現尤為突出,相關股票大幅上漲。投資者將此視為核心技術自主可控前景的信心重塑。

產業格局的深遠影響

DeepSeek 選擇優先適配國產算力平台,用實際行動回應了外界對國產 AI 產業鏈的質疑。這證明本土產業鏈可以支撐世界級大模型的研發與部署。

這個決策的影響超出了單一企業合作。它改變了「美國芯片配中國應用」的產業格局,推動「中國芯片配中國模型」閉環生態的形成。

研究機構分析指出,提前數週進行的適配優化可使模型性能提升 30% 以上。DeepSeek 的做法可能會被更多 AI 企業效仿,加速國產替代進程。

華為突破了技術封鎖,DeepSeek 重構了行業慣例。中國 AI 產業正在擺脫技術依附地位。這個過程涉及技術突破和產業信心的建立。隨著模型與硬件協同優化的深入,自主可控的 AI 生態系統正在逐步建立。


參考來源:

  • Reuters: “DeepSeek withholds new AI model from NVIDIA and AMD”
  • 36Kr: “DeepSeek’s New Paper Unveils V4 Framework”
  • The China Academy: “DeepSeek Withholds V4 Model from US Chipmakers”
  • Outlook Business: “DeepSeek Ditches Nvidia, AMD for V4 Launch”

分享文章

留言評論

0 則評論

暫無評論,搶先發表你的看法吧!

相關文章