DeepSeek V4 打破慣例:拒絕 Nvidia、AMD,優先華為適配
DeepSeek 在即將發布的 V4 旗艦模型中打破行業慣例,未向美國芯片巨頭提供預發布版本,轉而給予華為等中國廠商數週優先適配期,標誌著 AI 產業鏈格局的重大轉變。
中國 AI 公司 DeepSeek 打破了行業慣例。在即將發布的 V4 旗艦模型中,該公司沒有按照慣例將預發布版本交付 Nvidia、AMD 等美國芯片製造商進行優化,而是給了華為等中國芯片廠商數週的優先適配時間。這個決定改變了 AI 產業的合作模式。
打破行業慣例的戰略轉向
根據路透社 2 月 26 日報導,兩位了解情況的消息人士透露,DeepSeek 在即將進行重大模型更新之前,未向美國芯片製造商展示其即將推出的旗艦模型 V4。這打破了 AI 行業的標準做法。
通常情況下,AI 開發者會將主要模型的預發布版本分享給 Nvidia 和 AMD 等芯片製造商,以確保其軟體在廣泛使用的硬體上高效運行。DeepSeek 之前也曾與 Nvidia 的技術人員密切合作。
然而這次,DeepSeek 選擇了不同的路徑。該公司給予包括華為在內的中國廠商數週的時間來適配其芯片,使其昇騰 AI 產業鏈得以率先完成底層軟體優化與性能調校。
DualPath 推理框架:技術突破
就在同一時期,DeepSeek 與北京大學、清華大學聯合發布了一篇論文,介紹了專為 V4 設計的全新推理框架:DualPath。
DualPath 的核心創新在於解決了長文本推理場景中的 I/O 瓶頸。傳統的單路徑加載模式(Storage-to-Prefill)容易造成預填充引擎的存儲網卡帶寬飽和,而解碼引擎的存儲網卡卻處於閒置狀態。
DualPath 引入了第二條路徑(Storage-to-Decode),利用解碼引擎閒置的存儲網卡帶寬讀取緩存,然後通過高速計算網絡(RDMA)傳輸到預填充引擎。這種雙路徑設計實現了集群存儲帶寬的全局池化和動態負載均衡。
在實際測試中,DualPath 在 660B 規模的生產級模型上取得了以下性能提升:
- 離線推理吞吐量提升 1.87 倍
- 在線服務吞吐量平均提升 1.96 倍
- 首 Token 時間(TTFT)顯著優化
- Token 生成速度(TPOT)幾乎不受影響
V4 技術特性
根據多方消息匯總,DeepSeek V4 將帶來多項技術突破:
超長上下文窗口
V4 的上下文窗口超過 100 萬 tokens,可以在單次處理中容納整個代碼庫。這使得真正的多文件推理成為可能,模型可以理解組件之間的關係、追蹤依賴關係,並在大規模重構操作中保持一致性。
架構創新
V4 引入了三項核心架構改進。Engram 條件記憶允許模型根據任務上下文選擇性地保留和調用信息。mHC 架構(Manifold-Constrained Hyper-Connections)重新設計了信息在 Transformer 網絡中的流動方式。DeepSeek 稀疏注意力(DSA)在保持能力的同時,將計算成本降低約 50%。
編程能力優化
V4 專門針對編程任務進行了優化,內部測試聲稱在 HumanEval 上達到 90% 的分數,在 SWE-bench 上超過 80%。這些數據雖然尚未經過獨立驗證,但如果屬實,將使 V4 成為最強大的編程 AI 模型之一。
硬件要求親民
與追求更大硬件配置的趨勢不同,V4 被設計為可以在消費級硬件上運行:
- 消費級:雙 NVIDIA RTX 4090 或單個 RTX 5090
- 企業級:標準數據中心 GPU 配置
這種可訪問性符合 DeepSeek 民主化 AI 能力的理念,使開發者能夠在標準工作站上運行最先進的編程模型。
發布時間線與最新動態
DeepSeek V4 的發布時間線經歷了多次調整:
- 原計劃:2026 年 2 月中旬(農曆新年前後)
- 2 月 11 日:DeepSeek 靜默將現有模型的上下文窗口從 128K 擴展到 1M tokens,並將知識截止日期更新至 2025 年 5 月,被廣泛推測為 V4 預覽
- 2 月 17 日(農曆新年):其他中國 AI 實驗室(阿里巴巴 Qwen、字節跳動、智譜 GLM-5)在此日期前後發布了新模型,但 DeepSeek 並未正式推出 V4
- 2 月 26 日:消息源透露 DeepSeek 正在測試 V4 Lite 模型,代號為「Sealion-lite」,支持 100 萬 tokens 上下文窗口,並原生支持多模態推理
目前社區共識指向 Q1-Q2 2026 的發布窗口。
地緣政治因素與行業影響
DeepSeek 的這一決策發生在敏感時期,背後有多重地緣政治因素:
美國的指控
美國川普政府的一位高級官員向路透社表示,DeepSeek 的最新 AI 系統可能是使用 Nvidia 最先進的 Blackwell 芯片在中國大陸訓練的。如果屬實,這可能違反了限制向中國出售高端 AI 芯片的美國出口管制規定。
該官員進一步聲稱,DeepSeek 可能會試圖隱藏顯示其使用美國芯片的技術跡象,並可能公開聲稱依賴華為的芯片。
Anthropic 的數據提取指控
DeepSeek 的美國競爭對手 Anthropic 最近指控該公司和另外兩家中國公司(Moonshot AI 和 MiniMax)不當地從其旗艦 AI 模型 Claude 中提取數據。
根據 Anthropic 的說法,這些公司進行了所謂的「蒸餾攻擊」。這涉及與另一個 AI 系統進行數百萬次交互,以從其輸出中學習並改進競爭模型。Anthropic 聲稱創建了超過 24,000 個虛假帳戶,與其 Claude 模型進行了超過 1,600 萬次交換以提取能力。
國產算力板塊的反應
這一消息在中國資本市場引發了積極反應。2 月 27 日,國產算力板塊表現尤為突出,相關股票大幅上漲。投資者將此視為核心技術自主可控前景的信心重塑。
產業格局的深遠影響
DeepSeek 選擇優先適配國產算力平台,用實際行動回應了外界對國產 AI 產業鏈的質疑。這證明本土產業鏈可以支撐世界級大模型的研發與部署。
這個決策的影響超出了單一企業合作。它改變了「美國芯片配中國應用」的產業格局,推動「中國芯片配中國模型」閉環生態的形成。
研究機構分析指出,提前數週進行的適配優化可使模型性能提升 30% 以上。DeepSeek 的做法可能會被更多 AI 企業效仿,加速國產替代進程。
華為突破了技術封鎖,DeepSeek 重構了行業慣例。中國 AI 產業正在擺脫技術依附地位。這個過程涉及技術突破和產業信心的建立。隨著模型與硬件協同優化的深入,自主可控的 AI 生態系統正在逐步建立。
參考來源:
- Reuters: “DeepSeek withholds new AI model from NVIDIA and AMD”
- 36Kr: “DeepSeek’s New Paper Unveils V4 Framework”
- The China Academy: “DeepSeek Withholds V4 Model from US Chipmakers”
- Outlook Business: “DeepSeek Ditches Nvidia, AMD for V4 Launch”
分享文章
留言評論
0 則評論暫無評論,搶先發表你的看法吧!
相關文章
NVIDIA 發布 Nemotron 3 Super:120B 開源推理模型,直指 Agentic AI 落地
NVIDIA 於 2026 年 3 月 11 日發布 Nemotron 3 Super。這款 120B 參數、12B 激活的開源模型主打 1M 上下文、混合 Mamba-Transformer 與更高推理吞吐,目標很明確:把多智能體與長任務工作流真正推進生產環境。
AI 最新資訊週報:3 月第二週最值得看的 5 條官方更新
截至 2026 年 3 月 15 日,AI 行業這一週最值得看的,不只是誰又發了更強的模型。OpenAI、Google、Microsoft、NVIDIA 與 Anthropic 的 5 條官方更新,正在把競爭重心推向安全、嵌入、代理治理與企業落地。
Anthropic 遭美國封殺,OpenAI 接手五角大樓 AI 合約:軍事 AI 倫理爭議全面升級
2026年2月,Anthropic 因拒絕移除 AI 安全限制遭美國政府封殺,OpenAI 迅速接手五角大樓合約。這場爭議揭示了 AI 軍事化應用中技術主權與國家安全的深層矛盾,ChatGPT 卸載量暴增三倍,Claude 衝上榜首。