當 AWS 開始漲價：2026 年 AI 基礎設施的「光」與「存」之戰

2023-2024 年是 AI 的「淘金熱」，每個人都在瘋狂搶購鏟子（GPU）。進入 2026 年，正處於一個更為殘酷也更為精細的階段：基礎設施的物理極限戰爭。

最近，市場傳來了兩個看似獨立卻緊密相關的信號：一是中信證券發布深度報告，指出光通信產業正在經歷從可插拔模組向 NPO（近封裝光學）的關鍵轉型；二是 AWS 罕見地打破了雲端服務「只降不升」的摩爾定律鐵律，上調了機器學習實例的價格。

這兩件事表明：算力不再是唯一的瓶頸，數據的「傳輸」和「存儲」正在成為新的戰場。

本文將深入 2026 年初的 AI 硬體深水區，探討為何光互聯（Optical Interconnect）和新型存儲（Next-Gen Memory）會成為接下來兩年的絕對主角。

信號一：雲端巨頭的焦慮與 CAPEX 的瘋狂

從錢的流向說起。根據最新的財報數據，海外四大雲端廠商（Google, Microsoft, Meta, Amazon）在 2025 年第三季度的資本支出（CAPEX）同比增長了驚人的 74%。

這是一場快速的技術競賽。

為什麼他們停不下來？

GPT-5.2 和 Gemini 3.0 Pro 已經發布了，模型能力已經很強了，為什麼還要這麼瘋狂地燒錢？

答案在於推理成本與延遲。隨著模型參數量的指數級增長，訓練模型只是入場券，真正的挑戰在於如何讓數十億用戶同時使用這些模型而不破產，且延遲要低到人類無法察覺。

台積電的數據佐證了這一點：2026 年全年 CAPEX 指引大增至 520-560 億美元。這意味著，對於先進製程和封裝（CoWoS）的需求遠未見頂。

AWS 的漲價邏輯

AWS 上調 EC2 機器學習容量塊（Capacity Blocks）價格約 15%，這是一個極具象徵意義的事件。

在過去的十年裡，雲計算的邏輯是：硬體更新 -> 效率提升 -> 價格下降。但現在，這個邏輯失效了。原因有二：

能源成本：AI 數據中心的能耗密度已經接近物理極限。
互聯瓶頸：為了讓成千上萬張 GPU 協同工作，網絡互聯設備的成本佔比正在急劇上升。

核心戰場：光互聯的代際更迭 (NPO vs CPO)

在 2024 年，還在討論 800G 光模組的放量。到了 2026 年，1.6T 已經成為標配，而行業正在向更高效的架構演進。

這裡有一個核心的技術衝突：從銅纜轉向光纖。

在伺服器內部，電信號通過銅線傳輸的損耗隨著頻率提升而急劇增加。當速率達到 224Gbps/Lane 時，銅線的傳輸距離被壓縮到了極限。這時候，必須把「光」引入到離 GPU 更近的地方。

技術路線圖：從 Pluggable 到 CPO 的妥協

目前業界存在三種主要方案，而 2026 年的主角是 NPO (Near Packaged Optics)。

特性	傳統可插拔光模組 (Pluggable)	NPO (近封裝光學)	CPO (共封裝光學)
位置	面板上，離晶片遠	與晶片在同一基板，但在封裝外	與晶片封裝在一起
功耗	高	中 (降低 20-30%)	低
密度	低	高 (提升 50%+)	極高
維護性	極佳 (壞了拔掉換一個)	良好 (可獨立更換)	困難 (壞了可能要換整顆 Switch/GPU)
成熟度	成熟	爆發期 (2026-2027)	早期導入

為什麼中信證券和產業界看好 NPO？

這是一個典型的工程學妥協。CPO 雖然性能最好，但一旦光引擎失效，整顆昂貴的 GPU 或交換機晶片可能就報廢了，這對於良率和成本是噩夢。NPO 保留了高性能，同時允許獨立維護，是 Scale-up 層面（單機櫃擴展）的最佳過渡方案。

實戰視角：這對架構師意味著什麼？

如果是數據中心架構師，這意味著網絡拓撲將發生變化。不再需要擔心長距離銅纜的信號衰減，但需要開始管理更複雜的光電熱管理策略。

以下是一個模擬的 Python 腳本，用於計算在不同互聯架構下，大規模集群的預期功耗差異（簡化模型）：

def calculate_cluster_power(gpu_count, interconnect_type):
    """
    估算 AI 集群在不同互聯技術下的功耗 (kW)
    """
    # 基礎參數 (假設值，基於 2026 年技術水平)
    gpu_power = 1.2  # kW per GPU (e.g., H200/B100 successors)
    
    # 互聯功耗係數 (pJ/bit)
    power_efficiency = {
        "pluggable": 15,  # 傳統可插拔
        "npo": 10,        # NPO 方案
        "cpo": 6          # CPO 方案
    }
    
    # 假設每張卡需要 10Tbps 的雙向帶寬
    bandwidth_per_gpu_tbps = 10
    total_bandwidth_bits = gpu_count * bandwidth_per_gpu_tbps * 1e12
    
    # 計算互聯功耗 (Watts)
    interconnect_power_w = total_bandwidth_bits * power_efficiency[interconnect_type] * 1e-12
    
    # 總功耗
    total_power_kw = (gpu_count * gpu_power) + (interconnect_power_w / 1000)
    
    return total_power_kw

# 模擬 10,000 張卡的集群
cluster_size = 10000

print(f"--- {cluster_size} GPU Cluster Power Analysis ---")
print(f"Traditional Pluggable: {calculate_cluster_power(cluster_size, 'pluggable'):.2f} kW")
print(f"NPO Technology:        {calculate_cluster_power(cluster_size, 'npo'):.2f} kW")
print(f"Power Savings (NPO):   {calculate_cluster_power(cluster_size, 'pluggable') - calculate_cluster_power(cluster_size, 'npo'):.2f} kW")

代碼解讀：在萬卡集群級別，NPO 帶來的功耗節省是兆瓦級的。這不僅僅是電費的問題，更是數據中心配電容量是否足夠的問題。

存儲革命：從 HBM 到 “Context Memory”

除了光，另一個瓶頸是「記憶」。

CES 2026 上，Nvidia 發布了 ICMS (Inference Context Memory Platform)。這是一個非常重要的信號。過去我們只關注 HBM（高頻寬記憶體），因為訓練需要極高的帶寬。

但在推理階段，尤其是長文本（Long Context）推理，我們面臨的是「容量爆炸」。

為什麼 HBM 不夠用了？

當讓 AI 處理一本 50 萬字的小說，或者分析一整年的財務報表時，KV Cache（鍵值緩存）會佔用巨大的顯存。HBM 太貴且容量有限，DDR 又太慢。

Nvidia 的 ICMS 以及美光（Micron）的新動作，實際上是在 HBM 和 SSD 之間插入了一個新的層級：基於高性能 NAND/SSD 的上下文存儲層。

這解釋了為什麼存儲芯片板塊大漲：

DRAM: 預計 2026 Q1 環比增長 55%-60%。
NAND: 預計環比增長 33%-38%。

這不是週期性的反彈，這是架構性的需求轉移。AI 正在從「算力飢渴」轉向「存儲飢渴」。

供應鏈深挖：誰在卡誰的脖子？

雖然前景光明，但供應鏈並非一帆風順。中信證券的報告指出了一個關鍵的短缺點：高速 EML 激光器芯片。

什麼是 EML？

EML (Electro-absorption Modulated Laser) 是光模組的心臟。沒有它，光模組就無法發光，數據就無法傳輸。

現狀：2025 Q3 的缺口已擴大至 25%-30%。
玩家：Lumentum 等巨頭正在瘋狂擴產，訂單已經鎖定到了 2027 年。
變數：矽光子（Silicon Photonics）。

矽光方案之所以被寄予厚望，是因為它可以使用成熟的 CMOS 工藝來製造光學器件，減少對昂貴 III-V 族材料（如磷化銦）的依賴。Tower Semiconductor 追加 3 億美元擴產矽光芯片，正是為了押注這個未來。

投資與技術落地的批判性思考

面對如此明確的產業趨勢，應該如何看待？

1. 警惕「概念股」的泡沫

雖然光通信板塊大漲，但並非所有貼著 “CPO” 標籤的公司都有真實的技術落地。真正的門檻在於封裝工藝和熱管理能力。重點關注那些已經進入北美雲廠商（Google, AWS）供應鏈的頭部企業。

2. 開發者的應對

對於軟體工程師和 AI 開發者，硬體的變化將影響軟體架構：

成本模型變了：雲端推理成本可能不會像預期那樣快速下降，需要更多地優化模型結構（如 MoE, 量化）。
存儲分層：未來的 AI 應用開發，需要更精細地管理 Context Window，利用類似 ICMS 的層級存儲來降低成本。

3. 國產替代的機會與挑戰

國內廠商在矽光 NPO 領域佈局領先。這是一個機會窗口。由於 EML 芯片主要被海外壟斷，矽光方案是中國廠商繞道超車的唯一路徑。如果 2027 年能實現批量商業化落地，將極大緩解供應鏈安全問題。

總結

2026 年的 AI 產業，正在從快速擴張轉向精細化運作。

光互聯 (NPO) 是為了解決數據傳輸的能耗和密度牆。
新型存儲 (ICMS/NAND) 是為了解決長文本推理的容量牆。
漲價的 AWS 表明，算力資源依然緊缺且昂貴。

對於投資者，關注那些提供上游材料（光芯片、存儲顆粒）的企業；對於技術人員，準備好迎接一個異構計算、光電融合的新架構時代。

參考資料 / References:

中信證券：AI產業趨勢明確持續看好光通信板塊

今天，科技股全線反彈！存儲芯片板塊大漲

TrendForce Market Research 2026 Q1 Forecast

TSMC Q4 2025 Earnings Call Transcript

免責聲明：本文內容僅供技術探討與市場分析，不構成任何投資建議。