FLUX.2 Klein 深度評測:4 秒出圖、文生圖與編輯合一的開源新王炸
Black Forest Labs 發布 FLUX.2 Klein 系列模型,號稱「開源界的速度之王」。本文深度實測 4B/9B 版本,對比 Qwen Image Edit 2511,告訴你為什麼它是電商修圖的首選。
如果說 2025 年是 FLUX.1 橫掃開源社群的一年,那麼 2026 年初,Black Forest Labs (BFL) 發布了 FLUX.2 Klein 系列。
「Klein」在德語中意為「小」。這次 BFL 沒有像 FLUX.1 Pro 那樣堆砌巨大的參數,而是專注於效率、速度與消費級顯卡的適配。
經過兩天的測試,我的結論是:對於追求質感的電商設計師和廣告人來說,這是目前表現最好的本地模型之一。
1. 版本選擇指南
打開 Hugging Face 或 Draw Things,你會看到一堆文件名:4B, 9B, Base, Distilled, FP8… 別暈,我直接給你省流結論。
Base 版不適合一般用戶
文件名帶 Base 的是非蒸餾版本。官方默認需要跑 50 步,生一張圖要半分鐘。它主要給社區大佬做微調用。普通用戶下載只會覺得慢。
推薦 9B Distilled(蒸餾版)
對於 90% 的用戶,9B 6-bit 蒸餾版是最佳選擇。
- 速度:只需要 4 步 就能出圖!
- 顯存:約佔用 7-8GB VRAM(FP8 版本甚至更小),RTX 3060/4060 都能跑。
- 畫質:雖然叫「蒸餾」,但 9B 的底子擺在那裡,細節和光影遠勝 4B 版本。

4B 版本值得用嗎?
4B 版本(約 3-4GB)是輕量化的選擇,速度很快(M4 Pro 上僅需 24秒),但畫質細節和語義理解明顯不如 9B。除非你的顯存真的不足(< 6GB),否則建議使用 9B。
2. 核心亮點實測
🚀 速度:確實很快
在本地 Draw Things 實測(M4 Pro 芯片):
- 4B 版本:約 24 秒
- 9B 版本:約 53 秒 而在 RTX 4090/5090 級別的顯卡上,官方宣稱可以達到 亞秒級(<1秒) 出圖。這意味著「即時繪畫」的體驗終於從雲端下放到了本地。
⚙️ 硬核架構:NVFP4 與未來硬件
BFL 這次不僅僅是發布了一個小模型,還展示了對下一代硬件的野心。FLUX.2 Klein 針對 NVIDIA 最新的 Blackwell 架構(RTX 50 系列) 進行了深度優化,支持 NVFP4(4位浮點數) 量化。 這意味著什麼?相比傳統的 INT4 量化,FP4 擁有更大的動態範圍,可以在不損失精度的前提下,將顯存佔用壓縮到極致。理論上,9B 模型在 FP4 格式下可以輕鬆塞進 8GB 顯存的顯卡中,且推理速度比 FP16 快一倍以上。
🔥 主要特性:文生圖 + 編輯合一 (Unified Pipeline)
這是 Klein 的重要特性。它採用了 Unified Diffusion Pipeline,打破了生圖與修圖的界限。
1. 無遮罩智能編輯
你可以在 Prompt 裡直接說「把背景換成沙灘」或「把手中的可樂換成咖啡」,它就能直接在原圖基礎上修改,不需要複雜的 Mask 遮罩流程。這對於工作流的效率提升很有幫助。
2. 多參考圖編輯 (Multi-Reference Editing)
這是一個實用的功能。Klein 支持同時輸入多張參考圖。例如,你可以給它一張「產品圖」和一張「風格參考圖(如賽博朋克)」,它能提取風格圖的色調與光影,完美應用到產品圖上,同時保持產品本身的結構不變。這種 Latent Injection 技術,讓它在處理複雜光影融合時,比傳統的 ControlNet 更自然。
📝 中文能力:偏科生
它使用 Qwen 的 Text Encoder,所以能聽懂中文 Prompt。
- 優點:中文理解能力不錯,不需要翻譯成英文也能跑。
- 缺點:不要試圖讓它在圖裡寫漢字。雖然它渲染英文單詞的效果很驚艷(比 FLUX.1 還穩),但對漢字的結構依然是一團糟。這方面目前 Qwen-Image 家族依然是王者。
3. 巔峰對決:Klein 9B vs Qwen Image Edit 2511
為了測試它的極限,我把它和目前最強的開源競品 Qwen Image Edit 2511 放在一起做了對比。
Klein 的短板:人物與二次元
- 人物一致性:在「婚紗照換臉」或「多人物場景」中,Klein 9B 經常會把臉畫崩,或者無法保持特徵一致。
- IP 識別:讓它畫「蠟筆小新」或「火影忍者」,它經常畫不出那種特定的畫風。這說明它的訓練數據集中,動漫 IP 的權重較低。
- 解剖學:畫手依然是 AI 的痛,Klein 偶爾還是會畫出 6 指琴魔,這點不如 Qwen 2.5VL 穩定。
Klein 的優勢:產品與質感
但是,一旦來到產品攝影和廣告合成領域,Klein 9B 表現出色。
- 光影質感:試著給一個飲料瓶加「冰塊和水霧」,Klein 生成的冰塊晶瑩剔透,水珠的折射符合物理規律,與原圖的光影完美融合。相比之下,Qwen 生成的細節有時會有一種「塑料感」或塗抹感。
- 智能融合:把產品背景從「室內」換成「沙漠」,Klein 能自動調整產品表面的反光和色溫,讓它看起來就像真的在沙漠裡拍的一樣。
4. 開發者指南:如何使用?
對於開發者,BFL 提供了非常友好的接入方式。
Python (Diffusers)
如果你習慣使用 Python,可以通過 diffusers 庫快速加載 9B 蒸餾版:
import torch
from diffusers import Flux2KleinPipeline
# 加載 9B 蒸餾版
pipe = Flux2KleinPipeline.from_pretrained(
"black-forest-labs/FLUX.2-klein-9B-distilled",
torch_dtype=torch.bfloat16
)
pipe.enable_model_cpu_offload()
# 文生圖
image = pipe(
"A futuristic cyberpunk city with neon lights",
num_inference_steps=4, # 蒸餾版只需 4 步
guidance_scale=1.0
).images[0]
商業授權
值得一提的是,4B 版本採用 Apache 2.0 協議,這意味著你可以免費將其用於商業項目、SaaS 服務甚至閉源產品中。這對中小工作室來說是一個巨大的利好。
總結
FLUX.2 Klein 9B 不是一個全能戰士,但在它的主場——商業攝影與質感編輯——它表現優秀。
- 如果你是電商設計師:可以嘗試 9B 蒸餾版,它能幫你省下大量的 PS 合成時間。
- 如果你是二次元愛好者:還是繼續用 NAI 或 Pony 吧,Klein 不適合你。
- 如果你需要文字海報:左轉找 Qwen 或 Ideogram。
Black Forest Labs 這次的策略很明確:不卷參數,卷效率和工作流。Klein 系列的出現,標誌著 AI 生圖進入了「實用主義」的新階段。
參考資料 / References:
分享文章
留言評論
0 則評論暫無評論,搶先發表你的看法吧!
相關文章
Z-Image Turbo 深度評測:阿里開源 6B 模型,8 步出圖且原生支持中文
阿里巴巴通義實驗室發布 Z-Image Turbo,僅 6B 參數即可在 8 步內生成高質量圖像。本文實測其在消費級顯卡上的表現,並提供 ComfyUI 新手入門指南。
AIGC 是什么?用一张「套娃图」讲清 AI、机器学习、深度学习、生成式 AI 与 LLM
别再被术语绕晕:用最直白的方式把 AIGC/生成式 AI、AI、机器学习、深度学习、大语言模型的关系一次捋顺,并给出选择工具与避坑的实用清单。
AI 視頻生成進入「導演模式」:從單鏡頭到多場景編排的 2026 進化
2026 年 AI 視頻工具從生成片段進化到多場景編排,角色持久性和故事感知成為核心能力。Runway Gen-4 到 Pika 2.0 橫評。