開源陣營這週同時出招:智譜 GLM-5.1 打進前三、Gemma 4 轉 Apache 2.0
2026 年 4 月 7 日,Z.ai(原智譜)發布 GLM-5.1,SWE-bench Pro 拿下 58.4 超過 GPT-5.4;同一週 Google 把 Gemma 4 轉到 Apache 2.0。把這兩件事放一起看,比誰的榜單分數高更重要的是:開源模型的授權、可商用性與對標能力已經同時改變。
這週 AI 社群的焦點都在 Claude Mythos 和 GPT-5.4-Cyber 的閉門安全大戲上。但幾乎同時,開源陣營的兩家也各出了一手。手法不一樣,放在一起看訊號很清楚。
-
2026 年 4 月 7 日,Z.ai(原名智譜 AI)發布 GLM-5.1。SWE-bench Pro 拿下 58.4,直接壓過 GPT-5.4 的 57.7 和 Claude Opus 4.6 的 57.3。MIT 授權,權重可下載,能本地跑。
-
同一週,Google 正式把 Gemma 4 的授權轉到 Apache 2.0。
這兩件事表面看像是兩條平行新聞,但把它們拼起來會發現:開源陣營這一週同時把兩個最大的瓶頸(能力對標和商用授權)鬆動了。
GLM-5.1 的幾個具體事實
從 buildfast with AI 的評測、zenvanriel 的技術評測、MindStudio 的總覽 拼起來:
架構:754B 參數的 Mixture-of-Experts,強調 agentic engineering 與長時間任務 授權:MIT — 可以商用、可以修改、可以蒸餾,沒有 royalty 部署:權重公開在 Hugging Face 算力:據報告沒有用任何美國晶片訓練 商業地位:Z.ai 於 2026 年 1 月在香港交易所上市,融資約 5.58 億美元,是全球第一家公開上市的 AI 基礎模型公司
然後是能力:
| Benchmark | GLM-5.1 | GPT-5.4 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-bench Pro | 58.4 | 57.7 | 57.3 |
差距不大,但方向很重要。開源模型第一次在一個主流編程 benchmark 上同時超過 OpenAI 旗艦和 Anthropic 旗艦。
更值得注意的是 GLM-5.1 的一個實測特點:它可以在沒有人類介入的情況下跑完 plan → execute → test → fix → optimize 循環長達 8 小時。這不是一般的 code completion,是真的在做自主代理工作。
Gemma 4 的 Apache 2.0 才是更大的訊號
我在 之前那篇 Gemma 4 分析 裡寫過,那時候的判斷是「Apache 2.0 可能才是這次最重要的一行字」。
現在這個判斷被驗證了。Google 官方 Open Source Blog 把 Gemma 4 從 Gemma 授權(包含不少商用限制)正式切到 Apache 2.0。和 GLM-5.1 的 MIT 差不多,是業界最寬鬆的兩個授權之一。
這意味著什麼?
- 法務阻力大幅下降。一個模型能不能進生產,經常卡在授權邊界。Apache 2.0 和 MIT 幾乎沒有這個問題
- 微調和蒸餾工具鏈會優先支援。Unsloth、Axolotl、LLaMA Factory 等工具對 MIT / Apache 2.0 的支援一向比客製授權積極
- 企業內部 PoC 意願提升。以前「我們試試開源版本」經常被法務擋回來,現在這個擋法成立的可能性變小
授權 vs 能力:到底哪個更重要?
這是一個老問題。過去兩年的主流說法是「閉源比開源強 6-12 個月」,這句話在 2024 年初成立,但從 2025 下半年開始在鬆動。現在看本週的兩條新聞,我覺得故事已經變了。
真實的採購決策從來不是「誰的分數高我用誰」。它是:
- 這個模型的能力夠不夠用?(很多場景 GPT-5.4 和 Claude Opus 的能力都是 overkill)
- 我能合法地把它部署進我的產品嗎?
- 一年之後我被這家廠商鎖得多緊?
- 如果這家公司倒閉了,我的 infra 會不會也跟著陣亡?
Apache 2.0 和 MIT 對第 2、3、4 題的回答比任何封閉 API 都更好。以前阻擋採用的是第 1 題,開源模型真的不夠用。現在這個門檻也過了。
這不代表 Anthropic 和 OpenAI 會突然沒飯吃。它們的產品路線(Claude Code、ChatGPT Enterprise、Mythos 這類)在安全性、合規、產品整合方面仍然有獨特價值。但「我只是要一個夠好的通用 LLM」這個市場,越來越沒有理由付 per-token 給閉源家。
幾個建議的觀察點
如果你在評估這件事對自己業務有什麼影響,下面這些值得接下來一兩個月繼續追:
- Z.ai 下一版本的訓練規模能不能跟上。這次 GLM-5.1 用 754B MoE 做到 58.4,但真正的對比點是 2026 下半年。GPT-6、Claude 5、Gemini 4 大機率都在那時候出,開源陣營能不能持續咬住是關鍵
- Apache 2.0 / MIT 模型會不會被政府限制。中美關係、模型出口管制、AI 安全法規都有可能在 2026 年反轉這個趨勢。GLM-5.1「沒有美國晶片」的訓練細節,本身就帶有地緣政治意味
- Hugging Face 的角色。當開源變成真正的生產選項,Hugging Face 從「給研究員用的 GitHub」變成「企業 AI 採購入口」。這個轉型會不會順,要看它們的 enterprise 支援做得怎麼樣
- 微調工具鏈會不會跟著爆發。Apache 2.0 下,微調平台有機會做出和雲廠商不一樣的產品
這一週閉源陣營的戲很熱鬧,但開源陣營其實交出了更長遠的答案卷。SWE-bench Pro 58.4 不是這個答案的主題,MIT 和 Apache 2.0 才是。
分享文章
留言評論
0 則評論暫無評論,搶先發表你的看法吧!
相關文章
Gemma 4 發布:Google 不只是在推開放模型,而是在把本地代理和 Android 綁在一起
Google 在 2026 年 4 月 2 日發布 Gemma 4。比起單純追逐開放模型榜單,這次更值得看的其實是 Apache 2.0 授權、31B/26B 與 E4B/E2B 的四檔分層,以及 Gemma 4 被直接推向 Android AICore 與本地代理工作流。
Stanford AI Index 2026 + PwC 報告:AI 收益有 75% 被 20% 公司拿走了
2026 年 4 月 13 日同週內,Stanford HAI 發布 AI Index 2026、PwC 放出 1,217 位高管的 AI 表現研究。兩份報告指向同一個不太舒服的事實:AI 收益的集中度已經超過任何過去 20 年的技術浪潮。這會把產業推向什麼方向?
Anthropic 本週同時推 Opus 4.7 和設計工具:重點不在模型又更強,而在它開始賣產品
2026 年 4 月 15 日 The Information 率先披露 Anthropic 將在本週同時發布 Claude Opus 4.7 與一款 AI 設計工具。比起模型號碼從 4.6 跳到 4.7,真正值得注意的是 Anthropic 把自己從「模型 API 供應商」推向「Full-Stack AI Studio」的這一步。