Claude Mythos Preview:Anthropic 選擇不公開賣自己最強的模型
2026 年 4 月 7 日 Anthropic 發布 Claude Mythos Preview,SWE-bench Verified 拿下 93.9%,但它明確表示這個模型不會普遍開放,只給 Project Glasswing 的約 40 家白名單機構用。這是 AI 商業邏輯的一次反轉——能賣的沒賣、不能賣的講得更多。
2026 年 4 月 7 日,Anthropic 在 官方 Project Glasswing 頁面 公告了一件看起來很怪的事:他們訓出了一個比 Opus 4.6 和 GPT-5.4 都強的模型,Claude Mythos Preview,然後——不打算普遍開放。
一般的 AI 公司模板是什麼?發布會、跑分截圖、API 開放、定價公告、股價拉升。這次不是。
Anthropic 自己的紅隊評估報告 寫的是另一個方向:Mythos 太強,強到 Anthropic 覺得不該讓它進入一般市場。具體強到什麼程度?
- SWE-bench Verified 93.9%
- SWE-bench Pro 77.8%
- GPQA Diamond 94.6%
- 在每個主流作業系統、每個主流瀏覽器都找到了數以千計的 zero-day 漏洞
- 其中一個 OpenBSD 的 bug 已經存在 27 年,Mythos 是第一個發現它的東西
這些分數在 Opus 4.6 和 GPT-5.4 頭上壓了兩位數差距。
然後他們說,這個模型不賣給你我。
Project Glasswing 是什麼
Project Glasswing 是 Anthropic 為了配合 Mythos 設計的一個配套計畫,核心邏輯很簡單:給一小批負責維護關鍵基礎設施的機構先用,讓它們在攻擊者拿到類似能力之前,把漏洞補起來。
首批公開確認的合作方名單:
- AWS、Apple、Google、Microsoft、NVIDIA
- Broadcom、Cisco、Palo Alto Networks、CrowdStrike
- JPMorgan Chase
- Linux Foundation
- Anthropic 自己
除了上面這些,還有大約 40 個其他組織,由 Anthropic 自己判斷「是否負責建設或維護關鍵軟體基礎設施」。Fortune 的報導 裡提到定價是 每百萬輸入 token 25 美元 / 每百萬輸出 125 美元,是 Opus 4.6 公開價格的好幾倍。但給白名單機構這個價格其實不是核心,名單本身才是。
為什麼這一步值得認真看
過去兩年 AI 安全界最喜歡的一個問題是:「如果 AI 有一天強到能自主寫出高質量的 zero-day 呢?」答案一直在模糊地帶,直到 Mythos 把時間線往前拉了。
但真正讓這件事有意思的不只是模型能力,而是 Anthropic 對它做了一個主動的商業決定:不賣。
我覺得這裡有三層可以拆開看。
第一層,這是一個 precedent(先例)。 到目前為止,前沿模型的競爭邏輯一直是「性能越強,越快鋪向市場,估值越高」。Anthropic 這次反過來走,把最強的模型藏起來,公開給世界看但不賣給一般客戶。Schneier 的評論 寫得很精準:「這等於 Anthropic 承認自己做出了一個不應該以商品形式販售的東西。」
第二層,這是對 frontier safety policy 的一次實戰演練。 Simon Willison 的看法 更直接:過去 AI 公司簽的各種 responsible scaling 承諾,從來沒有在真實的「模型已訓完、可賣可收錢」場景下被執行過。Mythos 是第一個。這件事的意義不只是這一代模型的處置方式,而是未來的同類抉擇有了一個參考點。
第三層,這是一個商業風險。 Anthropic 在把最能賺錢的東西從貨架上撤下來。股東會有意見,競爭對手會有動作,內部也會有人質疑。下面會講到的 GPT-5.4-Cyber,就是 OpenAI 在幾天後做出的直接回應。
Mythos 到底怎麼發現 27 年的 OpenBSD bug
這個細節我特別留意,因為它決定了 Mythos 是不是真的有那麼可怕。
Fortune 和 Ctech 的報導裡都提到了同一件事:Mythos 不只是「找到漏洞」,它能寫出可用的 exploit。
換句話說,以前 AI 輔助安全研究的典型工作流是:
- AI 看代碼
- AI 找到可疑的地方
- 人類寫 exploit 驗證
Mythos 把第 3 步也吃下去了。它可以自主跑完這個循環,從靜態分析到 exploit、到把 secret 從記憶體複製到另一個目錄。Anthropic 在內部測試時給了它 50 類 crash 樣本作為測試集,它逐一拆解。這是能力層級的實質躍升。
如果你是在想「這會不會只是 marketing」,我得說不太像。這幾個白名單機構裡,Apple、Google、Microsoft、Linux Foundation 都有世界上最強的安全團隊。如果 Mythos 不能做它宣稱的事,他們不會浪費時間跟 Anthropic 搞合作。
剩下沒回答的問題
幾個我還沒看到答案、但值得 AI 社群繼續追的點:
- Mythos Preview 和真正的 Mythos 是什麼關係?
Preview暗示後面還有正式版,是更強還是作為 API 間接提供? - Glasswing 的白名單會擴大嗎? 40 個組織聽起來很多,但相對於全球需要安全保護的軟體規模,這個數字還是太小
- 類似能力的開源版本多久會出現? 智谱 GLM-5.1 在同一週開源,SWE-bench Pro 已經拿下 58.4。如果這條趨勢線持續,有一天 Mythos 級別能力會出現在 MIT 授權的模型裡,那時候「不賣」這個選項就不再由 Anthropic 決定
最後一段其實才是重點。Anthropic 能選擇不賣 Mythos,是因為目前只有他們訓得出這種模型。這個位置可以保持幾個月?幾年?還是永遠?答案會決定整個 AI 安全策略往哪個方向走。
不過我自己比較確定的一件事是:今年開始,「我們訓了什麼模型」和「我們選擇怎麼部署它」是兩件要分開評估的事了。Mythos 把這條線劃了出來。
分享文章
留言評論
0 則評論暫無評論,搶先發表你的看法吧!
相關文章
Anthropic 本週同時推 Opus 4.7 和設計工具:重點不在模型又更強,而在它開始賣產品
2026 年 4 月 15 日 The Information 率先披露 Anthropic 將在本週同時發布 Claude Opus 4.7 與一款 AI 設計工具。比起模型號碼從 4.6 跳到 4.7,真正值得注意的是 Anthropic 把自己從「模型 API 供應商」推向「Full-Stack AI Studio」的這一步。
OpenAI 發布 GPT-5.4-Cyber:對 Mythos 的直接回應,但走了一條不一樣的路
2026 年 4 月 14 日,OpenAI 在 Anthropic Project Glasswing 發布一週後上線 GPT-5.4-Cyber,一個面向安全專業人員的 fine-tuned 模型,附帶 binary reverse engineering 能力。兩家在同一個議題上做出完全不同的商業決策——這才是本週最有意思的對照。
Claude Code 源碼泄漏:Anthropic 沒丟客戶資料,但把工程藍圖暴露給了全行業
2026 年 3 月 31 日,Anthropic 在一次 Claude Code 包更新中意外帶出了內部源碼。官方稱沒有客戶資料或憑證泄漏,但這起事件仍讓外界看清楚 Claude Code 的架構、功能路線與工程取捨。