Claude Mythos Preview：Anthropic 選擇不公開賣自己最強的模型

2026 年 4 月 7 日，Anthropic 在官方 Project Glasswing 頁面公告了一件看起來很怪的事：他們訓出了一個比 Opus 4.6 和 GPT-5.4 都強的模型，Claude Mythos Preview，然後——不打算普遍開放。

一般的 AI 公司模板是什麼？發布會、跑分截圖、API 開放、定價公告、股價拉升。這次不是。

Anthropic 自己的紅隊評估報告寫的是另一個方向：Mythos 太強，強到 Anthropic 覺得不該讓它進入一般市場。具體強到什麼程度？

SWE-bench Verified 93.9%
SWE-bench Pro 77.8%
GPQA Diamond 94.6%
在每個主流作業系統、每個主流瀏覽器都找到了數以千計的 zero-day 漏洞
其中一個 OpenBSD 的 bug 已經存在 27 年，Mythos 是第一個發現它的東西

這些分數在 Opus 4.6 和 GPT-5.4 頭上壓了兩位數差距。

然後他們說，這個模型不賣給你我。

Project Glasswing 是什麼

Project Glasswing 是 Anthropic 為了配合 Mythos 設計的一個配套計畫，核心邏輯很簡單：給一小批負責維護關鍵基礎設施的機構先用，讓它們在攻擊者拿到類似能力之前，把漏洞補起來。

首批公開確認的合作方名單：

AWS、Apple、Google、Microsoft、NVIDIA
Broadcom、Cisco、Palo Alto Networks、CrowdStrike
JPMorgan Chase
Linux Foundation
Anthropic 自己

除了上面這些，還有大約 40 個其他組織，由 Anthropic 自己判斷「是否負責建設或維護關鍵軟體基礎設施」。Fortune 的報導裡提到定價是 每百萬輸入 token 25 美元 / 每百萬輸出 125 美元，是 Opus 4.6 公開價格的好幾倍。但給白名單機構這個價格其實不是核心，名單本身才是。

為什麼這一步值得認真看

過去兩年 AI 安全界最喜歡的一個問題是：「如果 AI 有一天強到能自主寫出高質量的 zero-day 呢？」答案一直在模糊地帶，直到 Mythos 把時間線往前拉了。

但真正讓這件事有意思的不只是模型能力，而是 Anthropic 對它做了一個主動的商業決定：不賣。

我覺得這裡有三層可以拆開看。

第一層，這是一個 precedent（先例）。 到目前為止，前沿模型的競爭邏輯一直是「性能越強，越快鋪向市場，估值越高」。Anthropic 這次反過來走，把最強的模型藏起來，公開給世界看但不賣給一般客戶。Schneier 的評論寫得很精準：「這等於 Anthropic 承認自己做出了一個不應該以商品形式販售的東西。」

第二層，這是對 frontier safety policy 的一次實戰演練。 Simon Willison 的看法更直接：過去 AI 公司簽的各種 responsible scaling 承諾，從來沒有在真實的「模型已訓完、可賣可收錢」場景下被執行過。Mythos 是第一個。這件事的意義不只是這一代模型的處置方式，而是未來的同類抉擇有了一個參考點。

第三層，這是一個商業風險。 Anthropic 在把最能賺錢的東西從貨架上撤下來。股東會有意見，競爭對手會有動作，內部也會有人質疑。下面會講到的 GPT-5.4-Cyber，就是 OpenAI 在幾天後做出的直接回應。

Mythos 到底怎麼發現 27 年的 OpenBSD bug

這個細節我特別留意，因為它決定了 Mythos 是不是真的有那麼可怕。

Fortune 和 Ctech 的報導裡都提到了同一件事：Mythos 不只是「找到漏洞」，它能寫出可用的 exploit。

換句話說，以前 AI 輔助安全研究的典型工作流是：

AI 看代碼
AI 找到可疑的地方
人類寫 exploit 驗證

Mythos 把第 3 步也吃下去了。它可以自主跑完這個循環，從靜態分析到 exploit、到把 secret 從記憶體複製到另一個目錄。Anthropic 在內部測試時給了它 50 類 crash 樣本作為測試集，它逐一拆解。這是能力層級的實質躍升。

如果你是在想「這會不會只是 marketing」，我得說不太像。這幾個白名單機構裡，Apple、Google、Microsoft、Linux Foundation 都有世界上最強的安全團隊。如果 Mythos 不能做它宣稱的事，他們不會浪費時間跟 Anthropic 搞合作。

剩下沒回答的問題

幾個我還沒看到答案、但值得 AI 社群繼續追的點：

Mythos Preview 和真正的 Mythos 是什麼關係？ Preview 暗示後面還有正式版，是更強還是作為 API 間接提供？
Glasswing 的白名單會擴大嗎？ 40 個組織聽起來很多，但相對於全球需要安全保護的軟體規模，這個數字還是太小
類似能力的開源版本多久會出現？ 智谱 GLM-5.1 在同一週開源，SWE-bench Pro 已經拿下 58.4。如果這條趨勢線持續，有一天 Mythos 級別能力會出現在 MIT 授權的模型裡，那時候「不賣」這個選項就不再由 Anthropic 決定

最後一段其實才是重點。Anthropic 能選擇不賣 Mythos，是因為目前只有他們訓得出這種模型。這個位置可以保持幾個月？幾年？還是永遠？答案會決定整個 AI 安全策略往哪個方向走。

不過我自己比較確定的一件事是：今年開始，「我們訓了什麼模型」和「我們選擇怎麼部署它」是兩件要分開評估的事了。Mythos 把這條線劃了出來。

Claude Mythos Preview：Anthropic 選擇不公開賣自己最強的模型

Project Glasswing 是什麼

為什麼這一步值得認真看

Mythos 到底怎麼發現 27 年的 OpenBSD bug

剩下沒回答的問題

分享文章

留言評論

相關文章

Anthropic 本週同時推 Opus 4.7 和設計工具：重點不在模型又更強，而在它開始賣產品

OpenAI 發布 GPT-5.4-Cyber：對 Mythos 的直接回應，但走了一條不一樣的路

Claude Code 源碼泄漏：Anthropic 沒丟客戶資料，但把工程藍圖暴露給了全行業