SynapseWire

Claude Mythos Preview:Anthropic 選擇不公開賣自己最強的模型

2026 年 4 月 7 日 Anthropic 發布 Claude Mythos Preview,SWE-bench Verified 拿下 93.9%,但它明確表示這個模型不會普遍開放,只給 Project Glasswing 的約 40 家白名單機構用。這是 AI 商業邏輯的一次反轉——能賣的沒賣、不能賣的講得更多。

作者: SynapseWire 編輯部 發布於:
Claude Mythos Preview 與 Project Glasswing 社論風格封面

2026 年 4 月 7 日,Anthropic 在 官方 Project Glasswing 頁面 公告了一件看起來很怪的事:他們訓出了一個比 Opus 4.6 和 GPT-5.4 都強的模型,Claude Mythos Preview,然後——不打算普遍開放

一般的 AI 公司模板是什麼?發布會、跑分截圖、API 開放、定價公告、股價拉升。這次不是。

Anthropic 自己的紅隊評估報告 寫的是另一個方向:Mythos 太強,強到 Anthropic 覺得不該讓它進入一般市場。具體強到什麼程度?

  • SWE-bench Verified 93.9%
  • SWE-bench Pro 77.8%
  • GPQA Diamond 94.6%
  • 在每個主流作業系統、每個主流瀏覽器都找到了數以千計的 zero-day 漏洞
  • 其中一個 OpenBSD 的 bug 已經存在 27 年,Mythos 是第一個發現它的東西

這些分數在 Opus 4.6 和 GPT-5.4 頭上壓了兩位數差距。

然後他們說,這個模型不賣給你我。

Project Glasswing 是什麼

Project Glasswing 是 Anthropic 為了配合 Mythos 設計的一個配套計畫,核心邏輯很簡單:給一小批負責維護關鍵基礎設施的機構先用,讓它們在攻擊者拿到類似能力之前,把漏洞補起來。

首批公開確認的合作方名單:

  • AWS、Apple、Google、Microsoft、NVIDIA
  • Broadcom、Cisco、Palo Alto Networks、CrowdStrike
  • JPMorgan Chase
  • Linux Foundation
  • Anthropic 自己

除了上面這些,還有大約 40 個其他組織,由 Anthropic 自己判斷「是否負責建設或維護關鍵軟體基礎設施」。Fortune 的報導 裡提到定價是 每百萬輸入 token 25 美元 / 每百萬輸出 125 美元,是 Opus 4.6 公開價格的好幾倍。但給白名單機構這個價格其實不是核心,名單本身才是。

為什麼這一步值得認真看

過去兩年 AI 安全界最喜歡的一個問題是:「如果 AI 有一天強到能自主寫出高質量的 zero-day 呢?」答案一直在模糊地帶,直到 Mythos 把時間線往前拉了。

但真正讓這件事有意思的不只是模型能力,而是 Anthropic 對它做了一個主動的商業決定:不賣。

我覺得這裡有三層可以拆開看。

第一層,這是一個 precedent(先例)。 到目前為止,前沿模型的競爭邏輯一直是「性能越強,越快鋪向市場,估值越高」。Anthropic 這次反過來走,把最強的模型藏起來,公開給世界看但不賣給一般客戶。Schneier 的評論 寫得很精準:「這等於 Anthropic 承認自己做出了一個不應該以商品形式販售的東西。」

第二層,這是對 frontier safety policy 的一次實戰演練。 Simon Willison 的看法 更直接:過去 AI 公司簽的各種 responsible scaling 承諾,從來沒有在真實的「模型已訓完、可賣可收錢」場景下被執行過。Mythos 是第一個。這件事的意義不只是這一代模型的處置方式,而是未來的同類抉擇有了一個參考點。

第三層,這是一個商業風險。 Anthropic 在把最能賺錢的東西從貨架上撤下來。股東會有意見,競爭對手會有動作,內部也會有人質疑。下面會講到的 GPT-5.4-Cyber,就是 OpenAI 在幾天後做出的直接回應。

Mythos 到底怎麼發現 27 年的 OpenBSD bug

這個細節我特別留意,因為它決定了 Mythos 是不是真的有那麼可怕。

FortuneCtech 的報導裡都提到了同一件事:Mythos 不只是「找到漏洞」,它能寫出可用的 exploit

換句話說,以前 AI 輔助安全研究的典型工作流是:

  1. AI 看代碼
  2. AI 找到可疑的地方
  3. 人類寫 exploit 驗證

Mythos 把第 3 步也吃下去了。它可以自主跑完這個循環,從靜態分析到 exploit、到把 secret 從記憶體複製到另一個目錄。Anthropic 在內部測試時給了它 50 類 crash 樣本作為測試集,它逐一拆解。這是能力層級的實質躍升。

如果你是在想「這會不會只是 marketing」,我得說不太像。這幾個白名單機構裡,Apple、Google、Microsoft、Linux Foundation 都有世界上最強的安全團隊。如果 Mythos 不能做它宣稱的事,他們不會浪費時間跟 Anthropic 搞合作。

剩下沒回答的問題

幾個我還沒看到答案、但值得 AI 社群繼續追的點:

  • Mythos Preview 和真正的 Mythos 是什麼關係? Preview 暗示後面還有正式版,是更強還是作為 API 間接提供?
  • Glasswing 的白名單會擴大嗎? 40 個組織聽起來很多,但相對於全球需要安全保護的軟體規模,這個數字還是太小
  • 類似能力的開源版本多久會出現? 智谱 GLM-5.1 在同一週開源,SWE-bench Pro 已經拿下 58.4。如果這條趨勢線持續,有一天 Mythos 級別能力會出現在 MIT 授權的模型裡,那時候「不賣」這個選項就不再由 Anthropic 決定

最後一段其實才是重點。Anthropic 能選擇不賣 Mythos,是因為目前只有他們訓得出這種模型。這個位置可以保持幾個月?幾年?還是永遠?答案會決定整個 AI 安全策略往哪個方向走。

不過我自己比較確定的一件事是:今年開始,「我們訓了什麼模型」和「我們選擇怎麼部署它」是兩件要分開評估的事了。Mythos 把這條線劃了出來。

分享文章

留言評論

0 則評論

暫無評論,搶先發表你的看法吧!

相關文章