2026 年的前沿 AI 實驗室都活在同一個悖論裡:模型能力以肉眼可見的速度推進,但每款燒掉數百億美元煉成的旗艦,往往在發布幾個月內就被開源社群蒸餾、複製,淪為廉價商品。就在這個拐點上,Anthropic 在六月初的一連串動作,把「安全」、「壟斷」與「商業生存」的辯論,一舉推上了風口浪尖。
導火線是新模型 Fable(Fable 5)——兩個月前那款被官方形容為「太危險、不適合公開釋出」的 Mythos 的安全降級版。Ben Thompson 在 Stratechery 上坦言它驚艷到「讓 GPT-5.5 和自家 Opus 4.8 都顯得渺小而愚笨」,研判這是一次全新預訓練的產物。但真正值得玩味的,從來不是模型有多強,而是它發布後幾天內引爆的連鎖反應:越獄、政府出口管制、微軟執行長公開示警,以及系統卡片裡那條「隱形降級」霸王條款。
Anthropic 的行為其實相當容易理解;讓這家公司與眾不同的,是它「如何替自己的行為辯護」——而正是這些辯護,既給了憤世嫉俗者攻擊的彈藥,也給了 Anthropic 它的魔力。
先理解這家公司:從 OpenAI 出走的安全派
Anthropic 成立於 2021 年,由 Dario 與 Daniela Amodei 兄妹率 11 名 OpenAI 前核心員工出走創立。Dario 離開前是 OpenAI 研發副總裁,主導過 GPT-2、GPT-3;出走的根本原因,是認為 OpenAI 在微軟巨資與急速商業化下,稀釋了對 AI 生存風險的重視。
關鍵在於,它從第一天就註冊為「公共利益公司(PBC)」——這個法律身分要求公司在股東利益與公共利益之間取得平衡。換句話說,「安全」不只是行銷話術,而是寫進治理章程的法律承諾。技術上,它用「憲法 AI」與「從 AI 回饋強化學習(RLAIF)」取代 OpenAI 仰賴人類標記員的 RLHF,再加上機制可解釋性研究。這些共同構築了 Anthropic「我們最懂安全」的話語權——也是理解後續一切爭議的鑰匙:每當它做出看似霸道的決定,永遠能在「使命」的高度上自圓其說。
第一幕:越獄、國安危機與政企角力
Fable 上線沒多久,「越獄」這齣老戲碼就上演了——任何公開模型的護欄都有被繞過的一天。但這次後果空前嚴重:據 Anthropic 部落格,美國政府援引國安授權發布出口管制指令,要求暫停「任何外國國籍人士」存取 Fable 5 與 Mythos 5,連 Anthropic 自家外籍員工都不例外。其淨效果,是公司必須立刻對所有客戶關閉這兩款模型。
Anthropic 反彈激烈,強調所謂越獄只能挖出「少數早已為人所知、相對輕微的漏洞」,是政府在「對邊緣漏洞小題大作」。而最耐人尋味的線索是:據 Fortune 與 The Information 報導,把這份「越獄示範」捅上白宮的,正是 Amazon——Anthropic 最大的金主之一。這層關係微妙到近乎荒謬,因為 Amazon 在牌局裡同時扮演三種矛盾角色:累計數十億美元的最大股東、Claude 賴以運行的雲端算力供應商(AWS Bedrock),如今卻又成了把盟友旗艦送進封殺名單的「通報者」。當算力帳單與潛在競爭威脅擺在同一張資產負債表上,「安全疑慮」四個字究竟有幾分公益、幾分算計,外界恐怕永遠無從分辨。
這也不是 Anthropic 第一次與政府對撞。2026 年初它就曾槓上五角大廈:面對要求無限制軍事部署的壓力,創辦團隊劃下兩條紅線——不得用於國內大規模監控、不得用於無人類介入的全自主武器。即便只有 3 天期限、可能被《國防生產法》施壓,它仍選擇承擔商業代價堅持原則,結果讓 OpenAI 趁勢搶走部分國防合約。Dario 當時的金句是:「與政府持不同意見,是世界上最美國化的一件事。」
為什麼這場衝突注定發生
有人質疑 Mythos 真有強到值得政府大動干戈嗎?Thompson 認為這沒抓到重點:就算這一代不夠危險,下一代就會是了——尤其當模型已越來越能參與「煉成自己的後繼者」。前沿能力是指數級成長,監管者要面對的不是當下這一刻,而是一條不斷加速向上的曲線。真正的分歧因此浮現:究竟誰有資格定義「一個模型是否安全」?是把安全當核心信仰的實驗室,還是握有國安授權的政府?而這種「一刀切」的封殺,會不會成為 AI 發展的新常態?這是一個仍無答案、卻足以重塑產業格局的巨大問號。
第二幕:開源夾擊下的經濟必然性
要理解 Anthropic 為何此刻如此激進,得先看懂它的經濟困局。AI 發展至今,最大的價值其實流向「算力」——真正賺到大錢的是 Nvidia、台積電與記憶體廠;Anthropic 與 OpenAI 加總卻已燒掉數百億美元累積虧損。算力才是這場淘金熱裡賣鏟子的人。
這就是前沿實驗室的「看空論」:差異化太短命,免費替代品卻不斷「夠用就好」。一個領先模型一旦釋出,立刻被蒸餾、商品化,而最兇猛的力量來自中國開源模型。2026 年這股壓力尤其真實:隨著 DeepSeek V4、Qwen 3.6 與月之暗面 Kimi K2.6 陸續釋出,開源陣營的「代理(agentic)」性能已逼近前沿水準,而且免費、可商用、能部署在私有環境,對在意資料主權的企業極具吸引力。當頂尖能力收斂、價格被一路下殺,那些上百億美元的算力投資根本無從回收——這已不是面子問題,而是赤裸裸的生死問題。
插曲:估值狂飆下的循環融資疑雲
這場焦慮還有一個被資本市場放大的維度。Anthropic 的估值在 2026 年走出陡峭曲線:2 月才以 3,800 億美元投後估值完成 300 億美元的 G 輪;三個月後的 5 月 28 日,據 路透社,它又完成 650 億美元的 Series H,估值飆到 9,650 億美元,首度超車 OpenAI、逼近兆美元。官方同日揭露的年化營收(run-rate)已逼近 470 億美元,較 1 月的約 90 億暴增約五倍,主要由 Claude Code 訂閱、Cowork 企業方案與開發者 API 驅動;公司並於 6 月 1 日向 SEC 機密遞交 S-1,由高盛與摩根大通領銜承銷,瞄準秋季掛牌,預計迎來首個獲利季度。
但投資人 Om Malik 在 《Anthropic, AI and The Numbers Problem》 提出尖銳質疑:在 S-1 財報細節經 SEC 審計公開前,外界根本無從驗證這些 run-rate 的含金量;更值得警惕的是濃厚的「循環融資」氣味——雲端巨頭一手投資 Anthropic,另一手收取它鉅額算力費用、並轉售 Claude API 計入自家 AI 營收。這種「資金繞一圈、彼此互相做大帳面」的模式,曾在 2000 年寬頻泡沫的 Lucent 與 Nortel 身上以悲劇收場。當估值被吹到逼近兆美元,維持「下一季數字依然漂亮」的壓力,就會反過來逼公司在數據與壟斷上做出更具侵略性的選擇——一家準備 IPO、要對公開市場負責的公司,往往更沒有「不作惡」的奢侈。
唯一的出路:搶佔用戶觸點
如果模型終將商品化,價值會流向哪裡?Thompson 的答案是:當算力供給最終充足,最值錢的位置會回歸到「自古以來就最值錢」的地方——擁有用戶觸點。誰掌握使用者每天打開、用來完成所有工作的那塊「畫布」,誰就握有真正的鎖定效應。其必然結論,是前沿實驗室與軟體公司正走在碰撞軌道上:因為掌握觸點的正是軟體,而實驗室的長期利益不是甘於當軟體的廉價輸入零件,而是直接取代軟體本身。Anthropic 強推 Claude Code 與 Cowork、OpenAI 強推 Codex,本質上都是繞過中間商、直接掌控入口。它早在創立初期就刻意避開消費端流量陷阱、深耕 B2B 與開發者市場,如今這正轉化為它在觸點爭奪戰裡最堅實的灘頭堡。
微軟的反擊:Nadella 的「代幣資本」論
這個舉動踩到了傳統軟體巨頭的底線。微軟執行長 Satya Nadella 在 X 上發表長文,先拋出一記重磅警告:
我們最不樂見的,是一個「每個產業裡的每家公司,都把價值拱手讓給少數幾個吞噬一切的模型」的世界。一個掏空整個產業的 AI 未來,是不會獲得社會許可(societal permission)的。
接著他提出三個概念:人類資本、代幣資本與認知迴圈。人類資本是員工的知識、判斷、人脈與模式辨識;代幣資本則是公司自己「打造並擁有」的 AI 能力。他主張人類資本不會因代幣資本成長而貶值,反而會更值錢,因為「沒有人類的方向引導,算力只會原地空轉」。真正的機會不在「挑選最好的模型」,而在「在模型之上建立學習迴圈」,讓企業能抽換掉一個通用模型,卻不流失系統裡累積的『公司老兵』專業知識。說白了,這是微軟對企業喊話:把專有數據、工作流程與判斷力資產化,建立私有評測與強化學習環境,別免費把珍貴養分餵給 Anthropic 或 OpenAI,最後反被它們商品化、回頭吞噬。
這是警告,還是預言?
Thompson 對 Nadella 的類比給了冷峻反駁。Nadella 把這比作全球化第一階段——工業經濟被外包掏空,GDP 好看但位移後果至今仍在發酵。Thompson 一針見血:那場全球化「真的發生了」,工業經濟也「真的被掏空了」。所以這或許根本不是警告,而是預言。微軟之所以大聲疾呼,正因它自己可能就是受害者;而模型製造商的「經濟必然性」,恰恰就是要去完成 Nadella 最害怕的那件事。雙方立場從一開始就注定無法調和——這場觸點保衛戰,沒有中間地帶。
第三幕:數據護城河與 30 天保留條款
模型要持續變強,光有算力不夠,更需要「更多、更好的數據」。當前進步越來越仰賴強化學習,而最強大的槓桿永遠是真實世界的使用數據。這也解釋了補貼訂閱的邏輯:SemiAnalysis 估算,一份 200 美元的方案能換到約 8,000 美元的 Claude token 與 14,000 美元的 Codex token。表面在搶心智佔有率,更深一層是在搶「真實使用數據」——每一段被工程師接受或拒絕的補全、每一次真實工作流的修正軌跡,都是合成數據再多也買不到的養分。
Anthropic 在 Fable 上把這賭注推到極致:它宣布保留所有使用數據 30 天,連過去承諾「零數據保留」的企業方案也不例外。公司聲稱不會拿來訓練,卻沒設下任何保證未來不這麼做的機制。據 Wired 報導,Thompson 的判斷很直接:如果這政策沒導致大量客戶流失,那麼他們開始動用這些數據「只是時間早晚的問題,因為這些數據對他們的終極目標實在太有價值了」。
這裡藏著一道對 Anthropic 而言是良性的循環飛輪:
- 越多工作流程直接在 Claude 或 Codex 上完成,公司就回收越多真實數據;
- 越多數據餵回訓練,產品就越強、越好用;
- 產品越強,就服務越多工作流程,再反向擴大數據取得——周而復始。
這道「用戶觸點 × 數據回流」交織的飛輪,正是 Anthropic 試圖築起、連微軟都難跨越的數據護城河。它表面是優化體驗,實際是替長期壟斷澆灌地基——恰好與 Nadella 呼籲企業「把數據主權留在自己手裡」的警告,是同一枚硬幣的正反兩面。不過值得一提的是,並非所有人都認同「前沿模型終將淪為廉價商品」的看空論:Forbes 一篇分析 就主張基礎模型不是商品,而是「基底(substrate)」,基底本身就是護城河;那些喧囂的開源下載量與下殺的 API 價格,或許全發生在「不會真正收割價值」的那一層。看多與看空,端看你相信價值最終沉澱在哪——是會被商品化的「能力」,還是難以複製的「基底+觸點+數據」三位一體。
第四幕:系統卡片裡的「隱形降級」
如果數據政策還算檯面上的商業手段,那麼這次發布最令人毛骨悚然的,莫過於系統卡片裡一度埋下的那顆地雷。在最初版本中,Anthropic 設定了一種「隱形降級(Stealth Degradation)」機制:當系統偵測到使用者企圖用 Fable 的數據去訓練競爭性大模型時,它不會跳出「拒絕回答」,而是在完全不告知的情況下,悄悄降低輸出品質。
可怕之處正在於「隱形」。一個誠實的拒絕至少尊重使用者「知道自己被拒絕」的權利;而隱形降級是一種帶欺瞞性質的操控——你以為用的是滿血模型,實際被悄悄餵了次級品,還可能誤以為是自己提示寫得不好。據 Wired 報導,這政策曝光後引發排山倒海的反彈,儘管發布前最後一刻被改為「轉交較舊的 Opus 4.8 並明確告知用戶」,但這個最初構想本身,已徹底暴露了決策層的真實心態:他們打從心底認為,這世上只有自己才有資格駕馭前沿 AI。這種把自身意志凌駕於市場公平與使用者自主之上的態度,幾乎親手坐實了外界對「單一供應商壟斷」最深的擔憂。
「安全」作為一種商業武器
回顧整場風波,一個清晰的圖案浮現:Anthropic 最強大的武器,其實就是它掛在嘴邊的「安全超能力」。強留企業數據、暗中削弱對手、與政府爭奪監管權——每一項單獨拿出來都是極具攻擊性的擴張行為,但它總能把這些完美包裝在「防範超智慧失控、確保人類安全」的旗幟之下。當你的商業利益與道德使命剛好完全重合,你做的每一件「對自己有利」的事,看起來都像在「為全人類負責」。
這不禁讓人想起 Apple:總以「保護用戶隱私」為大旗,名正言順推行對自己最有利的封閉生態。隱私是真的,但它同時也是一把商業武器——兩者從不互斥。Anthropic 的「安全」扮演的正是同一角色,差別在於 Apple 守的是 App Store 的圍牆,Anthropic 守的,可能是未來整個知識經濟的入口。而相較於 OpenAI 在商業化與非營利初衷間不斷撕裂,Anthropic 從上到下對使命的信念呈現出一種令人敬畏(甚至有點不安)的高度統一——這份統一,部分正源自它 PBC 的法律基因與憲法 AI 的技術哲學。
而最危險的,或許正是這份統一背後的「救世主情結」。Anthropic 的高層是真誠地相信,自己是這星球上唯一能拯救人類免於 AI 毀滅的群體。但歷史一再告訴我們:當一群絕頂聰明的菁英深信自己意圖純潔、深信只有自己看得清前方的深淵,他們就能在毫無道德負擔下,做出極度獨裁、甚至威脅整個產業生態的決定——而且每一步都覺得自己在行善。這正是「以安全之名,行統治之實」最弔詭的地方:最危險的壟斷,往往不出於貪婪,而出於一種堅信自己永遠正確的善意。
真正的考驗或許才剛開始。我們需要的不是去否定 Anthropic 對安全的真誠,而是清醒認知到:再崇高的使命,一旦與商業壟斷的誘因完全重合,就必須被放在陽光下接受最嚴格的制衡。因為一個健康的 AI 未來,不該由任何一家公司——無論它多聰明、多真誠——獨自定義。當 Anthropic 站上 IPO 敲鐘台、接受公開市場與監管者更嚴格凝視的那一刻,這場關於「誰來守門、又由誰監督守門人」的辯論,才真正開始。
延伸閱讀
- Ben Thompson, Stratechery:Anthropic's Safety Superpower(本文核心分析來源)
- Fortune:How a warning from Amazon led the White House to shut down Anthropic's Mythos model
- Reuters:Anthropic 完成 Series H、估值飆至 9,650 億美元超車 OpenAI
- Om Malik:Anthropic, AI and The Numbers Problem
- Wired:Claude's Secret Sabotage on AI Research