以安全之名，行統治之實：Anthropic 的 AI 救世主養成記

2026 年的前沿 AI 實驗室都活在同一個悖論裡：模型能力以肉眼可見的速度推進，但每款燒掉數百億美元煉成的旗艦，往往在發布幾個月內就被開源社群蒸餾、複製，淪為廉價商品。就在這個拐點上，Anthropic 在六月初的一連串動作，把「安全」、「壟斷」與「商業生存」的辯論，一舉推上了風口浪尖。

導火線是新模型 Fable（Fable 5）——兩個月前那款被官方形容為「太危險、不適合公開釋出」的 Mythos 的安全降級版。Ben Thompson 在 Stratechery 上坦言它驚艷到「讓 GPT-5.5 和自家 Opus 4.8 都顯得渺小而愚笨」，研判這是一次全新預訓練的產物。但真正值得玩味的，從來不是模型有多強，而是它發布後幾天內引爆的連鎖反應：越獄、政府出口管制、微軟執行長公開示警，以及系統卡片裡那條「隱形降級」霸王條款。

Anthropic 的行為其實相當容易理解；讓這家公司與眾不同的，是它「如何替自己的行為辯護」——而正是這些辯護，既給了憤世嫉俗者攻擊的彈藥，也給了 Anthropic 它的魔力。

先理解這家公司：從 OpenAI 出走的安全派

Anthropic 成立於 2021 年，由 Dario 與 Daniela Amodei 兄妹率 11 名 OpenAI 前核心員工出走創立。Dario 離開前是 OpenAI 研發副總裁，主導過 GPT-2、GPT-3；出走的根本原因，是認為 OpenAI 在微軟巨資與急速商業化下，稀釋了對 AI 生存風險的重視。

關鍵在於，它從第一天就註冊為「公共利益公司（PBC）」——這個法律身分要求公司在股東利益與公共利益之間取得平衡。換句話說，「安全」不只是行銷話術，而是寫進治理章程的法律承諾。技術上，它用「憲法 AI」與「從 AI 回饋強化學習（RLAIF）」取代 OpenAI 仰賴人類標記員的 RLHF，再加上機制可解釋性研究。這些共同構築了 Anthropic「我們最懂安全」的話語權——也是理解後續一切爭議的鑰匙：每當它做出看似霸道的決定，永遠能在「使命」的高度上自圓其說。

第一幕：越獄、國安危機與政企角力

Fable 上線沒多久，「越獄」這齣老戲碼就上演了——任何公開模型的護欄都有被繞過的一天。但這次後果空前嚴重：據 Anthropic 部落格，美國政府援引國安授權發布出口管制指令，要求暫停「任何外國國籍人士」存取 Fable 5 與 Mythos 5，連 Anthropic 自家外籍員工都不例外。其淨效果，是公司必須立刻對所有客戶關閉這兩款模型。

Anthropic 反彈激烈，強調所謂越獄只能挖出「少數早已為人所知、相對輕微的漏洞」，是政府在「對邊緣漏洞小題大作」。而最耐人尋味的線索是：據 Fortune 與 The Information 報導，把這份「越獄示範」捅上白宮的，正是 Amazon——Anthropic 最大的金主之一。這層關係微妙到近乎荒謬，因為 Amazon 在牌局裡同時扮演三種矛盾角色：累計數十億美元的最大股東、Claude 賴以運行的雲端算力供應商（AWS Bedrock），如今卻又成了把盟友旗艦送進封殺名單的「通報者」。當算力帳單與潛在競爭威脅擺在同一張資產負債表上，「安全疑慮」四個字究竟有幾分公益、幾分算計，外界恐怕永遠無從分辨。

這也不是 Anthropic 第一次與政府對撞。2026 年初它就曾槓上五角大廈：面對要求無限制軍事部署的壓力，創辦團隊劃下兩條紅線——不得用於國內大規模監控、不得用於無人類介入的全自主武器。即便只有 3 天期限、可能被《國防生產法》施壓，它仍選擇承擔商業代價堅持原則，結果讓 OpenAI 趁勢搶走部分國防合約。Dario 當時的金句是：「與政府持不同意見，是世界上最美國化的一件事。」

為什麼這場衝突注定發生

有人質疑 Mythos 真有強到值得政府大動干戈嗎？Thompson 認為這沒抓到重點：就算這一代不夠危險，下一代就會是了——尤其當模型已越來越能參與「煉成自己的後繼者」。前沿能力是指數級成長，監管者要面對的不是當下這一刻，而是一條不斷加速向上的曲線。真正的分歧因此浮現：究竟誰有資格定義「一個模型是否安全」？是把安全當核心信仰的實驗室，還是握有國安授權的政府？而這種「一刀切」的封殺，會不會成為 AI 發展的新常態？這是一個仍無答案、卻足以重塑產業格局的巨大問號。

第二幕：開源夾擊下的經濟必然性

要理解 Anthropic 為何此刻如此激進，得先看懂它的經濟困局。AI 發展至今，最大的價值其實流向「算力」——真正賺到大錢的是 Nvidia、台積電與記憶體廠；Anthropic 與 OpenAI 加總卻已燒掉數百億美元累積虧損。算力才是這場淘金熱裡賣鏟子的人。

這就是前沿實驗室的「看空論」：差異化太短命，免費替代品卻不斷「夠用就好」。一個領先模型一旦釋出，立刻被蒸餾、商品化，而最兇猛的力量來自中國開源模型。2026 年這股壓力尤其真實：隨著 DeepSeek V4、Qwen 3.6 與月之暗面 Kimi K2.6 陸續釋出，開源陣營的「代理（agentic）」性能已逼近前沿水準，而且免費、可商用、能部署在私有環境，對在意資料主權的企業極具吸引力。當頂尖能力收斂、價格被一路下殺，那些上百億美元的算力投資根本無從回收——這已不是面子問題，而是赤裸裸的生死問題。

插曲：估值狂飆下的循環融資疑雲

這場焦慮還有一個被資本市場放大的維度。Anthropic 的估值在 2026 年走出陡峭曲線：2 月才以 3,800 億美元投後估值完成 300 億美元的 G 輪；三個月後的 5 月 28 日，據路透社，它又完成 650 億美元的 Series H，估值飆到 9,650 億美元，首度超車 OpenAI、逼近兆美元。官方同日揭露的年化營收（run-rate）已逼近 470 億美元，較 1 月的約 90 億暴增約五倍，主要由 Claude Code 訂閱、Cowork 企業方案與開發者 API 驅動；公司並於 6 月 1 日向 SEC 機密遞交 S-1，由高盛與摩根大通領銜承銷，瞄準秋季掛牌，預計迎來首個獲利季度。

但投資人 Om Malik 在《Anthropic, AI and The Numbers Problem》提出尖銳質疑：在 S-1 財報細節經 SEC 審計公開前，外界根本無從驗證這些 run-rate 的含金量；更值得警惕的是濃厚的「循環融資」氣味——雲端巨頭一手投資 Anthropic，另一手收取它鉅額算力費用、並轉售 Claude API 計入自家 AI 營收。這種「資金繞一圈、彼此互相做大帳面」的模式，曾在 2000 年寬頻泡沫的 Lucent 與 Nortel 身上以悲劇收場。當估值被吹到逼近兆美元，維持「下一季數字依然漂亮」的壓力，就會反過來逼公司在數據與壟斷上做出更具侵略性的選擇——一家準備 IPO、要對公開市場負責的公司，往往更沒有「不作惡」的奢侈。

唯一的出路：搶佔用戶觸點

如果模型終將商品化，價值會流向哪裡？Thompson 的答案是：當算力供給最終充足，最值錢的位置會回歸到「自古以來就最值錢」的地方——擁有用戶觸點。誰掌握使用者每天打開、用來完成所有工作的那塊「畫布」，誰就握有真正的鎖定效應。其必然結論，是前沿實驗室與軟體公司正走在碰撞軌道上：因為掌握觸點的正是軟體，而實驗室的長期利益不是甘於當軟體的廉價輸入零件，而是直接取代軟體本身。Anthropic 強推 Claude Code 與 Cowork、OpenAI 強推 Codex，本質上都是繞過中間商、直接掌控入口。它早在創立初期就刻意避開消費端流量陷阱、深耕 B2B 與開發者市場，如今這正轉化為它在觸點爭奪戰裡最堅實的灘頭堡。

微軟的反擊：Nadella 的「代幣資本」論

這個舉動踩到了傳統軟體巨頭的底線。微軟執行長 Satya Nadella 在 X 上發表長文，先拋出一記重磅警告：

我們最不樂見的，是一個「每個產業裡的每家公司，都把價值拱手讓給少數幾個吞噬一切的模型」的世界。一個掏空整個產業的 AI 未來，是不會獲得社會許可（societal permission）的。

接著他提出三個概念：人類資本、代幣資本與認知迴圈。人類資本是員工的知識、判斷、人脈與模式辨識；代幣資本則是公司自己「打造並擁有」的 AI 能力。他主張人類資本不會因代幣資本成長而貶值，反而會更值錢，因為「沒有人類的方向引導，算力只會原地空轉」。真正的機會不在「挑選最好的模型」，而在「在模型之上建立學習迴圈」，讓企業能抽換掉一個通用模型，卻不流失系統裡累積的『公司老兵』專業知識。說白了，這是微軟對企業喊話：把專有數據、工作流程與判斷力資產化，建立私有評測與強化學習環境，別免費把珍貴養分餵給 Anthropic 或 OpenAI，最後反被它們商品化、回頭吞噬。

這是警告，還是預言？

Thompson 對 Nadella 的類比給了冷峻反駁。Nadella 把這比作全球化第一階段——工業經濟被外包掏空，GDP 好看但位移後果至今仍在發酵。Thompson 一針見血：那場全球化「真的發生了」，工業經濟也「真的被掏空了」。所以這或許根本不是警告，而是預言。微軟之所以大聲疾呼，正因它自己可能就是受害者；而模型製造商的「經濟必然性」，恰恰就是要去完成 Nadella 最害怕的那件事。雙方立場從一開始就注定無法調和——這場觸點保衛戰，沒有中間地帶。

第三幕：數據護城河與 30 天保留條款

模型要持續變強，光有算力不夠，更需要「更多、更好的數據」。當前進步越來越仰賴強化學習，而最強大的槓桿永遠是真實世界的使用數據。這也解釋了補貼訂閱的邏輯：SemiAnalysis 估算，一份 200 美元的方案能換到約 8,000 美元的 Claude token 與 14,000 美元的 Codex token。表面在搶心智佔有率，更深一層是在搶「真實使用數據」——每一段被工程師接受或拒絕的補全、每一次真實工作流的修正軌跡，都是合成數據再多也買不到的養分。

Anthropic 在 Fable 上把這賭注推到極致：它宣布保留所有使用數據 30 天，連過去承諾「零數據保留」的企業方案也不例外。公司聲稱不會拿來訓練，卻沒設下任何保證未來不這麼做的機制。據 Wired 報導，Thompson 的判斷很直接：如果這政策沒導致大量客戶流失，那麼他們開始動用這些數據「只是時間早晚的問題，因為這些數據對他們的終極目標實在太有價值了」。

這裡藏著一道對 Anthropic 而言是良性的循環飛輪：

越多工作流程直接在 Claude 或 Codex 上完成，公司就回收越多真實數據；
越多數據餵回訓練，產品就越強、越好用；
產品越強，就服務越多工作流程，再反向擴大數據取得——周而復始。

這道「用戶觸點 × 數據回流」交織的飛輪，正是 Anthropic 試圖築起、連微軟都難跨越的數據護城河。它表面是優化體驗，實際是替長期壟斷澆灌地基——恰好與 Nadella 呼籲企業「把數據主權留在自己手裡」的警告，是同一枚硬幣的正反兩面。不過值得一提的是，並非所有人都認同「前沿模型終將淪為廉價商品」的看空論：Forbes 一篇分析就主張基礎模型不是商品，而是「基底（substrate）」，基底本身就是護城河；那些喧囂的開源下載量與下殺的 API 價格，或許全發生在「不會真正收割價值」的那一層。看多與看空，端看你相信價值最終沉澱在哪——是會被商品化的「能力」，還是難以複製的「基底＋觸點＋數據」三位一體。

第四幕：系統卡片裡的「隱形降級」

如果數據政策還算檯面上的商業手段，那麼這次發布最令人毛骨悚然的，莫過於系統卡片裡一度埋下的那顆地雷。在最初版本中，Anthropic 設定了一種「隱形降級（Stealth Degradation）」機制：當系統偵測到使用者企圖用 Fable 的數據去訓練競爭性大模型時，它不會跳出「拒絕回答」，而是在完全不告知的情況下，悄悄降低輸出品質。

可怕之處正在於「隱形」。一個誠實的拒絕至少尊重使用者「知道自己被拒絕」的權利；而隱形降級是一種帶欺瞞性質的操控——你以為用的是滿血模型，實際被悄悄餵了次級品，還可能誤以為是自己提示寫得不好。據 Wired 報導，這政策曝光後引發排山倒海的反彈，儘管發布前最後一刻被改為「轉交較舊的 Opus 4.8 並明確告知用戶」，但這個最初構想本身，已徹底暴露了決策層的真實心態：他們打從心底認為，這世上只有自己才有資格駕馭前沿 AI。這種把自身意志凌駕於市場公平與使用者自主之上的態度，幾乎親手坐實了外界對「單一供應商壟斷」最深的擔憂。

「安全」作為一種商業武器

回顧整場風波，一個清晰的圖案浮現：Anthropic 最強大的武器，其實就是它掛在嘴邊的「安全超能力」。強留企業數據、暗中削弱對手、與政府爭奪監管權——每一項單獨拿出來都是極具攻擊性的擴張行為，但它總能把這些完美包裝在「防範超智慧失控、確保人類安全」的旗幟之下。當你的商業利益與道德使命剛好完全重合，你做的每一件「對自己有利」的事，看起來都像在「為全人類負責」。

這不禁讓人想起 Apple：總以「保護用戶隱私」為大旗，名正言順推行對自己最有利的封閉生態。隱私是真的，但它同時也是一把商業武器——兩者從不互斥。Anthropic 的「安全」扮演的正是同一角色，差別在於 Apple 守的是 App Store 的圍牆，Anthropic 守的，可能是未來整個知識經濟的入口。而相較於 OpenAI 在商業化與非營利初衷間不斷撕裂，Anthropic 從上到下對使命的信念呈現出一種令人敬畏（甚至有點不安）的高度統一——這份統一，部分正源自它 PBC 的法律基因與憲法 AI 的技術哲學。

而最危險的，或許正是這份統一背後的「救世主情結」。Anthropic 的高層是真誠地相信，自己是這星球上唯一能拯救人類免於 AI 毀滅的群體。但歷史一再告訴我們：當一群絕頂聰明的菁英深信自己意圖純潔、深信只有自己看得清前方的深淵，他們就能在毫無道德負擔下，做出極度獨裁、甚至威脅整個產業生態的決定——而且每一步都覺得自己在行善。這正是「以安全之名，行統治之實」最弔詭的地方：最危險的壟斷，往往不出於貪婪，而出於一種堅信自己永遠正確的善意。

真正的考驗或許才剛開始。我們需要的不是去否定 Anthropic 對安全的真誠，而是清醒認知到：再崇高的使命，一旦與商業壟斷的誘因完全重合，就必須被放在陽光下接受最嚴格的制衡。因為一個健康的 AI 未來，不該由任何一家公司——無論它多聰明、多真誠——獨自定義。當 Anthropic 站上 IPO 敲鐘台、接受公開市場與監管者更嚴格凝視的那一刻，這場關於「誰來守門、又由誰監督守門人」的辯論，才真正開始。