2026 年 2 月 25 日,Cursor CEO Michael Truell 發表了一篇題為 The Third Era of AI Software Development 的文章,短短數天累積超過 562 萬次觀看、兩萬多次收藏。這篇文章的核心論點直截了當:AI 輔助開發正式進入「第三紀元」,開發者不再是寫程式的人,而是管理一整座軟體工廠的人。

這不是一位邊緣人物的預言。Cursor 是當前 AI 輔助開發領域最具影響力的產品之一,其用戶基數和使用數據為 Truell 的論點提供了扎實的實證基礎。當他宣稱 Cursor 內部合併的 PR 中有超過 35% 由雲端自主 Agent 所建立,這個數字代表的不僅是技術展示,更是一個正在運轉的生產系統。

要理解這個宣告為何重要,我們需要回顧整個 AI 輔助開發的演進脈絡,並將其置於更宏觀的產業格局中。

Cursor 的崛起:從新創到產業領航者

要充分理解 Truell 這篇文章的分量,我們需要先認識 Cursor 在產業中的位置。Cursor 由 Anysphere 公司於 2023 年推出,基於 VS Code 打造的 AI 原生程式碼編輯器,在短短不到三年間從一個小眾工具成長為 AI 輔助開發領域的標誌性產品。根據公開報導,Cursor 在 2024 年底的年化經常性收入(ARR)已突破 1 億美元,2025 年更以驚人速度攀升至數億美元級別,估值一路飆升至超過 100 億美元。這樣的成長速度在 SaaS 歷史上極為罕見,反映了市場對 AI 開發工具的狂熱需求。

更值得關注的是 Cursor 的用戶組成。與許多 AI 工具不同,Cursor 的核心用戶群是專業軟體工程師,而非業餘開發者或非技術人員。這意味著 Truell 所描述的使用模式轉變——從 Tab 補全到同步 Agent 再到自主雲端 Agent——是由最挑剔、最有經驗的用戶群體所驗證的。當這群人選擇讓 AI Agent 寫他們幾乎 100% 的程式碼時,這個信號的重要性遠超過任何市場研究報告。

三個紀元的技術演進

Truell 將 AI 輔助開發的演進劃分為三個清晰的階段,每個階段都代表了人機協作模式的根本性轉變。

第一紀元:Tab 補全(2023-2024)

這是多數開發者最早接觸 AI 輔助開發的方式:按下 Tab 鍵,讓 AI 自動完成下一段程式碼。GitHub Copilot 是這個時代的代表產品,Cursor 也從這裡起步。Tab 補全擅長處理低熵、重複性的工作,在將近兩年的時間裡為開發者帶來了顯著的效率提升。

根據 2024 年 Stack Overflow 開發者調查,76% 的開發者正在使用或計畫使用 AI 工具,其中 82% 將 AI 用於寫程式碼,81% 認為提升生產力是 AI 工具最重要的效益。然而,這一階段的 AI 本質上仍是一個「聰明的自動補全」,它理解局部上下文,但缺乏對整體任務的掌控能力。開發者仍然是每一行程式碼的直接生產者,AI 只是加速了輸入的過程。

第二紀元:同步 Agent(2025)

隨著大型語言模型能力的跳躍式提升,AI 從被動的補全工具進化為主動的 Agent。開發者開始透過「提示-回應」的同步對話迴圈來指揮 Agent 完成整個功能的開發。這個轉變的速度出乎所有人預料:Truell 透露,2025 年 3 月時 Tab 用戶數量還是 Agent 用戶的 2.5 倍,但在 Opus 4.6、Codex 5.3 和 Composer 1.5 等新模型密集發布之後,Agent 用戶數已經反超為 Tab 用戶的 2 倍。過去一年間,Cursor 的 Agent 使用量成長了超過 15 倍。更值得注意的是,許多 Cursor 用戶已經完全不再觸碰 Tab 鍵。

這一階段的關鍵差異在於,開發者的角色從「逐字產出程式碼」轉變為「用自然語言描述意圖,由 Agent 執行實作」。但同步 Agent 仍有明顯限制:它需要開發者在每一步保持互動,且多個 Agent 會爭奪本地機器的運算資源,難以真正做到大規模並行。

第三紀元:自主雲端 Agent(2026-)

這是 Truell 所宣告的新時代,也是最具革命性的一步。Agent 不再需要開發者即時指導,而是在雲端的獨立虛擬機上自主運作。每個 Agent 擁有自己的隔離環境,可以花費數小時反覆迭代、建構、測試,直到對輸出結果有足夠信心。開發者收到的不再是一堆 diff(程式碼差異),而是日誌、影片錄製和即時預覽。正如 Truell 所形容:就像審核一個團隊成員的工作成果,而不是逐行檢查程式碼。

Cursor 在同一時期發布的 Cloud Agent 產品具體展示了這個願景。根據其技術部落格,雲端 Agent 可以從網頁、行動裝置、桌面應用、Slack 甚至 GitHub 啟動,自動加入程式碼庫、產出可合併的 PR,並附帶 artifact 供開發者快速驗證。Agent 甚至能操控自己虛擬機上的桌面應用程式,包括瀏覽器、試算表和各種 UI 工具,進行端到端的功能驗證。

軟體工廠:一個比喻的深層含義

Truell 文中最引人深思的比喻是「軟體工廠」。他寫道:「Cursor 不再主要是關於寫程式。它是關於幫助開發者建造一座生產軟體的工廠。」

這個比喻的深層含義值得細究。在工業革命之前,紡織品是由工匠一針一線手工製作的。工廠的出現並沒有消滅紡織這項技藝,但它徹底改變了價值鏈的結構:工廠經理不需要知道如何操作每一台織布機,他需要知道的是如何組織生產流程、配置資源、確保品質。軟體開發正在經歷類似的轉變。

傳統上,軟體開發是一項「手藝」,開發者用鍵盤將想法一行一行地轉化為程式碼。而在第三紀元,開發者的核心職能轉變為四個面向:

  1. 問題分解:將大型任務拆解為可獨立執行的子任務,設定清晰的驗收標準
  2. 並行調度:同時啟動多個 Agent 並行處理不同任務,極大化開發吞吐量
  3. 產出審核:透過日誌、預覽、影片錄製等 artifact 快速評估 Agent 的工作品質
  4. 方向修正:針對不符預期的部分給予精準的修正指示,引導 Agent 迭代改進

Cursor 內部的實踐數據進一步佐證了這個轉變。採用這種新工作方式的開發者展現出三個特徵:Agent 寫了他們幾乎 100% 的程式碼;他們的時間花在問題分解、artifact 審核和回饋指導上;他們同時啟動多個 Agent 並行工作,而非手把手帶一個 Agent 完成任務。

紀元更迭的加速度與歷史模式

值得注意的是紀元更迭的速度正在急遽加快。第一紀元(Tab 補全)持續了將近兩年。第二紀元(同步 Agent)可能連一年都撐不到。Truell 本人也明確指出:「Tab 時代持續了近兩年。第二紀元可能撐不過一年。」

這種加速並非偶然,而是遵循了技術演進的經典模式。每一個紀元都建立在前一個紀元的基礎設施和使用者習慣之上:Tab 補全讓開發者習慣了 AI 的存在;同步 Agent 讓開發者學會了用自然語言描述意圖;而雲端自主 Agent 則要求開發者掌握一套全新的技能組合:如何有效地分解問題、設定驗收標準、以及高效地審核 AI 產出。

從更宏觀的視角來看,這個加速模式與軟體產業過去幾十年的演進軌跡一致。從手寫組合語言到高階語言、從手動部署到 CI/CD、從單體架構到微服務,每一次抽象層級的提升都讓開發者能夠處理更複雜的問題,同時也重新定義了「開發者」這個角色的核心職能。AI Agent 的崛起只是這條演進線的最新延伸,但它的速度和幅度可能超越過往任何一次範式轉移。

數據背後的經濟邏輯

Agent 使用量一年成長 15 倍、Agent 用戶數反超 Tab 用戶 2 倍——這些數字不只是產品指標,它們揭示了一個深層的經濟邏輯。傳統上,軟體開發的產出瓶頸是人力:一個工程師一天能寫多少行有效程式碼、能審核多少個 PR、能同時推進多少條功能線。AI Agent 的根本價值在於打破了這個線性約束。

根據 2024 年 Stack Overflow 開發者調查,62% 的開發者已經在實際使用 AI 工具(較前一年的 44% 大幅增長),76% 正在使用或計畫使用。然而,值得注意的是,調查同時顯示開發者對 AI 工具的好感度從 77% 微降至 72%,43% 的開發者對 AI 輸出的準確性持正面態度,但 31% 仍持懷疑立場。這種「廣泛採用但謹慎評價」的態度,恰恰反映了 AI 輔助開發正處於從實驗階段邁向生產標準的過渡期。

更具經濟意義的是 Agent 對開發團隊結構的潛在影響。如果一個工程師透過管理 Agent 團隊能達到過去 3-5 倍的產出效率,這不只是生產力提升的問題,而是軟體開發成本結構的根本性重組。對新創公司而言,這意味著更小的團隊就能打造更複雜的產品;對大型企業而言,這意味著開發資源可以重新配置到更高價值的架構設計和產品策略工作上。

這也解釋了為什麼 Cursor 的成長如此迅猛。開發者不是因為好奇才使用 Agent,而是因為不使用就會被使用的競爭者拋在後面。這是一個典型的效率驅動採用曲線:一旦早期採用者證明了新工作方式的效率優勢,觀望者面臨的不是「要不要試試看」的問題,而是「能不能承受不採用的成本」。

競爭格局:一場多方角力的 Agent 軍備競賽

Cursor 並不是唯一看到這個趨勢的公司。事實上,整個 AI 開發工具的生態系正在朝著同一個方向快速演進,一場 Agent 軍備競賽已經全面展開。

GitHub Copilot Coding Agent:微軟旗下的 GitHub 於 2025 年 5 月推出了 Copilot Coding Agent 公開預覽版。開發者可以像指派任務給團隊成員一樣,直接將 Issue 指派給 Copilot。Agent 在由 GitHub Actions 驅動的安全雲端開發環境中獨立工作,探索程式碼庫、進行修改、用現有測試和 linter 驗證成果,最後提交 PR 並標記開發者進行審核。這個產品定位精準地瞄準了低到中等複雜度的任務,並且可以同時指派多個 Issue 讓 Agent 並行處理。

Devin:Cognition 推出的「AI 軟體工程師」是這個領域最早引起廣泛關注的產品。Devin 以每月 500 美元的價格對工程團隊開放,不限制席位數。其主要界面是 Slack 整合,開發者可以在 Slack 頻道中直接標記 @devin 指派任務。Devin 在獨立工作完成後會回傳 PR 並主動通知,同時能自動回應 GitHub PR 上的評論。Cognition 公開展示了 Devin 在多個知名開源專案(包括 Anthropic MCP、Zod、Google Go GitHub Client、LlamaIndex 等)上解決 Issue 的實際案例,證明 Agent 已經具備處理真實程式碼庫的能力。

Claude Code:Anthropic 推出的終端命令列 Agent 工具,以深度理解程式碼庫著稱。它採用了不同於 IDE 整合的路線,直接在開發者的終端環境中運作,與現有的 CLI 工具鏈無縫整合。這種設計哲學反映了另一種對 Agent 形態的思考:Agent 不一定要有華麗的 UI,但必須能夠融入開發者既有的工作流程。

Windsurf(前 Codeium)和其他新進者也紛紛加入 Agent 戰場。值得注意的是,OpenAI 的 Codex 模型本身也在這場競賽中扮演雙重角色:既是 Cursor 等產品背後的關鍵基礎模型,也透過 ChatGPT 直接面向終端用戶提供程式碼生成能力。

這場競爭的關鍵戰場,正在從「誰能產出更好的程式碼」轉移到「誰能提供更好的 Agent 基礎設施」。這包括雲端執行環境的穩定性、工具鏈整合的完整性、artifact 預覽機制的易用性、以及多 Agent 協作框架的成熟度。Cursor 的優勢在於其龐大的用戶基數帶來的海量互動數據,使其能夠更快地迭代和優化 Agent 行為。但 GitHub 坐擁全球最大的程式碼庫生態系,Anthropic 和 OpenAI 掌控著底層模型的演進方向,這場競賽的最終格局仍遠未確定。

Cursor 的內部實踐:不只是宣言

讓 Truell 這篇文章特別有說服力的是,它不只是對未來的展望,而是基於 Cursor 團隊自身的真實工作方式。根據 Cursor 技術部落格披露的案例,他們的雲端 Agent 已經被用於多種真實場景:

功能開發:Cursor 使用雲端 Agent 開發了其 Plugin Marketplace 功能。Agent 不僅實作了完整的前後端邏輯,還自行操控瀏覽器導航至 Prisma Plugin 頁面,點擊每個元件驗證 GitHub 連結是否正確。Agent 甚至會暫時繞過 feature flag 進行本地測試,測試完成後自動還原設定,最後 rebase 到 main 分支、解決合併衝突並 squash 成單一 commit。

安全漏洞驗證:團隊透過 Slack 啟動雲端 Agent 來分析一個剪貼簿竊取漏洞。Agent 自主建構了一個完整的攻擊概念驗證頁面,啟動後端伺服器,在 Cursor 內建瀏覽器中載入該頁面,並成功演示了整個攻擊流程。影片 artifact 清楚展示了從複製測試 UUID 到成功竊取剪貼簿內容的完整過程。

UI 測試:一個雲端 Agent 花了 45 分鐘對 cursor.com/docs 進行完整的 UI 走訪測試,涵蓋側邊欄、頂部導航、搜尋功能、複製按鈕、回饋對話框、目錄和主題切換等所有互動元素。

這些案例的意義不在於它們有多複雜,而在於它們展示了 Agent 的「完整性」:不是只寫幾行程式碼然後丟回給人類善後,而是從理解需求、實作功能、自我測試到提交成果的完整閉環。

Agent 操控電腦:自主性的質變

Cursor 在同期發布的技術部落格中揭示了一個更深層的技術突破:Agent 現在擁有操控自己虛擬機桌面的完整能力。這不只是執行命令列指令,而是像人類一樣操作瀏覽器、試算表、UI 介面等桌面應用程式。Cursor 的技術團隊展示了 Agent 在自己的 VM 中導航網頁、操縱試算表工具、解讀數據並做出決策、在複雜 UI 環境中解決問題的完整影片。

這項能力的意義在於,Agent 不再只是一個「程式碼生成器」,而是一個能夠進行端到端驗證的自主工作者。傳統的程式碼生成工具產出 diff 後,開發者必須親自建置、部署、手動測試才能確認結果。雲端 Agent 則可以自行完成整個驗證流程:啟動開發伺服器、在瀏覽器中載入頁面、點擊按鈕驗證功能、截圖或錄影作為證據。這從根本上改變了程式碼審核的模式——從「閱讀 diff 猜測效果」到「觀看影片確認結果」。

值得注意的是,Cursor 將雲端 Agent 的入口擴展到了多個平台:不僅可以從桌面應用啟動,還能從網頁、行動裝置、Slack 甚至 GitHub 直接觸發。這種「隨處啟動」的設計哲學,意味著開發者可以在通勤途中從手機分配任務,到辦公室後直接審核 Agent 的產出。工作不再被綁定在特定的設備或環境上,Agent 成為一個 24/7 運作的遠端團隊成員。

尚未解決的深層挑戰

Truell 在文末坦承,要讓這種工作方式成為軟體開發的標準,還有大量工作要做。他特別點出了兩個核心挑戰,而我認為至少還有四個同等重要但未被充分討論的問題。

環境穩定性:Truell 寫道:「在工業規模下,一個不穩定的測試或損壞的環境,單一開發者可以繞過的問題,會變成中斷每一個 Agent 運行的故障。」這個觀察極為深刻。當組織同時運行數十甚至數百個 Agent,任何基礎設施的不穩定都會被指數級放大。CI/CD 管道、測試環境、依賴管理、資料庫狀態都需要達到遠高於當前的可靠性標準。這意味著 DevOps 和基礎設施工程將成為 Agent 時代的關鍵瓶頸。

工具與上下文的完整性:Agent 需要能夠存取完整的工具鏈和上下文才能有效運作。這包括程式碼庫的全貌、API 文件、設計規格、甚至團隊的 coding convention 和架構決策記錄。目前大多數 Agent 在這方面仍然受限於 context window 的大小和工具整合的完整性。

除了 Truell 明確提到的這兩點,還有幾個同樣關鍵的挑戰:

安全性與權限控管:自主 Agent 擁有對程式碼庫和雲端環境的完整存取權限,這帶來了全新的攻擊面。Agent 是否可能被提示注入攻擊所利用?它們的操作權限如何細粒度控管?當 Agent 可以自主修改程式碼並提交 PR,如何防止惡意或意外的破壞性變更?這些問題在規模化部署時將變得尤為嚴峻。

可解釋性與可審計性:當大量程式碼由 AI 生成,「為什麼這段程式碼是這樣寫的」這個問題變得更難回答。Agent 可以提供 artifact 展示結果,但它的推理過程和設計決策往往是不透明的。在金融、醫療、政府等受監管的領域,這種不透明性可能成為採用的重大障礙。

長期可維護性:Agent 能夠快速產出功能完整的程式碼,但這些程式碼的長期可維護性如何?當未來的 Agent(或人類開發者)需要修改這些程式碼時,是否能理解其設計意圖?技術債的累積速度是否會因為 Agent 的高產出量而加速?根據 Stack Overflow 2024 調查,45% 的專業開發者認為 AI 工具在處理複雜任務時表現不佳,這暗示了 Agent 產出的程式碼品質在面對複雜系統時仍有顯著提升空間。

組織與文化適應:從「寫程式的團隊」轉變為「管理 Agent 的團隊」不只是技術問題,更是深層的組織文化變革。績效評估標準需要重新定義(產出行數還是 Agent 管理效率?),團隊結構需要調整(需要更多 Agent Ops 角色還是更多架構師?),甚至軟體工程的教育體系都需要根本性的反思。

對亞洲科技產業的啟示

雖然 Truell 的文章主要基於矽谷的視角,但第三紀元的影響將迅速擴散至全球科技產業,對亞洲市場尤其值得關注。台灣、日本、韓國等地的科技公司長期面臨工程人才短缺的挑戰,AI Agent 可能成為緩解這一結構性問題的關鍵槓桿。

然而,亞洲科技公司在採用 AI Agent 時面臨獨特的挑戰。首先是語言和文化適配:目前主流的 AI Agent 和底層模型仍以英語為主要訓練語料,在處理中文、日文等語言的程式碼註釋、文件和溝通時,表現往往不如英語場景。其次是組織文化差異:亞洲企業普遍較為層級化的管理結構,可能需要更長時間來適應「管理 Agent 團隊」這種扁平化的新型工作方式。

但反過來看,亞洲科技人才的工程功底和嚴謹的品質意識,在 Agent 時代反而可能成為優勢。當程式碼的「生產」環節被 Agent 接管,「審核」環節的重要性反而大幅提升。那些擅長系統思考、架構設計和品質管控的工程師,將在新時代擁有更高的價值。這也是為什麼台灣半導體產業長期培養的精密工程文化,可能在意想不到的領域——軟體開發的 Agent 管理——找到新的用武之地。

對開發者意味著什麼

Michael Truell 描繪的第三紀元不是一個遙遠的未來。當 Cursor 內部超過三分之一的 PR 由自主 Agent 產出、Agent 用戶數是 Tab 用戶的兩倍、Agent 使用量一年成長 15 倍,這些都不再只是願景,它們是正在重塑軟體開發面貌的趨勢指標。

對開發者而言,這既是機會也是警訊。

機會在於:善用 AI Agent 的開發者將獲得前所未有的生產力槓桿。一個人可以同時推進多個功能、多個專案,處理過去需要整個團隊才能完成的工作量。這將催生新一代的「超級個體開發者」,他們的產出不受自身打字速度或工作時數的限制,而取決於他們分解問題和管理 Agent 的能力。

警訊在於:如果你的核心競爭力只是「寫程式碼」,那麼你的不可替代性正在快速下降。Stack Overflow 調查顯示,雖然 70% 的專業開發者不認為 AI 是對自身工作的威脅,但這個數字在接下來幾年很可能會顯著改變,特別是對那些專注於執行層面而非設計層面的開發者而言。

Cursor 更進一步描繪了下一步的願景:自主駕駛的程式碼庫(self-driving codebases)。在那個世界裡,Agent 不只是寫程式碼和提交 PR,還能管理發布流程、監控生產環境、自動回應線上問題。從開發者使用 Agent 產出 diff,進化到 Agent 端到端交付經過測試的完整功能。

未來的頂尖開發者,是那些能夠精準定義問題、設計系統架構、管理 Agent 團隊、並對 AI 產出進行高品質審核的人。程式碼本身正在成為一種中間產物,重要,但不再是人類最需要親手觸碰的部分。

第三紀元已經到來。問題不是它會不會發生,而是你準備好了沒有。

原文出處:Michael Truell, The Third Era of AI Software Development,2026 年 2 月 25 日。