### 新創公司 Composo 如何協助企業監控 AI 應用程式的效能?
隨著企業對大型語言模型 (LLM) 驅動的應用程式依賴日漸加深,如何確保這些應用程式的準確性和可靠性成為關鍵。Composo 這家新創公司應運而生,旨在幫助企業監控其 AI 應用程式的效能。他們提供客製化模型和無程式碼/API 雙重方案,為企業評估和改善 AI 應用程式效能提供了一種獨特的解決方案。
Composo 的核心技術在於其客製化模型,這些模型專門用於評估 LLM 驅動的應用程式的準確性和品質。目前市場上也有其他公司提供類似服務,像是 Agenta, Freeplay, Humanloop 和 LangSmith,但 Composo 的獨特之處在於同時提供無程式碼選項和 API。這代表不僅開發人員可以使用,領域專家和高管也能夠評估 AI 應用程式的一致性、品質和準確性。
Composo 結合了基於人類偏好輸出的獎勵模型,以及特定於應用程式的標準,創建了一個系統,可以根據這些標準來評估應用程式的輸出。舉例來說,針對醫療分診聊天機器人,可以設定檢查危險症狀的客製化指南,而 Composo 就能夠評估該應用程式執行此操作的一致性。
Composo 的市場策略似乎頗有成效,目前已擁有埃森哲 (Accenture)、Palantir 和麥肯錫 (McKinsey) 等客戶。近期,Composo 獲得了 200 萬美元的種子前融資。雖然這筆金額在當今的風險投資環境中並不算多,但考量到目前 AI 領域的投資熱潮,這筆資金相對較少。Composo 的共同創辦人兼執行長 Sebastian Fox 表示,這是因為該公司的發展模式並非資本密集型。
Fox 認為,Composo 的獨特賣點並不在於構建基礎模型,而是專注於如何有效地利用現有的基礎模型。他甚至表示,如果 OpenAI 的模型取得重大進展,對 Composo 的業務來說反而是好事。
Twin Path Ventures 的一位發言人表示,Composo 正在解決企業採用 AI 的一個關鍵瓶頸。Fox 也指出,現在大家已經度過了對 AI 的過度興奮期,開始思考 AI 是否真的能為業務帶來改變。由於 AI 的可靠性和一致性不足,企業難以證明 AI 的價值。Composo 的目標是解決這個瓶頸,讓企業能夠更安全地實施 AI,並降低聲譽風險。這也是為什麼 Composo 選擇不限特定產業,但同時在合規、法律、醫療保健和安全等領域保持影響力。
Fox 認為,Composo 的競爭優勢在於其研發投入和數據積累。Composo Align 模型是在「大量專家評估數據集」上訓練的。此外,Composo 還具有先發優勢,並隨著時間的推移累積了評估偏好數據。由於 Composo 可以根據一套靈活的標準評估應用程式,因此他們也認為自己比那些採用更受限方法的競爭對手更適合代理式 AI 的發展。 Fox 認為,現在代理式 AI 的發展還不成熟,而這正是 Composo 試圖解決的問題。
**前瞻觀點與討論**
Composo 的出現,確實解決了企業導入 AI 的痛點,但未來仍面臨許多挑戰與機會:
* **大型科技公司是否會利用其雄厚的財力進入 AI 應用監控市場?** Composo 如何保持競爭力? 這取決於 Composo 能否持續創新,並建立更深厚的技術壁壘,例如更精準的評估模型,或更廣泛的應用場景。
* **Composo 如何應對 AI 領域快速變化的技術?** AI 技術日新月異,Composo 需要不斷更新其模型和方法,才能跟上技術發展的步伐。
* **Composo 的無程式碼方案在多大程度上能夠吸引非技術用戶?** 無程式碼方案的易用性和功能性,將直接影響其市場接受度。
* **Composo 如何確保其評估模型的公正性和準確性,避免偏見和錯誤?** 這是一個重要的倫理議題,Composo 需要建立完善的機制,確保其評估結果的客觀性。
總體而言,Composo 在 AI 應用監控領域具有相當的潛力,但能否在激烈的市場競爭中脫穎而出,仍有待觀察。
原始連結:https://techcrunch.com/2025/02/07/composo-helps-enterprises-monitor-how-well-ai-apps-work/