你知道 OpenAI 的深度研究工具吧?它可以自動爬梳網路資料,然後針對特定主題生成研究報告,超級方便!不過,這個工具只有 ChatGPT Pro 的使用者才能用,而且每個月要付 200 美元,門檻有點高。所以呢,Hugging Face 的研究團隊,包含他們的共同創辦人兼首席科學家 Thomas Wolf,就想說,不如我們自己來做一個開源的版本,讓更多人都能用到類似的功能。
這個專案叫做 Open Deep Research,核心概念是結合 OpenAI 的 o1 模型和一個開源的 "agentic framework"。這個 framework 就像一個聰明的助手,可以幫 o1 模型規劃分析流程,引導它去使用搜尋引擎之類的工具。雖然 o1 本身是閉源的,需要付費 API 才能使用,但 Hugging Face 團隊覺得,它的效能比像 DeepSeek 的 R1 這些 "開放" 模型來得好。
他們在很短的時間內,不到 24 小時,就成功讓 o1 模型透過一個簡單的文字瀏覽器和 "文字檢查器" 工具包,讀取網路上的檔案。聽起來是不是很酷?這個 Open Deep Research 可以自己瀏覽網頁、滾動頁面、操作檔案,甚至還可以利用資料來做計算。
當然啦,實際效能還是有差距的。在一個叫做 GAIA 的通用 AI 助理基準測試上,Open Deep Research 的得分是 54%,而 OpenAI 的深度研究工具可以拿到 67.36%。不過,考量到 Open Deep Research 是開源的,而且開發時間很短,這樣的表現已經很不錯了。
我也有試著用了一下 Open Deep Research 的公開 demo,不過可能因為太多人用了,所以沒能成功執行。但研究人員說他們會持續改進使用者體驗,而且已經把原始碼放在 GitHub 上了,大家可以去看看,提供一些回饋。
不過,這個專案也面臨一些挑戰。網路上其實已經出現很多 OpenAI 深度研究工具的 "複製品",有些也是用開放模型和工具。但這些複製品,包括 Open Deep Research,都缺少了 o3 模型,而 o3 才是 OpenAI 深度研究工具的核心。在回答複雜問題和資訊收集方面,目前很少有模型能超越 o3。所以,在出現能跟 o3 相媲美的開放模型之前,深度研究工具的替代方案可能還無法完全達到 OpenAI 的水準。
我覺得這個專案很值得關注的地方在於,它反映了開源社群想要挑戰閉源 AI 巨頭的努力。雖然閉源模型在效能上可能更強,但開源模型有透明、可修改、可協作等優勢,可以促進技術創新和普及。Hugging Face 選擇使用 OpenAI 的 o1 模型,而不是完全依賴開源模型,也說明在某些任務中,閉源模型還是有它的優勢。但隨著開源模型的快速發展,說不定未來就會出現能跟 o1 或 o3 相媲美的開源替代方案。
另外,社群的參與真的很重要。Open Deep Research 能發展到現在這樣,跟社群的貢獻是分不開的。透過 GitHub,開發者可以一起檢閱原始碼、提供回饋、改進模型和框架。這種協作模式可以加速技術發展,確保 AI 技術的普及性。
如果 Open Deep Research 能夠持續發展,提升效能,它很可能會改變研究人員、記者和其他專業人士的工作方式。透過自動化的資訊收集和分析,它可以幫助使用者更快速、更有效地完成研究任務,發現新的洞見。
總的來說,Open Deep Research 專案代表了 AI 領域的一個重要趨勢,那就是開源社群正在努力挑戰閉源 AI 巨頭的壟斷地位。雖然目前開源模型在效能上可能還有差距,但隨著技術的快速發展和社群的積極參與,未來開源 AI 有望迎頭趕上,甚至在某些方面超越閉源 AI。Open Deep Research 的發展會如何影響 OpenAI 等公司的策略,以及整個 AI 生態系統的格局,非常值得我們持續關注。