### AI 崩潰時刻:當人工智慧遇上 NPR 週日謎題,開始懷疑人生?
近期AI模型在解決複雜數學或科學問題上表現亮眼,但這些能力對一般使用者來說可能有些遙遠。最近一項有趣的研究,嘗試用更貼近日常生活的謎題來評估AI模型的「推理」能力,這或許能讓我們更了解AI的真實能耐。
這項研究使用美國國家公共廣播電台 (NPR) 的 "Sunday Puzzle" 作為基準。"Sunday Puzzle" 的獨特之處在於,它考驗的是邏輯思維和常識,而非專業知識。Northeastern 大學的 computer