Meta AI訓練大冒險:是「求原諒」還是「求授權」?
Meta在AI模型訓練上,最近被爆出一些內部討論,內容顯示他們對於版權內容的使用方式,曾經有過具爭議性的考量,這件事情燒出了AI倫理的爭議,也讓大家看到,科技巨頭在追求技術領先的同時,要如何在創新和法律規範之間取得平衡,真的是一門很深的學問。
這件事的核心,就是Meta是不是不當使用了受版權保護的資料來訓練他們的AI模型,特別是Llama系列。根據訴訟文件顯示,Meta員工曾經討論購買電子書來建立訓練集,而不是跟出版社談授權。其中,Xavier Martinet甚至說,搞不好很多新創公司都已經在用盜版書訓練模型了,暗示Meta應該更積極一點(或者說更大膽一點)。這段話其實反映出,在AI競賽中,Meta內部對於快速取得大量訓練資料的焦慮感。
Xavier