YouTube影片被OpenAI用來訓練大模型？

威爾斯親王 | 2024-4-8 08:14:38

1樓

人工智慧頭部企業OpenAI可以使用哪些資料來訓練模型，再次引發公開爭論。

　　當地時間4月5日，影片網站YouTube執行長尼爾莫漢（Neal Mohan）在訪談中表示，他並沒有直接證據能夠證明OpenAI確實使用了YouTube的影片來完善其文生影片AI工具Sora，如果真的使用了，那就「明顯違反」了YouTube平台的使用條款。

　　莫漢表示：「從創作者的角度來看，當創作者將他們的辛勤勞動上傳到我們的平台時，他們有一定的期望。其中之一就是符合YouTube的服務條款，不允許下載文字或視頻片段等內容。這（OpenAI使用YouTube視頻）明顯違反了我們的服務條款。”

( 153.94 , 2.00 , 1.32% )

　　近日，《紐約時報》報道，OpenAI和Google涉嫌使用YouTube影片的轉錄文字來訓練其人工智慧模型，這可能侵犯了YouTube創作者的版權。報導稱，OpenAI透過使用其Whisper語音辨識工具，轉錄了超過一百萬小時的YouTube影片內容，並將這些資料用於訓練模型。

　　OpenAI的Sora是一種文生視訊工具，能夠一次產生整個影片或擴展生成的影片以使其更長。和其他生成式AI工具的工作原理一樣，Sora也是從網路上吸收各種內容，並使用這些資料作為產生新內容的基礎，包括影片、照片、敘述文字等。

　　AI的強大功能建立在大量資料訓練的基礎上，隨著OpenAI、Google和其他公司競相開發更強大的AI工具，他們正在尋求越來越多的資料來訓練模型，以產生更好的結果。

　　但這已經引發了人們對資料來源、用途的質疑。在此之前，OpenAI因其訓練模式的內容來源而被《紐約時報》以及一些出版社和作者起訴。

( 425.52 , 7.64 , 1.83% )

　　訴訟稱，被告應對與「非法複製和使用《紐約時報》獨特有價值的作品」相關的「數十億美元的法定和實際損害」負責，還要求其銷毀使用《紐約時報》版權材料的所有AI模型和訓練資料。

　　隨後OpenAI回應稱，《紐約時報》的訴訟毫無根據，但仍希望與其建立建設性的合作關係。

　　此外，根據外媒報道，今年3月，OpenAI技術長Mira Murati在受訪時也曾對Sora的訓練資料來源含糊其辭。

　　當被問到具體來源是否包含YouTube的影片時，Murati回覆“我實際上並不確定”，並拒絕回答有關Instagram或Facebook影片是否被納入訓練集的問題。她辯稱，如果這些影片是公開可用且可使用的，那麼可能會被使用，但她本人對此並不確定。

評分

已有 1 人評分	名聲	金幣	收起理由
S.O.H	+ 6	+ 6	感謝大大分享

總評分: 名聲 + 6 金幣 + 6 查看全部評分

分享 收藏0 分享

免責聲明：本文所載資料僅供參考，本人對該資料或使用該資料所導致的結果概不承擔任何責任.本人已盡告知讀者之義務!，且並無意違反兒童及少年性剝削防制條例第40條所稱『以宣傳品、出版品、廣播、電視、電信、網際網路或其他方法，散布、傳送、刊登或張貼足以引誘、媒介、暗示或其他使兒童或少年有遭受第二條第一項第一款至第三款之虞之訊息』請讀者自重!本文為網路創作，與現實之人事物無關，內容如與現實雷同，純屬巧合!以上純屬夢境，一切都是假的，假如你以為是真的，建議去檢查視力，你眼睛業障太重