威爾斯親王
|
2024-2-19 07:30:55
|
Sora影片的品質令人驚嘆,但目前,它們除了作為展示AI潛力的範例作用外,實用落地價值仍待觀察。
2月18日,由OpenAI 發布的文生視訊AI工具Sora引發的討論仍在繼續,範圍涉及科技圈、資本圈、影視圈等,同時對Sora尚存在的問題研究也逐漸深入。
例如針對OpenAI定位「世界模擬器」的觀點,圖靈獎得主、Meta首席AI科學家楊立昆(YannLeCun)表示,根據提示詞生成的大部分逼真視頻並不表明這樣的AI系統理解物理世界,生成視頻的過程與基於世界模型的因果預測完全不同。
翻閱OpenAI披露的數十份視頻,楊立昆的觀點具體表現為老奶奶吹蠟燭火苗卻不動、東京街頭步伐錯誤的女郎、玻璃杯碎後錯誤的液體流向、在跑步機上反向跑步的男子等。
雖然OpenAI的明星效應為其帶來大量關注,同日谷歌(141.76, -2.18, -1.51%)發布的多模態通用模型Gemini 1.5 Pro也變為配角,但不論是美國矽谷AI項目還是中國大模型新創公司,外界關注的核心均為實際應用效果。
影片雖驚艷bug仍存在
目前,Sora所產生的影片內容已獲得影視產業人士的普遍認可。Mystery Novel視覺預演工作室創辦人、導演牛萌琛對第一財經記者表示,Sora影片中的畫質,畫面內容中的細節、光影、色彩都較精細,對導演來說,為其在拍攝前期做一個簡單的鏡頭樣板是夠用的。對廣告片拍攝來說,也可以用這種樣板來與客戶更好地進行概念上的溝通和確認。但如果涉及鏡頭運動角度,與更精細內容調控──如色彩、光影、道具、人物動作等,目前AI還無法達到令客戶滿意的程度。
一位紀錄片從業人員對記者表示,目前Sora還不能直接用於影視作品,因為精細度還不夠。但已經夠震撼,完全可以用於前期開發,尤其是概念設計。一位宣傳片從業人員表示,工作室目前還沒試過用AI生成來做素材,Sora 只發布了部分作品,且未開放公測,能不能用來代替剪輯不確定。無論如何,這些工具最後都是為人服務的,人的個人感情複雜性的表達不可取代。
攝影專業人士孟凡對記者表示,Sora影片幀率較高,顯示運算能力比較強,且影片的寬容度更高,如調色、細節表現、高速鏡頭展現等。在直覺感受上,Sora 模型產出的視訊運鏡自然,物體運動符合規律,鏡頭間邏輯一致性好,但是Sora影片的邏輯性會差一點。
具體表現在Sora影片內容中,如一分鐘的東京街頭女郎漫步,女郎走路過程中存在腿部變形、腿部交叉換位時錯亂、右腿連續兩次在前方邁步等錯誤;一段提示詞為「一個人跑步的場景」中,主角在跑步機上反向奔跑;提示詞為「考古學家在沙漠發現塑膠椅」的影片中,椅子呈現懸浮狀態。
針對目前Sora存在的不成熟之處,OpenAI表示,Sora可能難以準確模擬複雜場景的物理原理,可能無法理解因果關係,可能混淆提示的空間細節,可能難以精確描述隨著時間推移發生的事件,如遵循特定的相機軌跡等。
OpenAI方面在《作為世界模擬器的視訊生成模型》技術報告中表示,Sora作為一個模擬器,目前表現出許多限制,它並沒有準確地模擬許多基本互動的物理效應,例如玻璃破碎。吃食物之類的互動並不總是產生正確的物體狀態變化。還有在長時間樣本中發展的不連貫性或物體的自發性出現。
對於這些問題,多位人工智慧領域人士對記者表示,皆因機率模式的邏輯硬傷所致。中科深智創辦人兼CEO成維忠表示,Sora因其並非嚴格的推理模型,目前還存在因果關係推理問題,但這個問題不是Sora自身的問題,而是目前所有類似模型均存在的問題,類似大模型普遍存在的幻覺問題。未來會隨著訓練的加強而改善。 |
評分
-
總評分: 名聲 + 6
金幣 + 6
查看全部評分
|
免責聲明:本文所載資料僅供參考,本人對該資料或使用該資料所導致的結果概不承擔任何責任.本人已盡告知讀者之義務!,且並無意違反兒童及少年性剝削防制條例第40條所稱『以宣傳品、出版品、廣播、電視、電信、網際網路或其他方法,散布、傳送、刊登或張貼足以引誘、媒介、暗示或其他使兒童或少年有遭受第二條第一項第一款至第三款之虞之訊息』請讀者自重!本文為網路創作,與現實之人事物無關,內容如與現實雷同,純屬巧合!以上純屬夢境,一切都是假的,假如你以為是真的,建議去檢查視力,你眼睛業障太重