Google近日推出一種名為「Lumiere」的全新人工智慧影片模型,該模型擁有創造出連貫、流暢且真實動作的能力,並能在完整影片片段中展現出來。這種創新技術與現有的AI影片模型有顯著不同,Lumiere不是將各個單獨的畫面組合在一起,而是透過同時處理物體的位置和其動作,一次性地創建整部影片。
這項技術以時空架構為基礎,考量了所有的動作和位置相關方面。在生成過程中,Lumiere會檢視物體該被放置在何處,以及何時以及如何進行動作,確保影片的「空間」和「時間」元素都能得到妥善處理。這種一次性處理兩個方面的方式,使得Lumiere能創造出更連貫的動作。
Lumiere的功能不僅止於此,它還能跨越文字到影片和圖像到影片,從參考圖像提供有風格的生成,以確實調整影片中元素的外觀。Google研究團隊表示,Lumiere實現了「最先進的文字到影片生成結果」,「有助於廣泛的內容創建工作和影片編輯應用。」此外,Lumiere也具備動畫化圖像特定區域的能力,並能提供如改變衣物風格或影像中特定動物種類的插畫(inpainting)能力。然而,這僅僅是一項研究計劃,目前並無法親自體驗。
Google過去也推出過其他AI影片工具,例如Imagen版本的影像模式,該模式在Google雲端中提供AI圖像生成,並且VideoPoet是一個用於零拍攝影片生成的大型語言模型。Video Poet還能在不需要文字指導的情況下,從影片片段創建音頻。
◤2024年末運勢解析◢