近日,阿里巴巴旗下的通義萬相技術平臺宣布了一項重大開源進展,推出了一項名為“首尾幀生視頻14B模型”的前沿視頻生成技術。
這項AI技術的核心在于,它可以根據(jù)用戶提供的起始幀和結束幀畫面,自動生成一段720p高清分辨率的過渡視頻。這一創(chuàng)新為視頻創(chuàng)作者開辟了新的創(chuàng)作路徑。
該模型背后依托的是一套復雜的深度學習算法,它能夠深入解析用戶提供的畫面內(nèi)容、風格以及主題元素。一旦用戶上傳了首尾兩幀圖像,模型便會細致分析畫面中的各類視覺細節(jié),如物體的形狀、色彩搭配以及光影效果,進而推理并生成最為合理的中間過渡幀。
通過這種方式生成的視頻,不僅保持了物體運動軌跡的自然流暢,還實現(xiàn)了光線和色彩的平滑過渡,最終呈現(xiàn)出一個邏輯嚴密、視覺連貫的高質量視頻作品。
值得注意的是,通義萬相已經(jīng)將此技術全面開放給公眾。用戶可以通過訪問通義萬相的官方網(wǎng)站直接體驗這項服務,同時也可以通過GitHub、Hugging Face或魔搭社區(qū)獲取開源代碼,便于本地部署和進一步的二次開發(fā)。
這一技術的推出,尤其對于需要精細控制過渡效果的視頻創(chuàng)作領域,如延時攝影、特效轉換等,提供了更為高效且可控的解決方案。內(nèi)容創(chuàng)作者現(xiàn)在可以利用這一技術,以更少的時間和精力,實現(xiàn)更加復雜的視頻創(chuàng)作需求。