潞晨科技近日震撼發(fā)布其Open-Sora 2.0版本,標志著視頻生成技術(shù)領(lǐng)域的重大突破。此次發(fā)布不僅包括了模型的全面開源,還涵蓋了模型權(quán)重、推理代碼以及分布式訓(xùn)練的全流程細節(jié)。
Open-Sora 2.0作為一款最新開源的視頻生成模型,以驚人的效率僅使用224張GPU和20萬美元的成本,便成功訓(xùn)練出具備商業(yè)級水準的110億參數(shù)大模型。據(jù)官方介紹,該模型在性能上已逼近業(yè)界知名的HunyuanVideo,甚至與300億參數(shù)的Step-Video相比也毫不遜色。
尤為根據(jù)視頻生成領(lǐng)域的權(quán)威評測榜單VBench的最新結(jié)果,Open-Sora自1.2版本升級至2.0后,與OpenAI的Sora閉源模型之間的性能差距實現(xiàn)了質(zhì)的飛躍。從原先的4.52%的差距大幅縮減至如今的0.69%,幾乎達到了性能上的全面對齊。
這一顯著的性能提升,無疑為視頻生成技術(shù)的應(yīng)用打開了更為廣闊的空間。無論是影視制作、動畫制作還是虛擬現(xiàn)實等領(lǐng)域,Open-Sora 2.0都將以其高效、強大的生成能力,成為推動行業(yè)發(fā)展的重要力量。