2月18日,頭部大模型創業公司階躍星辰宣佈開源了文生視頻模型Step-Video-T2V,Gitee AI 第一時間上線了該模型的在線體驗。
Serverless API 頁面現也已新增視頻生成分類及Step-Video-T2V模型入口:
輸入 Prompt 後稍等片刻即可獲得生成的視頻,視頻支持下載至本地:
話不多説,直接看看效果:
Prompt:幾隻巨大的長毛猛獁象穿過一片白雪覆蓋的草地,它們長長的毛茸茸的皮毛在風中輕拂,遠處是白雪覆蓋的樹木和的雪山,午後的光線與縷縷的雲和遠處的太陽創造了温暖的光芒。
Prompt:一個20多歲的年輕人坐在天空的一片雲上讀書。
Prompt:火車在城市郊區行駛,站在車內能看到車窗上的倒影。
你還有什麼創意?現在就去 Gitee AI 試試看吧!
Step-Video-T2V:性能領跑全球開源視頻生成大模型
據階躍星辰公佈的數據,Step-Video-T2V模型的參數量達到 300 億,可以直接生成 204 幀 540P 分辨率的高質量視頻。這意味着生成的視頻內容具有極高的信息密度和強大的一致性。
為了對開源視頻生成模型的性能進行全面評測,階躍發佈並開源了針對文生視頻質量評測的新基準數據集Step-Video-T2V-Eval。
該測試集包含 128 條源於真實用户的中文評測問題,旨在評估生成視頻在運動、風景、動物、組合概念、超現實、人物、3D 動畫、電影攝影等 11 個內容類別上質量。
測評結果顯示,Step-Video-T2V的模型性能在指令遵循、運動平滑性、物理合理性、美感度等方面的表現均顯著超過市面上既有的效果最佳的開源視頻模型。
在生成效果上,Step-Video-T2V 在複雜運動、美感人物、視覺想象力、基礎文字生成、原生中英雙語輸入和鏡頭語言等方面具備強大的生成能力,且語義理解和指令遵循能力突出,能夠高效助力視頻創作者實現精準創意呈現。