Stories

Detail Return Return

魔多 AI 支持 Wan 系列在線訓練 :解鎖視頻生成新高度 - Stories Detail

圖片
Wan

阿里巴巴通義實驗室推出的 Wan 系列模型憑藉突破性的技術架構與卓越的生成能力,成為行業關注的焦點。為助力開發者與創作者深挖視頻生成技術潛力,魔多 AI 社區正式宣佈全面支持通義萬相 Wan2.1 與 Wan2.2 兩款重磅視頻模型的訓練服務,為不同場景的創作需求提供專業級技術支撐。

Wan2.1&Wan2.2

圖片
Wan2.1

Wan2.1 採用自研高效變分自編碼器(VAE)與擴散時間變換器(DiT)的組合架構,創新性引入視頻分塊(Chunk)緩存機制,取代傳統長視頻端到端編解碼模式,使顯存佔用與視頻長度解耦,為無限長 1080P 視頻的高效處理提供可能。DiT 架構中的時空全注意機制與參數共享策略,在精準捕捉複雜動態的同時,有效降低訓練成本與計算需求,提升文本指令的理解精度。

Wan2.1 支持中文文字生成能力的視頻模型,同時兼容中英文文字特效生成,視覺文字準確率達 92%。在動態模擬方面,模型突破傳統視頻生成的肢體扭曲問題,能穩定展現花樣滑冰、跳水等複雜肢體運動,同時精準還原碰撞、反彈、流體流動等物理規律,雨滴濺落、物體切割等場景的真實感顯著提升。在 VBench 基準測試中,其運動生成與視頻準確度得分達 84.7%,彰顯技術領先性。

圖片
Wan 2.2

繼 Wan2.1 奠定基礎後,通義實驗室於 2025 年 7 月推出升級版本 Wan2.2,作為業界首個採用混合專家(MoE)架構的開源視頻生成模型,全面接入通義 APP 並開放訓練支持,將視頻生成品質推向電影級水準。訓練數據集在 Wan2.1 基礎上大幅擴容,圖像數量增加 65%,視頻片段數量增加 83%,且每個視頻片段配備 20 餘個電影級控制標籤,涵蓋照明條件、相機運動、顏色分級等專業維度,為精準控制提供數據支撐。

Wan2.2 的電影級品質使其在高端內容創作領域具備顯著優勢:影視行業可用於預可視化與場景擴展,快速生成符合導演風格的鏡頭素材;廣告領域能通過精準美學控制打造品牌專屬視覺語言;短視頻創作者藉助手機端通義 APP 即可化身 “AI 導演”,生成具有專業質感的創意內容。此外,遊戲 CG 製作、文化 IP 動態化等場景也能通過其複雜動態處理能力實現高效創新。

在線訓練支持 Wan 系列

圖片
在線訓練

魔多 AI 社區依託成熟的算力調度體系與專業技術支持,為 Wan2.1 與 Wan2.2 模型提供全流程訓練保障。

訓練的步驟也十分簡單。只需要在在線訓練中選擇好數據集再設置想要的訓練步數後,你就可以訓練出獨屬於你自己的Wan系列模型。

魔多 AI 社區將持續為開發者與創作者搭建高效技術橋樑,讓 AI 視頻創作的創意邊界不斷延伸。歡迎登錄社區官網,解鎖更多模型訓練與應用可能! 

魔多AI

專業AI創作平台,打通AI穿這個到商業變現全鏈路,賦能個人與企業級數字內容生產。

user avatar zhidechaomian_detxs7 Avatar developer-tianyiyun Avatar u_16776161 Avatar u_17469189 Avatar k21vin Avatar u_16018702 Avatar u_17569005 Avatar mianlengxincidehongjiu Avatar feibendemaojin Avatar explinks Avatar matrixorigin Avatar rtedevcomm Avatar
Favorites 25 users favorite the story!
Favorites

Add a new Comments

Some HTML is okay.