AI 視頻公司 Runway 發佈世界模型 GWM‑1

新聞
HongKong
9
11:12 AM · Dec 16 ,2025

AI 視頻公司 Runway 近日宣佈推出通用“世界模型”家族 GWM-1,並同步更新其旗艦視頻生成模型 Gen‑4.5。

GWM-1 基於 Gen‑4.5 構建,可逐幀生成、實時運行,並通過攝像機姿態、機器人指令、音頻等動作進行交互式控制,包含「GWM Worlds」「GWM Avatars」「GWM Robotics」三種後訓練變體:

  • GWM Worlds 能在長時間移動序列中維持空間連貫性,允許定義環境的幾何、光照和物理規則,並對輸入動作作出準確響應;
  • GWM Robotics 被描述為基於機器人數據訓練的「學習型模擬器」,可生成動作條件的視頻滾動,支持「反事實」生成以探索不同軌跡與結果,以降低昂貴的真實數據採集與線下測試風險;
  • GWM Avatars 為音頻驅動的交互式視頻生成模型,可在長時對話中穩定呈現自然的人類動作與表情(面部表情、眼球運動、口型同步、手勢),適用於實時輔導與教育、客户支持與服務、培訓模擬、互動娛樂與遊戲等場景。

Runway 在直播中稱,其戰略正從影視製作擴展至機器人、物理與生命科學,並強調世界模型位於 AI 進步前沿:僅靠語言模型難以解決機器人技術、疾病、科學發現等問題,真正的進步需要模型像人類一樣在模擬環境中體驗世界並從錯誤中學習。

Gen‑4.5 的更新集中在畫面保真度與創意控制,並新增原生音頻生成與編輯、多鏡頭視頻編輯等能力;官方同時承認現階段視頻生成仍存在因果推理、客體恆存性與成功偏差等常見侷限,這些問題將作為世界模型研究的重點方向持續迭代。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.