崑崙萬維發佈 Skywork R1V4-Lite

崑崙萬維正式發佈 Skywork R1V4-Lite，一款集成視覺操作、推理與規劃的輕量級多模態智能體。不僅能進行深度推理，還在同一模型中統一了主動圖像操作、外部工具調用、多模態深度研究三大能力。

與傳統只能“看圖回答”的模型不同，Skywork R1V4-Lite能夠在真實場景中隨手拍照即可完成複雜任務：自動旋轉圖像判斷空間位置、多次放大讀取模糊文字、繪製輔助線驗證幾何關係、跨模態搜索定位真實地點等等。這意味着用户不需要設計提示詞，不需要提供額外信息，只需拍一張圖，Skywork R1V4-Lite就能自己觀察、操作、推理並給出答案。

基準測試結果表明，Skywork R1V4-Lite 在8個多模態理解基準評測上整體領先Gemini 2.5 Flash，其中5個任務上超過Gemini 2.5 Pro的水平。

Skywork R1V4-Lite 也支持接入聯網搜索功能，在聯網搜索下會自動觸發深度研究能力。從結果上看，R1V4-Lite在多模態DeepResearch類任務中展現出了領先趨勢：在mm-search上以66分超過Gemini 2.5 Flash的64.9分，在FVQA上以67分顯著領先Gemini 2.5 Flash的60.8分。

崑崙萬維方面表示：

R1V4-Lite的成功不僅來自工程優化，更源自其背後的多模態新範式：圖像操作×深度推理交織訓練。這一訓練路線讓輕量模型具備跨模態推理、主動圖像操作、任務規劃與搜索增強的統一能力，展示了輕量多模態智能體的全新可能性。

這一結果進一步説明：能力密度比參數規模更重要，小模型也能逼近閉源模型的真實表現。隨着更大容量與更強結構進一步加入該範式，其scaling潛力將持續釋放。目前，Skywork R1V4-Pro也即將準備發佈。

發佈評論

Product

Company

Support

Company

崑崙萬維發佈 Skywork R1V4-Lite

發佈 評論

發佈評論