崑崙萬維發佈 Skywork R1V4-Lite

新聞
HongKong
15
11:42 AM · Nov 18 ,2025

崑崙萬維正式發佈 Skywork R1V4-Lite,一款集成視覺操作、推理與規劃的輕量級多模態智能體。不僅能進行深度推理,還在同一模型中統一了主動圖像操作、外部工具調用、多模態深度研究三大能力。

與傳統只能“看圖回答”的模型不同,Skywork R1V4-Lite能夠在真實場景中隨手拍照即可完成複雜任務:自動旋轉圖像判斷空間位置、多次放大讀取模糊文字、繪製輔助線驗證幾何關係、跨模態搜索定位真實地點等等。這意味着用户不需要設計提示詞,不需要提供額外信息,只需拍一張圖,Skywork R1V4-Lite就能自己觀察、操作、推理並給出答案。

基準測試結果表明,Skywork R1V4-Lite 在8個多模態理解基準評測上整體領先Gemini 2.5 Flash,其中5個任務上超過Gemini 2.5 Pro的水平。

Skywork R1V4-Lite 也支持接入聯網搜索功能,在聯網搜索下會自動觸發深度研究能力。從結果上看,R1V4-Lite在多模態DeepResearch類任務中展現出了領先趨勢:在mm-search上以66分超過Gemini 2.5 Flash的64.9分,在FVQA上以67分顯著領先Gemini 2.5 Flash的60.8分。

崑崙萬維方面表示:

R1V4-Lite的成功不僅來自工程優化,更源自其背後的多模態新範式:圖像操作×深度推理交織訓練。這一訓練路線讓輕量模型具備跨模態推理、主動圖像操作、任務規劃與搜索增強的統一能力,展示了輕量多模態智能體的全新可能性。

這一結果進一步説明:能力密度比參數規模更重要,小模型也能逼近閉源模型的真實表現。隨着更大容量與更強結構進一步加入該範式,其scaling潛力將持續釋放。目前,Skywork R1V4-Pro也即將準備發佈。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.