阿里通義發佈 Qwen3-VL 技術報告

新聞
HongKong
16
06:10 PM · Dec 01 ,2025

阿里通義 Qwen 團隊在 arXiv 平台發佈了 Qwen3-VL 視覺語言模型的詳細技術報告,全面披露了其從架構設計到評估方法的完整技術細節。

該報告全面涵蓋了從預訓練到後訓練、從架構設計到基礎設施、從數據處理到評估方法的整個技術鏈路,旨在為視覺語言模型領域的研究者與開發者提供一份完整的技術參考。

https://arxiv.org/pdf/2511.21631

Qwen 團隊負責人林俊暘表示,團隊正在為下一代模型做準備,視覺能力將是其中的重要組成部分。目前應用於 Qwen3-VL 的技術已證明其有效性,團隊同時也在推進更具前瞻性的研究方向,包括多模態原生訓練範式、視覺任務與領域的數據規模化擴展,以及多模態 agentic RL 相關的研究。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.