2026年1月22日,百度發佈並上線原生全模態大模型文心5.0正式版。該模型參數達2.4萬億,採用原生全模態統一建模技術,具備全模態理解與生成能力,支持文本、圖像、音頻、視頻等多種信息的輸入與輸出。
目前,個人用户可在文心APP、文心一言官網體驗,企業與開發者可通過百度千帆平台進行調用。
https://yiyan.baidu.com/
https://console.bce.baidu.com/qianfan/modelcenter/model/buildIn/detail/am-3c0d4ca1f067#ERNIE-5.0-Thinking-Preview
據介紹,在40餘項權威基準的綜合評測中,文心 5.0 正式版的語言與多模態理解能力超越Gemini-2.5-Pro、GPT-5-High等模型,穩居國際第一梯隊。圖像與視頻生成能力與垂直領域專精模型相當,整體處於全球領先水平。
百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜介紹,與業界多數採用“後期融合”的多模態方案不同,文心5.0的技術路線採用統一的自迴歸架構進行原生全模態建模,將文本、圖像、視頻、音頻等多源數據在同一模型框架中進行聯合訓練,使得多模態特徵在統一架構下充分融合並協同優化,實現原生的全模態統一理解與生成。
此外,文心5.0採用超大規模混合專家結構,具備超稀疏激活參數,激活參數比低於3%,在保持模型強大能力的同時,有效提升推理效率。同時,基於大規模工具環境,合成長程任務軌跡數據,並採用基於思維鏈和行動鏈的端到端多輪強化學習訓練,顯著提升了模型的智能體和工具調用能力。
2025年11月,百度發佈文心大模型5.0並上線Preview版本。此後,文心5.0系列模型多次登上LMArena全球大模型競技場,多次位居文本榜和視覺理解榜國內第一,躋身國際第一梯隊。
1月15日,文心5.0以1460分位列LMArena文本榜國內第一、全球第八,超過GPT-5.1-High、Gemini-2.5-Pro等多款國內外主流模型。