谷歌正式發佈新一代 AI 模型 Gemini 3,並宣佈將其即時整合至谷歌搜索、Gemini 應用及企業級產品中,CEO 桑達爾・皮查伊稱其為“迄今最智能的模型”。
據谷歌官方介紹,Gemini 3 Pro 是目前“最智能、最具適應性的模型”,專為解決現實世界中的複雜問題而設計——尤其是那些需要更高層次推理、創造力、戰略規劃以及逐步改進的任務。它的典型應用場景包括:具備自主行為能力的應用、高級編程、超長上下文理解、跨模態處理(如文字、圖像、音頻的結合),以及算法開發等。
Gemini 3 Pro 預覽版在 LMArena 排行榜上以 1501 分的成績位列榜首, 在幾乎所有主要 AI 基準測試中都遠超上一代。更關鍵的是,它不僅能識別圖像內容,還能理解其中的隱含信息和上下文關係。
技術架構方面,Gemini 3 Pro 採用了基於 Transformer 的稀疏專家混合模型(MoE),原生支持文本、視覺和音頻等多模態輸入,這種架構的核心優勢在於:模型會根據每個輸入 token 的內容,動態選擇激活部分參數,從而在計算資源消耗、服務成本與總容量之間實現平衡。至於硬件層面,Gemini 3 Pro 使用 Google 自研的張量處理單元(TPU)進行訓練。相比 CPU,TPU 在處理大語言模型所需的大規模計算時速度更快,且配備的大容量高帶寬內存,讓它能夠處理超大模型和批量數據。
亮點
- 多模態與推理能力:Gemini 3支持文本、圖像、視頻、音頻及代碼的整合處理,在多項基準測試中領先,包括LM Arena(1501分)、GPQA Diamond(91.9%)、Math Arena Apex(23.4%)等,推理能力達博士級。
- 智能體與長程規劃:首次推出“Gemini Agents”,可執行多步驟複雜任務(如行程規劃、郵件整理),並在Vending-Bench 2測試中位居第一。
- 開發工具升級:推出AI開發平台“Google Antigravity”,支持智能體在瀏覽器、終端等環境中自主編碼,提升開發者效率。
產品整合
- 搜索體驗革新:Gemini 3在發佈當天即接入谷歌搜索,生成結構化、可視化的交互式答案,替代傳統鏈接列表,覆蓋數十億次搜索請求。
- 多場景應用:面向企業客户推出定製服務,如生成培訓內容、分析工廠圖像;面向消費者提供“生成式界面”,如動態模擬器和貸款計算器。
詳情查看:https://blog.google/products/gemini/gemini-3/