谷歌發佈新一代 AI 模型 Gemini 3：在推理、多模態、編程等主流測試中全面領先

谷歌正式發佈新一代 AI 模型 Gemini 3，並宣佈將其即時整合至谷歌搜索、Gemini 應用及企業級產品中，CEO 桑達爾・皮查伊稱其為“迄今最智能的模型”。

據谷歌官方介紹，Gemini 3 Pro 是目前“最智能、最具適應性的模型”，專為解決現實世界中的複雜問題而設計——尤其是那些需要更高層次推理、創造力、戰略規劃以及逐步改進的任務。它的典型應用場景包括：具備自主行為能力的應用、高級編程、超長上下文理解、跨模態處理（如文字、圖像、音頻的結合），以及算法開發等。

Gemini 3 Pro 預覽版在 LMArena 排行榜上以 1501 分的成績位列榜首，在幾乎所有主要 AI 基準測試中都遠超上一代。更關鍵的是，它不僅能識別圖像內容，還能理解其中的隱含信息和上下文關係。

技術架構方面，Gemini 3 Pro 採用了基於 Transformer 的稀疏專家混合模型（MoE），原生支持文本、視覺和音頻等多模態輸入，這種架構的核心優勢在於：模型會根據每個輸入 token 的內容，動態選擇激活部分參數，從而在計算資源消耗、服務成本與總容量之間實現平衡。至於硬件層面，Gemini 3 Pro 使用 Google 自研的張量處理單元（TPU）進行訓練。相比 CPU，TPU 在處理大語言模型所需的大規模計算時速度更快，且配備的大容量高帶寬內存，讓它能夠處理超大模型和批量數據。

亮點

多模態與推理能力：Gemini 3支持文本、圖像、視頻、音頻及代碼的整合處理，在多項基準測試中領先，包括LM Arena（1501分）、GPQA Diamond（91.9%）、Math Arena Apex（23.4%）等，推理能力達博士級。
智能體與長程規劃：首次推出“Gemini Agents”，可執行多步驟複雜任務（如行程規劃、郵件整理），並在Vending-Bench 2測試中位居第一。
開發工具升級：推出AI開發平台“Google Antigravity”，支持智能體在瀏覽器、終端等環境中自主編碼，提升開發者效率。

產品整合

搜索體驗革新：Gemini 3在發佈當天即接入谷歌搜索，生成結構化、可視化的交互式答案，替代傳統鏈接列表，覆蓋數十億次搜索請求。
多場景應用：面向企業客户推出定製服務，如生成培訓內容、分析工廠圖像；面向消費者提供“生成式界面”，如動態模擬器和貸款計算器。

詳情查看：https://blog.google/products/gemini/gemini-3/

發佈評論

Product

Company

Support

Company

谷歌發佈新一代 AI 模型 Gemini 3：在推理、多模態、編程等主流測試中全面領先

發佈 評論

發佈評論