Gemini 3 推出 Deep Think 模式:面向 Ultra 訂閲用户的深度推理升級

新聞
HongKong
6
10:55 AM · Dec 08 ,2025

Google在持續擴展 Gemini 3 模型家族的基礎上,正式發佈全新的 Gemini 3 Deep Think 模式,這一模式在 Gemini 3 Pro 之上投入了更多算力並引入新技術,旨在在複雜數學、科學與邏輯推理任務上提供更高水平的表現。

目前,Deep Think 已面向所有 Google AI Ultra 訂閲用户開放,可在 Gemini 應用中通過在提示欄選擇 Gemini 3 Pro 模型並切換至“Deep Think”模式直接使用。

據介紹,Gemini 3 Deep Think 在多項業內高難度基準測試中取得了“業界領先”的成績。它在被視為當前最難 AI 推理測評之一的 Humanity’s Last Exam 上取得了 41% 的得分,在 ARC-AGI-2 測試中藉助代碼執行拿下 45.1% 的成績,而在 GPQA Diamond 科學知識測試中則獲得了 93.8% 的高分,均被標註為“最先進水平”。 Google表示,這一模式依託“高級並行推理”能力,可以同時探索多種假設路徑,從而在複雜問題求解中大幅提升準確率和穩健性。

在實際競賽場景中,Deep Think 相關模型也已展現出接近人類頂尖選手的實力。Google提到,這些 Deep Think 變體近期在國際數學奧林匹克(IMO)和國際大學生程序設計競賽(ICPC)世界總決賽中達到了“金牌標準”水平。 在 IMO 測試設置中,模型需在兩場各 4.5 小時的考試中,在完全離線、不可調用工具或互聯網的條件下獨立解題並撰寫自然語言證明,對推理深度與表達能力要求極高。

對於終端用户而言,Gemini 3 Deep Think 的定位是作為 Ultra 訂閲層中的“高推理模式”,主要面向需要嚴謹演繹、多步推理和高可靠性的複雜任務場景。Google強調,這一模式是在現有 Gemini 3 Pro 能力之上通過額外算力與新技術堆疊而成,因此更適合處理高難度數學、科學研究問題及複雜邏輯分析需求。 用户在 Gemini 應用內僅需在模型選項中切換到 Gemini 3 Pro 並啓用 Deep Think,即可體驗這一增強版推理能力。

文章還提到,OpenAI 早在今年 7 月就宣稱其一款實驗性推理大模型已達到“金牌級別”的表現,但該模型迄今尚未公開發布。 相比之下,Google此次將達到 IMO 金牌標準的 Deep Think 模型直接開放給 Ultra 訂閲用户使用,被視為對競品的一次“先手發佈”,外界也普遍預計 OpenAI 可能在不久的將來跟進,將其高推理模型推向公眾。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.