一位歷史學家對 Gemini3Pro 進行了嚴苛測試:50份約1萬詞的英文學術手寫樣本,涵蓋多種複雜書寫體與成像條件。結果顯示,Gemini3在字符錯誤率(CER)和詞錯誤率 (WER) 上實現驚人突破,CER 僅0.56%、WER1.22%,已接近或達到專業人類轉錄水平。
Gemini3不僅識別出未經訓練的複雜手寫字體表格,甚至優於受過專業訓練的學生。在嚴格計分下,前代 Gemini-2.5-Pro 的 CER 為4%、WER11%;若排除標點與大小寫,降至2%/4%。而 Gemini3直接將錯誤率壓至原模型的1/7至1/9,提升幅度達50%–70%。
面對一處模糊數字,Gemini3自主補全缺失語境,完成跨越歷史貨幣與重量單位的多步換算,最終得出需對文檔世界進行抽象建模的正確結論 —— 這些符號從未在訓練中被明確定義。
作者稱,Gemini3 似乎跨越了專家長期認為“當前架構無法逾越”的界限。