百川智能宣佈推出最低幻覺循證增強醫療大模型 Baichuan-M3 Plus。
公告稱,憑藉獨創的六源循證技術與M3基座結合,M3 Plus將幻覺率降低至2.6%,低於 Open Evidence,達到全球最低水平;首創“證據錨定”技術,不僅給出引文來源,還能將模型生成的每一句醫學結論,精確錨定到原始論文中的對應證據段落,使 AI 的醫學判斷真正做到可核驗、可追責、可教學。
測評結果顯示。M3不僅在 Healthbench、Healthbench Hard 等多個權威評測中登頂榜首,實現了對 GPT-5.2的全面超越,更在 OpenAI 引以為傲的低幻覺領域完成超越,以3.5%的幻覺率領跑全球。
M3首創的 Fact-Aware RL的強化學習範式,使底座模型在無工具的設定下,幻覺也能大幅降低到SOTA水平。在此基礎上,M3 Plus 將 M2 Plus 模型已驗證有效的六源循證範式,引入模型訓練和推理過程,確保模型的每條建議都有專業醫學證據支持。最終,M3 Plus的事實性幻覺降低到新的SOTA,僅2.6%,相較GPT-5.2大幅下降超30%;並超越了行業標杆 Open Evidence。
此外,通過 MoE 架構優化、模型量化以及 Gated Eagle-3 投機解碼等關鍵技術,M3 Plus API 調用價格較上一代模型大幅降低了 70%。