IBM 發佈 Granite 4.0 Nano 模型 - 新聞 詳情

IBM 近日推出了四款新的 Granite4.0Nano 模型,這一系列模型的參數規模從350萬到15億不等。與行業中大型模型普遍依賴雲計算的趨勢不同,Granite4.0Nano 模型可以在普通的筆記本電腦上運行,甚至可以在瀏覽器中本地運行。這使得開發者能夠在不依賴雲服務的情況下,構建適用於消費者硬件或邊緣設備的應用。

所有 Granite4.0Nano 模型均在 Apache2.0許可下發布,適合研究人員、企業和獨立開發者使用,且支持商業用途。這些模型與各種工具兼容,如 llama.cpp、vLLM 和 MLX,並獲得了 ISO42001負責任 AI 開發的認證。

Granite4.0Nano 家族包括四款模型:Granite-4.0-H-1B(約1.5億參數)、Granite-4.0-H-350M(約350萬參數)、Granite-4.0-1B(接近2億參數的變種)和 Granite-4.0-350M(變種)。其中,H 系列模型採用混合狀態空間架構,適用於低延遲的邊緣環境,而標準的變壓器模型則提供了更廣泛的兼容性。

基準測試顯示,Granite4.0模型在多個領域的表現優於同類競爭對手。IBM 的研究團隊表示,這些模型在指令跟隨和功能調用任務中表現突出,並且在內存需求和運行速度上具有優勢,能夠在移動設備或 CPU 上流暢運行。