中國國家市場監管總局26日公佈,GB/T 45288《人工智能大模型》系列國家標準近日正式實施,標誌着中國大模型產業進入“科學權威、統一規範”新階段。
國家市場監管總局介紹,作為首部聚焦通用大模型的國家標準,該系列填補了技術評價體系空白,明確性能、安全與服務能力要求,配套評測能力已獲中國合格評定國家認可委員會認可。
基於此構建的“求索”-LMBench評測基準,整合方法、數據集與自動化平台,成為行業公認的“能力標尺”。評測體系已形成主流大模型白名單,為央企、國企選型提供依據,並支撐中國石化、南方電網等建設行業大模型,完成對華為盤古、訊飛星火、中國移動“九天”等模型的場景驗證。
截至目前,標準工具完成千餘項評測任務,調用大模型超95萬次,精準識別幻覺控制、內容安全等共性問題,助力近30家廠商技術迭代,推動形成“研發—評測—應用—升級”閉環。
標準國際化也同步推進。面向東盟編制英語、老撾語、高棉語版本,填補了區域空白;中國開源模型架構已被新加坡等國項目採用,彰顯標準引領下的全球影響力。