高通公司正式發佈了其新一代人工智能芯片 ——AI200和 AI250。
根據介紹,高通 AI200芯片是一款專為機架級 AI 推理設計的解決方案,其目標在於降低總體擁有成本(TCO)並提升性能。該芯片支持768GB 的 LPDDR 內存,這樣的內存容量和更低的成本為大型語言模型(LLM)和多模態模型(LMM)的推理提供了強大支持。
與此相對,高通的 AI250則採用了近內存計算(near-memory computing)的創新架構,這種架構使其能夠提供超過10倍的內存帶寬,同時顯著降低功耗,提升 AI 推理任務的效率與性能。兩款芯片均配備了直接液冷技術,以增強散熱效果。
在硬件之外,高通還推出了一個全面的 AI 軟件棧,涵蓋了從應用層到系統軟件層的所有內容,專為 AI 推理進行了優化。開發者可以通過高通的 Efficient Transformers Library 和 AI 推理套件,輕鬆實現模型的部署和管理。該軟件棧支持眾多主流機器學習框架和推理引擎,為 AI 應用的開發提供了豐富的工具、庫和 API。
預計高通的 AI200和 AI250將在2026年和2027年正式商用。