西風 發自 凹非寺
量子位 | 公眾號 QbitAI
就在剛剛,量子位獲悉,大模型創業六小強之一的智譜,已最新完成一輪30億人民幣融資!
新資方包括多家戰投及國資,君聯資本等繼續跟投。
這是智譜近三個月來的第二輪融資。
就在9月,中關村科學城公司宣佈以投前200億估值領投智譜,智譜也是國內估值率先超過200億的大模型創業企業。
量子位不完全統計,智譜官方曾披露的融資情況如下:
2021年披露完成A輪過億元融資,達晨財智、華控基金、將門創投等聯合投資;2022年宣佈獲得數億元人民幣的B輪融資,君聯資本和啓明創投聯合領投;2023年披露累計獲得超25億人民幣融資,資方包括君聯資本、美團、螞蟻、阿里、騰訊、小米、金山、順為、Boss直聘、好未來、紅杉、高瓴等。
與此同時,智譜這次還罕見對外披露了商業化戰績,這也是其首次公開。
具體數據如下:
- 截止目前,智譜今年商業化收入增長超過100%。
- 智譜開放平台bigmodel.cn,API年收入同比增長超30倍。
- 平台日均Tokens消耗量增長150倍,其中付費Tokens增長超過40倍。
- MaaS平台擁有70萬企業和開發者用户,付費客户數增長超20倍。
- C端產品智譜清言擁有超過2500萬用户,三季度清言開始上線付費功能,ARR(年度經常性收入)收入超千萬。
那麼,問題來了——吸了如此多金&商業化戰績頗豐的智譜,下一步要做什麼?
進一步研發智譜基座大模型
智譜透露,本輪融資將用於智譜基座大模型的進一步研發:
從回答問題升級到解決複雜推理、多模態任務,更好地支撐行業生態發展。
就在剛剛結束的由量子位主辦的行業峯會——MEET 2025智能未來大會上,智譜COO張帆剛好也透露了一些訊息。
他表示,OpenAI發佈了對AGI目標能力的分級,智譜也有自己的理解。
智譜把AGI分為五個等級:
第一級是語言,智譜“已經做得非常不錯了”。
第二級是對複雜問題的求解,可以看到o1這樣的能力出現,對模型的應用類似從“大腦的系統1”轉化為“系統2”,從簡單直覺的回答,變成了深度性思考和拆解。
第三級開始使用工具,回答複雜問題時,不但能直接做深度思考,還能夠跟外界持續交互獲取信息。比如自主智能體不但能夠通過API,還可以像人一樣操作手機、PC甚至汽車的界面來獲取信息。
第四級是實現自我學習。
第五級還沒有非常明確的定義,但方向是超越人類,AI將具備探究科學規律、世界起源等終極問題的能力。
張帆表示,智譜在不斷地探索和豐富模型的能力,從最開始的語言能力,到L2的複雜問題的能力,到工具能力以及現在正在試圖解決的第四級別的GLM-zero和GLM-OS等能力。
這就來系統盤點一下智譜的探索路線。
端到端多模態和Agent佈局初見規模
Sora爆火開年,之後多模態模型競相出現,再到如今深度推理模型成頂流,端側大模型和Agent技術成新風向。
梳理來看,智譜每一步都沒有落下。
先有對標Sora的視頻生成模型CogVideoX、對標GPT-4o的端到端語音模型GLM-4-Voice和GLM-4-VideoCall。
後有近期逐漸清晰的Agent和端側領域佈局——
智能體產品AutoGLM/GLM-PC、適配高通驍龍旗艦芯片的端側大模型先後發佈。
而在這其中,和OpenAI等不同,智譜一以貫之的準則之一是持續開源。
翻看智譜早期的GLM報告,就會發現裏面有“我們邀請大家加入它的開放社區,推動大規模預訓練模型的發展”的字樣,這家公司將“用開源的方式和開發者、行業用户交個朋友”的習慣延續到現在。
根據目前數據,ChatGLM等20餘款模型已獲15萬GitHub星標,開源模型全球下載量3000萬。
以下是智譜今年的技術發佈時間軸:
- 11月,發佈AutoGLM升級版,可自主執行超50步的長步驟操作,也可以跨app執行任務,開啓“全自動”上網新體驗,支持基於瀏覽器的數十個網站的無人駕駛。
- 11月,發佈GLM-PC內測,基於智譜多模態模型CogAgent,探索“無人駕駛”PC。可代替用户參與視頻會議、處理文檔、搜索網頁並總結、遠程定時操作。
- 11月,視頻模型CogVideoX升級,支持10s時長、4k、60幀超高清畫質、任意尺寸以及更好人體動作和物理世界模擬。CogVideoX v1.5-5B、CogVideoX v1.5-5B-I2V同期開源。
- 10月,GLM-4-Voice端到端情感語音模型發佈,並上線清言app,能夠理解情感,有情緒表達、情感共鳴,可自助調節語速,支持多語言和方言,並且延時更低、可隨時打斷。
- 10月,AutoGLM內測版發佈,只需接收簡單的文字/語音指令,就可以模擬人類操作手機,不受限於API調用。
- 10月,和三星、高通宣佈合作,分別共同打造AI產品和端側多模態交互大模型。
- 8月,發佈跨文本音頻和視頻模態實時推理大模型GLM-4-Videocall,實現AI與人實時視頻通話。通過API接口可無縫部署在包括手機在內各類帶攝像頭端側設備。
- 8月,新一代基座大模型GLM-4-Plus發佈,語言理解、指令遵循、長文本處理等方面性能全面提升。
- 7月,視頻生成模型“清影”在清言PC端、移動應用端以及小程序端正式上線,提供文本生成視頻和圖像生成視頻的服務,30秒即可完成6秒視頻生成,真實還原物理世界中的運動過程。
- 6月,GLM-4-9B模型開源,支持100萬Tokens長文本和26種語言,並首次開源了基於GLM的視覺模型GLM-4V-9B,多模態能力比肩GPT-4V。
- 1月,新一代基座大模型GLM-4發佈,整體性能相比上一代大幅提升,支持更長上下文,具備更強多模態能力,推理速度更快,支持更高併發,大大降低推理成本。
隨着年末將至,大模型創業新一年的風暴也即將出現。