以下文章來源於第一新聲,作者第一新聲
十多年前,寧海元還是阿里巴巴內部負責天貓雙十一數據庫保障的技術負責人。零點流量洪峯之下,他和團隊要確保每一筆訂單、每一筆支付都能被系統準確接住——背後依賴的,是一整套可信、可流轉的數據體系。
從搭建當時亞洲最大的 Oracle RAC 集羣,到主導參與淘寶“去 IOE”,再到把分佈式數據平台對外商業化,這段經歷在很大程度上塑造了他今天對 AI 的判斷:
真正決定智能應用上限的,不是模型本身,而是它腳下的數據地基。
2015 年,他離開阿里,聯合創立袋鼠雲,選擇從“數據基礎設施”切入。十年時間,袋鼠雲從一家做數據中台的技術公司,演化為圍繞“多模態數據智能中台”的“一體兩翼”格局:
“一體”:多模態數據智能中台(由大數據底座平台+多模態數據中台 構成),負責把數據變成穩定、統一、可調用的生產要素;
“兩翼”:數據智能引擎與空間智能引擎,一翼落在經營與決策,一翼伸向物理空間與數字孿生。
在 AI Agent 被視為新一輪產業窗口的時間點上,本期第一新聲專訪袋鼠雲 CEO 寧海元 ,這家成立十年的大數據基礎軟件公司,正在給出自己的答案。
01 AI 熱潮之後,回到“數據 + 智能”的長期結構
當前 ,從內容生成到行業解決方案 ,全球AI 生態正迎來爆發式增長。據第一新聲智庫報告預測 ,2025 年企業級 AI Agent 應用市場規模將達到 232 億元 ,2023-2027 年複合增長率高達 120%。各行各業對 AI的關注度與投入規模呈指數級攀升 ,但在“熱度”之外,一個殘酷的事實是:真正落地到業務、形成穩定產出的 AI 項目,並沒有想象中那麼多。
寧海元在訪談中提到,今年不少 CIO 都向他表達類似的焦慮:一方面,業務高層對 AI 抱有極高期待,希望“接入一個大模型,就能盤活一批難題”;另一方面,當部門把幾百條 AI 場景寫進 Excel 後,技術團隊會很快意識到——大部分場景卡的不是模型能力,而是數據基礎。
在他看來,這一輪企業級 AI 應用的瓶頸,與十年前數據中台剛興起時的情況有相似之處:
- 企業 IT 建設長期遵循“按部門/項目上系統”的邏輯,ERP、CRM、SCM、MES 各自為政,形成一個個“數據煙囱”;
- 不同系統背後,對同一個業務事實往往有不同的口徑和算法,一個簡單的 GMV 指標,在市場、財務等不同部門眼裏有不同的理解;
- 大量文本、圖片、語音、視頻等非結構化數據,要麼從未被採集,要麼只是“堆在存儲裏”,沒有進入經營分析和決策鏈路。
在傳統 BI 階段,這些問題往往還“勉強可用”——頂多是報表口徑對不上、溝通成本上升。但當企業希望把 AI 用在客户經營等核心決策時,數據的分散、口徑的混亂、流轉的高成本,再疊加信創環境下複雜的技術棧,迅速抬高了 AI 落地門檻。
“很多老闆會天然認為,大模型出來了,是否可以順便把原來信息化、數字化沒解決的問題一併解決掉。”寧海元説,“但如果數據本身不規範,也不能實時反映業務現狀,再強的模型也只能停留在演示層面。”
在他給出的框架中,企業要真正進入“AI 應用期”,至少要先回答一個問題:自己的數據是不是已經達到了 AI Ready 的狀態。
所謂 AI Ready 數據,在寧海元看來至少有兩點:
- 規範性——也就是業務語義層面的統一。企業內部要有一套相對穩定的指標與數據標準體系,明確“同一件事在不同系統裏是什麼含義”;
-
實時性——數據能夠儘量及時地反映業務狀態,而不是始終滯後一個結算週期、一個賬期甚至更久。“有足夠豐富的原始數據,再加上一套統一語義的業務數據,在這個基礎之上去用 AI 做推理,才有可能支撐穩健的企業級應用。”寧海元總結道。
02 “數據地基”只是起點:從結構化到多模態的 AI Ready
如果把 AI 看作一座“塔”,那數據地基只是基礎層。而對許多中國企業來説,這塊地基的建設還處在不同階段。
寧海元的觀察是:
對一些傳統制造、能源礦產企業來説,第一步仍然是完成結構化數據的“上雲和入庫”——把散落在紙質單據、Excel、局部系統裏的經營數據,統一採集和存儲;
對於頭部製造業、金融業、互聯網等數字化程度更高的企業,結構化數據平台已經相對成熟,新的挑戰更集中在:如何把會議紀要、郵件、客服對話、設備圖片、文檔規範等非結構化數據納入治理與分析體系。
“結構化數據這條線,中國市場其實已經教育了二十多年,從數據倉庫到數據中台,技術能力和人才體系都比較成熟。難的反而是非結構化數據。”寧海元説。
在 AI 視角下,“數據地基”的內涵也在發生變化:
從對象上看,從單一結構化數據擴展到結構化 + 半結構化 + 非結構化的全模態數據;
從能力上看,從採集-存儲-計算,擴展到採集-治理-語義建模-安全合規-多模態融合;
從目標上看,從“為 BI 報表供數”,轉向“為 AI 推理與 Agent 應用持續供給高質量語料”。
因此,袋鼠雲在對外表述中,把“數據地基”視為 AI Ready 的前提,而不是終點——真正支撐企業未來十年智能化演進的,是建立在其上的多模態數據智能中台。
03 站在 Data+AI 交匯點上 ,袋鼠雲是怎麼做的?
袋鼠雲的產品路徑可以概括為:從數據中台走向多模態數據智能中台。
2016 年,袋鼠雲正式推出自研數據中台產品“數棧”,基於開源技術棧構建分佈式存儲、離線與實時計算、元數據管理等能力。與不少“從平台起步”的創業路徑不同,袋鼠雲在早期就做了兩個決定:
- 底層堅持開放生態,基於 Spark、Flink 等主流開源框架演進,不鎖定在某個私有技術棧;
- 把主要研發資源壓在“中間層”,也就是數據中台本身,而非把精力過多投入到底層引擎“重複造輪子”。
這一選擇,使得它在後續幾年裏,能更快適配不同行業、不同規模客户的異構環境——包括國產大數據平台、金融行業的專有集羣、大型互聯網公司的混合架構等,在實踐中逐步形成了“模塊化、插件化”的產品形態。
進入大模型時代後,袋鼠雲在原有中台之上,明確提出了“多模態數據智能中台”的產品方向:
從產品結構看,它由多模態數據中台 + 大數據底座平台構成,前者解決“管什麼、怎麼管”,後者解決“放在哪裏、怎麼算”;
從能力邊界看,它不僅要承接企業所有結構化數據,還要統一接入 IoT 時序數據、日誌、文本、音視頻等多模態數據,並通過統一元數據體系打通;
從位置上看,它面向的不只是 BI 報表和傳統分析,而是主動對接大模型平台、Agent 平台,成為 Data+AI 的“中樞層”。
圍繞這個“中樞層”,寧海元給出了三層協同路徑:
- Data for AI:通過數棧多模態數據智能中台,把企業內多源數據整合為統一、規範、帶語義標籤的數據資產;為大模型的精調、RAG 以及企業場景推理提供可控、可追溯的數據供給。
- AI for Data:利用大模型能力輔助數據開發與治理,包括自動生成數據任務、輔助排查數據質量問題、自動梳理血緣等;通過內置的“靈瞳”智能體,提供 SQL 編程助手、任務調度助手、運維助手、治理助手等,提高數據團隊生產力。
- AI for Agent / AI for Business:在上層對接 AI Works 等 Agent 開發應用平台,把中台能力以 API、數據服務、特徵服務等形式暴露給各類智能體;支撐企業圍繞運營分析、經營監控、流程協同等場景構建業務 Agent。
寧海元認為,多模態數據智能中台的價值,不在於重新包裝“數據中台”概念,而在於為 AI 時代重構數據基礎設施。
從銀行、證券到製造、零售,再到能源和礦業,數棧已經在上千家客户中經過驗證——這既是袋鼠雲接下來十年戰略的底氣,也是一體兩翼能夠展開的前提。
04 “兩翼”:數據智能 + 空間智能,與企業未來十年同行
如果説“多模態數據智能中台”是一體,那麼“兩翼”則是袋鼠雲回答“基礎軟件如何體現應用價值”的方式。
數據智能:從“看報表”到“對話數據”
在數據智能方向,袋鼠雲主要通過 AIWorks(智能體開發應用平台) 和 AIMetrics(智能指標平台) 兩條產品線展開。
AIWorks 作為企業級 Agent 平台,提供多模型接入、知識庫管理、工作流編排、監控與治理等通用能力,幫助客户在一個統一環境中構建和管理各類業務智能體;
AIMetrics 則聚焦“數據+指標”這一經典企業場景,通過自然語言問答、自動圖表與結論生成、異常波動監測與歸因、權限與多端協同等能力,讓管理者可以“直接向指標提問”,降低數據分析門檻。
在寧海元的設想中,數據智能引擎既是多模態數據智能中台的“前台展示”,也是未來企業 Data Agent 形態的實驗場。它不會替代所有 BI 和分析工具,但會在越來越多的場景中承擔“第一交互界面”的角色。
空間智能:從經營管理走向物理空間治理
相比數據智能,空間智能是袋鼠雲這幾年推動得更早也更“前沿”的方向之一。
通過易知微旗下的EasyModel、EasyTwin、EasyV 等產品,他們在城市治理、園區運營、工業現場、文旅景區等領域積累了大量數字孿生實踐。
在寧海元看來,企業要解決的從來不只是“經營問題”,很多時候也是“物理空間的治理問題”。傳統數字孿生的最大障礙在於建模成本高。過去要做一套 3D 場景,往往需要大量人工建模與數據採集投入,很難規模複製。隨着 3D Gaussian(3D高斯) 等新一代空間重建技術成熟,基於照片、激光點雲即可自動重建 3D 場景,成本和週期大幅下降,也為空間智能帶來了新的可能性。
在產品層面,袋鼠雲將 3DGS 能力集成到 EasyModel 和 EasyTwin 中:
前者聚焦數字空間底座生產,實現多源空間數據的統一生產、管理與版本控制;
後者聚焦仿真與渲染,將空間數據與業務數據結合,支持運行監控、應急演練、能耗管理等場景。
當多模態數據智能中台與空間智能引擎打通後,“數據智能”與“空間智能”開始形成互補:經營數據可以映射到空間對象,空間事件又能迴流為經營指標,這也是袋鼠雲近兩年在城市、能源、製造等行業頻繁佈局的方向。
05 從本土深耕到全球化佈局,袋鼠雲的出海“三步走”
無論是數據中台還是多模態數據智能中台,本質上都屬於“重投入、長週期”的基礎軟件賽道。
如何在保證產品路線足夠長期的同時,找到可持續的商業路徑,是所有廠商必須回答的問題。
在國內,袋鼠雲經歷了從與阿里雲 OEM 合作,到深耕金融、能源、製造等行業,再到形成“產品 + 夥伴生態”的路徑;
在全球化上,它則選擇了一條相對務實的“三步走”:
- 服務中國企業出海——圍繞數據合規、本地化部署、多雲環境適配等剛需,幫助中國企業在東南亞、中東、歐洲等地搭建本地數據與 AI 基礎設施;
- 服務海外華人企業——利用對中國供應鏈、產業鏈的理解,支持跨境業務中對數據流轉與風控的需求;
-
逐步拓展本地客户——在關鍵節點市場形成交付與產品支撐能力,走向真正意義上的全球化基礎軟件公司。目前,袋鼠雲已經在香港設立公司,作為承接中國市場與海外市場的重要支點:既為中國企業出海提供更靈活的合規與部署選項,也為面向本地客户的服務打下基礎。
06 從“做產品”到“做長期基礎設施”
縱觀袋鼠雲這一輪戰略升級,可以看到一條清晰的軌跡:
從“做某一代技術產品”,轉向“做 Data+AI 時代長期需要的基礎設施”。
多模態數據智能中台 回答的是:在未來十年裏,企業如何把越來越多元的業務數據,持續沉澱為面向 AI 的、可治理的資產;
數據智能引擎與空間智能引擎 回答的是:企業如何在報表分析、Agent 應用、數字孿生和空間智能等場景中,把 Data+AI 變成可感知、可複用的生產力;
出海三步走則試圖回答:當 AI 成為新的“通用技術”時,中國的基礎軟件公司如何參與構建全球產業的底層範式。
在很多人眼裏,2025 年是企業 Agent 的“元年”;
但在寧海元的視角里,“元年”意味着至少十年的長跑週期,而不是一波風口。
他的邏輯很樸素:
每一輪生產力技術要真正改變生產關係,週期都不會短;
今天的 Agent 更像是“新物種剛剛孵化”,要經歷從單點場景、部門級試點,到組織級、集團級的漫長進化。
在這場漫長的技術與產業共振中,袋鼠雲選擇了一條不算“短平快”的路:
把自己定位為產業智能化的基礎設施提供方。至於這條路能走多遠,最終會交給時間和市場去檢驗。但至少在圍繞 Data+AI 重構基礎設施這件事上,袋鼠雲已經把自己的位置和路線,畫得足夠清晰。