2025 年 12 月 13 日,VeloxCon China 2025 在北京成功舉辦。作為 Velox 項目首次在中國舉辦的線下技術大會,匯聚了來自Meta、IBM、螞蟻集團、阿里雲、騰訊、小米、小紅書等企業的數十位核心貢獻者與一線工程師。
大會通過 18 場演講將 Velox 置於真實業務場景之中,系統展示了其在架構演進、AI 數據處理、湖倉加速、流批融合等方向的最新實踐。這些分享不僅直面性能、穩定性與兼容性等落地挑戰,也反應了開發者社區對構建可靠、可擴展、可協同的數據基礎設施的共同探索,彰顯了中國開發者在全球高性能分析生態中的工程深度與協作廣度。
夯實底座,突破能力邊界
會議伊始,Velox 項目聯合發起人 Pedro 發表開幕致辭。他回顧了 Velox 開源項目的發展歷程,從項目啓動、開源發佈到建立技術治理結構,展示了 Axiom 架構、GPU 支持、PyVelox 等關鍵進展,強調了社區協作與工程嚴謹性是項目持續演進的核心動力。他特別提到,Velox 已建立了正式的技術治理機制,並迎來來自 IBM、Intel、NVIDIA、Microsoft 等多家企業的新增維護者,標誌着項目正邁向更加開放和可持續的階段。
在明確了社區與架構演進的總體方向後,大會議題迅速深入到如何利用 Velox 構建高性能計算引擎的具體實踐中。阿里雲 EMR Serverless Spark 技術負責人周克勇系統闡述了“可組合性”在數據計算領域的實踐。他詳細解析了阿里雲如何深度集成並貢獻於 Apache Celeborn、Paimon、Velox 及 Gluten 等開源組件,通過模塊化組裝構建出高性能湖倉一體引擎。他指出,基於該架構,阿里雲 EMR Serverless Spark 成功創造了 TPC-DS 100TB 規模性能測試的世界新紀錄,實現性能翻倍與性價比大幅提升。
接着,Meta 軟件工程師 Masha Basmanova 闡述了現有查詢引擎在跨語言通信、優化器能力與開發體驗上面臨的挑戰,並介紹了基於 C++ 的統一前端框架 Axiom。該框架將 SQL 解析、邏輯優化與物理執行融為一體,通過內置的強大優化器與 Velox 運行時無縫對接,能夠實現更高效、可擴展的查詢處理。演講最後,她積極展示了 Axiom 的開源路線圖,並歡迎全球開發者加入,共同推動該項目的演進。
強大的執行框架,最終需要服務於極具挑戰性的數據場景,特別是爆發式增長的 AI 數據。Meta 軟件工程師孟曉烜則在之後的演講中,深入闡述了應對AI訓練數據規模激增與成本挑戰的解決方案。他重點介紹了 Meta 如何通過數據歸一化技術剝離重複特徵,並構建可索引的序列存儲系統。依託 Velox 技術棧,團隊在訓練數據的加載、生成與探索三大環節實現了端到端優化,顯著提升了處理效率與資源利用率。
在 Meta 多位工程師從框架演進、可組合架構、數據標準化等角度深入分享後,螞蟻集團高級技術專家黃葉偉也從企業落地實踐層面分享了基於 Velox 的 Spark 加速實踐。他重點介紹了基於 Gluten 與 Velox 構建的向量化引擎如何通過任務級 Fallback、Spill 優化、Shuffle 優化等關鍵技術,在混合部署場景下顯著提升 Spark 性能與穩定性。他表示,該方案目前已實現日均數十萬任務覆蓋,平均節省資源超30%,並將在算子優化與架構擴展方面持續演進。
作為連接 Spark 生態與原生加速的關鍵中間層,Apache Gluten 的進展同樣備受關注。來自 IBM 的莫芮與周淵聚焦 Apache Gluten與 Velox 的深度集成,闡述了其如何在大數據分析中驅動創新。他們介紹,Gluten 在保持對 Spark/Flink 作業透明加速能力的同時,正逐步增強對多後端引擎和複雜業務場景的適配能力。目前,該方案已在 Pinterest、順豐科技及多個內部集羣完成規模化驗證,有效支撐了從日誌分析到物流調度等多樣化負載的性能提升與成本優化。
隨着向量化加速在通用場景日趨成熟,針對特定存儲格式的深度優化成為新的效能突破口。騰訊大數據開發工程師陳錦海分享了微信基於 Velox 加速 lceberg 湖倉分析的優化與實踐,重點介紹了原生分桶方案。據他介紹,該方案通過動態識別表元信息自動設置分區數,能有效緩解 AQE 引發的寫入傾斜,結合空閒資源灰度發佈策略,可保障大規模作業的穩定上線。
紮根場景,釋放協同效能
午餐後的議程更加聚焦 Velox 在真實業務中的集成深度與生產韌性,迴應了開發者們對兼容性、穩定性與端到端效能等規模化落地的核心關切。
小米計算平台計算引擎負責人王勝傑分享了公司在 Spark 向量化升級中的規模化落地經驗。面對業務遷移中的兼容性與穩定性挑戰,他表示,小米通過自動兼容校驗、雙跑結果比對及內存異常感知的三級資源升級機制,已成功推動向量化改造在數十萬作業中平穩落地。
面對海量數據挑戰,全球科技公司也在探索相似的演進路徑。Meta 軟件工程經理 Stanley Yao 在演講中分享了公司基於 Velox 推進 Spark 向量化改造的整體策略。他表示,團隊通過從定製化方案到開源架構的持續演進,已實現關鍵業務管線向 Gluten(Flare)的平穩遷移,並獲得顯著的效率提升。未來,Meta 計劃進一步擴大該架構的應用規模。
在 CPU 向量化趨於普及的同時,利用異構硬件挖掘更高性能成為新的前沿。IBM 研究院資深軟件工程師 Zoltán Arnold Nagy 展示了基於 Velox 與 Presto 的 GPU 加速數據處理方案。他介紹道,Velox 通過與 cuDF 集成,可在 GPU 上高效執行算⼦,並針對多 GPU 分佈式場景優化通信與數據交換。此外,為突破 I/O 瓶頸,團隊正在探索結合 GPUDirect 存儲與緩存層的加速策略。
對性能與穩定性的追求,也驅動着查詢引擎架構本身的融合與創新。Meta 軟件工程師譚家梁與大家分享了 Native Presto-on-Spark 的規模化應用。該架構以 Presto 查詢優化、Spark 資源調度與容錯機制以及 Velox 原生向量化執行為核心,實現了性能與可靠性的顯著提升。他表示,目前該方案已在生產環境中取得成效,並將在未來持續推進全棧原生化演進。
對於國內龐大的雲上業務,Velox 同樣在支撐着關鍵數據服務平台。 阿里雲高級工程師王彬與範阿冬系統介紹了Velox在阿里雲日誌服務中的深度集成與應用。他們指出,基於 Velox 構建的高性能查詢引擎,通過混合執行、表達式下推、自動增量物化視圖及免 Schema 分析等核心技術,可顯著提升平台在處理海量實時數據時的查詢效率與資源利用率。他們還強調,該架構不僅為日誌分析、智能運維等場景提供了穩定支撐,也為面向 AI 的雲原生數據平台演進奠定了堅實基礎。
除了通用的日誌與湖倉分析,Velox 也在向更垂直的時序數據場景滲透。騰訊高級工程師李兆龍分享了基於 Velox 構建雲原生時序數據庫的落地經驗。他表示,通過在 Velox 中實現時序數據去重優化與存儲寫入增強,系統在應對高頻寫入與實時查詢場景時,可顯著提升吞吐效率與響應性能。目前該方案已有效支持物聯網、實時監控等業務場景,未來還將進一步完善緩存與壓縮機制,持續優化時序數據處理的整體效能。
IBM 軟件工程師劉平接着分享了 Velox 在 Iceberg 數據寫入能力上的突破性進展。他表示,目前 Velox 對 Iceberg 的支持以讀取為主,其寫入功能的完善將填補該方向的關鍵能力空白,為基於 Presto 與 Spark 的數據湖架構提供更統一、高效的數據攝入層。這一進展也標誌着 Velox 正從查詢加速向數據全鏈路處理拓展。
接着,來自阿里雲的畢巖與周滔分享了 Velox 與 Apache Paimon 深度集成的解決方案,為提升引擎與存儲的協同效率提供了另一種集成思路。在他們看來,現有方案存在表類型支持受限、缺乏可移植性等瓶頸, 但可以建立 C++ 原生 Paimon 庫,通過其統一的數據協議與插件化設計,使 Paimon 能夠被 Velox、StarRocks 等多種計算引擎直接高效調用,從而提升數據讀寫性能,併為湖倉格式的跨引擎協同提供新的基礎支撐。
在批處理場景之外,流計算框架的向量化也正成為新的熱點。螞蟻集團技術專家劉勇介紹了基於 Velox 為 Flink 構建的統一向量化執行引擎 Flex。他表示,Flink 作為流批一體架構的核心,其原生向量化能力的補足至關重要。Flex 通過將 Velox 的高性能算子能力引入 Flink,同時結合自動化驗證、可視化計劃與精細化回退機制,現已實現了作業性能的顯著提升,並支撐多條核心業務鏈路平穩運行。
隨着 Velox 賦能的應用場景日益廣泛和複雜,確保其在不同引擎和版本間的整體質量與可靠性變得至關重要。Meta 軟件工程師 Eric Liu 闡述了在 AI 數據基礎架構下,保障 Velox 多引擎版本可靠性的系統化方法。他指出,面對不同引擎與存儲格式交織帶來的複雜性,關鍵在於建立跨引擎測試框架與合成數據工廠。這一實踐能有效提前發現全棧潛在問題,從而確保底層變更在大規模生產環境中的穩定與高效。
針對向量化引擎中窗口運算符內存溢出的典型難題,來自英特爾的賈柯分享了她的見解。她認為,通過為 Velox 引入流式窗口處理機制,可使計算隨數據到達逐步執行並即時釋放內存,從而從架構層面化解多數場景下的內存風險,顯著提升複雜查詢的穩定性。
最後,小紅書 Native Engine 團隊技術負責人魏秀利也分享了向量化引擎在公司業務中規模化落地的經驗。據他介紹,通過將寫入異步化並構建原生 Avro 讀取能力,小紅書在不增加業務複雜度的前提下,成功緩解了端到端延遲,印證了“執行與存儲協同優化”在湖倉場景中的關鍵價值。
從底層執行引擎的持續創新,到日誌分析、湖倉寫入、流批融合等複雜場景的穩定運行,在本屆 VeloxCon China 上,我們看到 Velox 的技術價值已在真實業務中不斷被驗證和拓展。同時我們也很高興看到中國開發者成為這一進程的重要推動者。期待未來有更多志同道合者加入 Velox 開源社區,共建高性能分析基礎設施。
感謝各位的參與,我們 VeloxCon China 2026 再會❤️