隨着 AI 模型規模不斷攀升,開發者和工程團隊對計算性能、資源利用率和執行效率的要求也愈發嚴格。也正因如此,AI 編譯器正在成為硬件與應用之間的關鍵樞紐,為訓練與推理提供高效執行和智能算力調度。
在這一趨勢下,業內對前沿技術交流與最佳實踐分享的需求也隨之升温。越來越多的團隊希望通過面對面的深入討論,探索算力優化的新方法、驗證落地路徑、並從真實場景中汲取經驗。
一直以來,由 HyperAI超神經主辦的 Meet AI Complier 技術沙龍,匯聚科研機構、企業內的專家學者與一線工程師,從技術創新聊到應用攻堅,為大家搭建了交流平台。今年 7 月,北京站的第 7 期 Meet AI Compiler 技術沙龍圓滿落幕,現場熱烈討論不斷,技術乾貨引發持續互動!
12 月 27 日,第 8 期 Meet AI Compiler 如約而至。 本期我們邀請了來自上海創智學院、TileAI 社區、華為海思、先進編譯實驗室等的多位專家,他們將帶來從軟件棧設計、算子開發到性能優化的全鏈路分享,內容涵蓋 TVM 的跨生態互操作、PyPTO 的融合算子優化、TileRT 的低延遲系統、Triton 的多架構加速,呈現從理論到落地的完整技術路徑。
報名已開啓,席位有限~快來現場蹭乾貨,我們在上海等你!🫶
活動詳情
⏰ 時間:12 月 27 日(週六)13:30-17:30
📍 地點:上海市徐彙區華髮路 699 弄 3 號上海創智學院
👬 人數:150(現場座位有限,請儘早報名)
🙌🏻 報名鏈接:https://hdxu.cn/1CupU
嘉賓及議程
分享嘉賓
13:40-17:20
分享主題: TVM FFI: Open ABI and FFI for Machine Learning Systems
內容簡介: TVM FFI 旨在解決機器學習系統生態割裂與互操作性難題。通過定義開放的 ABI 和 FFI 標準,該項目利用穩定的 C ABI 及 DLPack 實現零拷貝數據傳遞,打通了 PyTorch 等框架與底層編譯器的連接。它支持跨語言高效調用,顯著降低了多平台適配的工程成本。
觀看本場分享,你將瞭解:
-
學習 TVM-FFI 通用標準,大幅降低跨語言 Mlsys 開發維護成本
-
瞭解並構建兼容未來的模塊化 ML 生態
分享主題: TileRT:面向低延遲大模型推理的軟硬件探索
內容簡介: 隨着大模型跨入萬億參數,處理序列跨過百萬 token,模型能力正在不斷打破各項記錄。然而,人們對模型極致計算速度的追求從未停止。一方面許多低延遲場景需要在秒級甚至毫秒級得到響應,如實時決策、博弈等場景;另一方面大模型訓練進入 Agent 時代,超長序列的 rollout 時間成為主要瓶頸。
本報告介紹 TileRT 項目,從 AI 編譯器、runtime、到架構設計的角度,思考如何構建針對極低延遲的大模型計算軟件棧。
觀看本場分享,你將瞭解:
-
瞭解大模型低延遲推理場景背景、重要性和未來展望
-
TileRT 的技術挑戰與實踐分享
分享主題: PyPTO:基於白盒編譯的融合算子開發框架
內容簡介: 本次分享聚焦華為新推出的融合算子開發框架 PyPTO。它基於 Tensor/Tile 編程範式,通過聚焦核內 SRAM 管理、跨平台 PTO 指令集和 MPMD 運行時等技術,結合 Human-In-The-Loop 調優,以白盒編譯方式實現高性能與易用性的統一。
觀看本場分享,你將瞭解:
-
掌握原生為 SIMD 架構設計的融合算子開發框架 PyPTO 的設計理念與核心架構
-
掌握 PyPTO 聚焦於發揮用户的專家經驗的白盒編譯思想與 Human-In-The-Loop 調優精髓
-
掌握利用 PyPTO 提供的可視化工具,快速在昇騰平台開發出高性能融合算子的完整流程
分享主題: 面向 Triton 編譯器的編譯優化實踐
內容簡介: 本次分享聚焦面向 Triton 編譯器的優化實踐,系統介紹 Triton 的語言與編譯器結構、生態演進與算子庫開發方法,並深入覆蓋 CPU、NPU、GPU 等多架構的關鍵優化技巧,展示構建高性能統一算子體系的完整路徑。
觀看本場分享,你將瞭解:
-
Triton 生態的最新進展
-
Triton 編譯器在多架構(CPU/NPU/GPU)上的關鍵優化技術
主辦方及合作伙伴
HyperAI超神經(hyper.ai)作為國際領先的人工智能及高性能計算社區, 旨在通過提供行業資訊報道、數據集加速下載、在線教程演示、熱門模型性能評測、前沿論文推薦、高價值成果解讀、頂會日曆集成等一系列服務,助力全球數據科學及⼈⼯智能⾏業的開發者及愛好者學習、理解、實踐,與社區⼀起構建⼈⼯智能的未來。
訪問官網: https://hyper.ai/
OpenBayes貝式計算是國內領先的高性能計算服務提供商,通過為新一代異構芯片嫁接經典軟件生態及機器學習模型,進而為工業企業及高校科研提供更加快速、易用的數據科學計算產品,其產品已被數十家大型工業場景或頭部科研院所所採用。
訪問官網: https://openbayes.com/
上海創智學院是匯聚頂尖大學、頭部企業和科研機構聯袂建設的新型人才培養機構。學院堅持「以學生為中心、以前沿為牽引」的培養理念,通過超高規格的師資、超常措施的培養、超凡條件的保障,探索具有中國特色的 AI 領軍人才培養方案,致力於培養中國 AI 領軍人才,打造世界人工智能創新高地。
MLC.AI 社區成立於 2022 年 6 月,並由 Apache TVM 主要發明者、機器學習領域著名的青年學者陳天奇,帶領團隊上線了 MLC 線上課程,系統介紹了機器學習編譯的關鍵元素以及核心概念。
2022 年 11 月,在 MLC.AI 社區志願者的共同努力下,首個完整的 TVM 中文文檔上線,併成功託管至 HyperAI超神經官網,進一步為對機器學習編譯感興趣的國內開發者,提供了接觸並學習一門新技術的基礎設置——文檔。
MLC 線上課程: https://mlc.ai/
TVM 中文文檔: https://tvm.hyper.ai/
活動支持
考慮到本場活動的場地空間情況,我們僅開放了 150 個到場名額,建議大家儘早報名鎖定席位。
12 月 27 日 13:30-17:30,我們不見不散!