tag 訓練平台

標籤
貢獻1
0
05:24 AM · Dec 25 ,2025

@訓練平台 / 博客 RSS 訂閱

數據與後端架構提升之路 - TeleTron項目技術優化原理之上下文並行技術

前言 TeleTron是基於Megatron-LM二開的項目主要對視頻訓練做了大量優化 1.Ulysses Context Parallel (上下文並行)原理 下面的例子主要展示的是 Image Tokens(最複雜的部分)。 TeleTron 中 DiT 模型處理長序列的核心機制:如何通過 SeqAllToA

機器學習 , 訓練平台 , 數據 , MySQL , 表數據 , 數據庫 , 人工智能

收藏 評論