Triton 是一種用於並行編程的語言和編譯器。它旨在提供一個基於 Python 的編程環境,以高效編寫自定義 DNN 計算內核,並能夠在現代 GPU 硬件上以最大吞吐量運行。
更多 Triton 中文文檔可訪問 →triton.hyper.ai/
triton.language.make_block_ptr(base: tensor, shape, strides, offsets, block_shape, order)
返回指向父張量中 1 個塊的指針。
參數**:**
- base - 父張量的基礎指針。
- shape - 父張量的形狀。
- strides - 父張量的步幅。
- offsets - 塊的偏移量。
- block_shape - 塊的形狀。
- order - 原始數據格式的順序。