Triton 是一種用於並行編程的語言和編譯器。它旨在提供一個基於 Python 的編程環境,以高效編寫自定義 DNN 計算內核,並能夠在現代 GPU 硬件上以最大吞吐量運行。

更多 Triton 中文文檔可訪問 →triton.hyper.ai/

triton.language.make_block_ptr(base: tensor, shape, strides, offsets, block_shape, order)

返回指向父張量中 1 個塊的指針。

參數**:**

  • base - 父張量的基礎指針。
  • shape - 父張量的形狀。
  • strides - 父張量的步幅。
  • offsets - 塊的偏移量。
  • block_shape - 塊的形狀。
  • order - 原始數據格式的順序。