Kubernetes通過Device Plugin機制實現GPU資源管理,其核心流程可分為四個階段: 設備發現與上報 NVIDIA GPU Device Plugin通過ListAndWatch API定期向kubelet彙報節點上的GPU設備列表(如GPU0/1/2) kubelet將GPU數量(nvidia.com/gpu:3)