現象:k3s核心組件狀態均為CrashLoopBackOff
原因分析: 網絡問題,容器網絡重建失敗或 iptables 丟失,無法訪問API-server
產生原因:虛擬機掛起,重新打開會對網絡產生一定的影響
#k3s日誌報錯:
failed to "StartContainer" for "coredns" with CrashLoopBackOff
...
unable to retriev
先放結論,Prometheus中採集的原始指標無法直接表示CPU使用率,需要通過promQL語言二次計算,計算公式如下:
sum by(instance)(rate(node_cpu_seconds_total{mode!="idle"}[15s])) / sum by(instance)(rate(node_cpu_seconds_total[15s]))
該公式的計算原理與top命令中計算cp