這篇文章的初衷,是記錄拜讀由Nathan Bronson, Aleksey Charapko, Abutalib Aghayev, and Timothy Zhu共同發表的論文Metastable Failures in Distributed Systems的收穫,這篇論文描述了一個在大規模分佈式系統中很常見的失敗場景:亞穩定失敗(metastable failures),它們為什麼通常在高負載