博客 / 詳情

返回

打破堆積困局:優化堆積條形圖的對比效果

在數據可視化中,堆積條形圖 擅長展示 “整體與構成” 的關係,但當每個柱子內的分段超過4個時,讀者很難同時追蹤各段的長度、位置與顏色映射, 誤讀概率顯著上升

更糟的是,若不同類別的總量差異很大,堆積結構會放大視覺錯覺,導致“看起來差不多”的結論失真。

今天,本文將嘗試探索一下改進堆積條形圖的呈現方式,讓複雜數據對比變得一目瞭然。

如果大家有更好的方式,也歡迎指教,交流。完整的代碼會在文末提供共享的地址。

1. 堆積條形圖的困境

堆積條形圖就像一道精心擺盤的多層蛋糕,當層數不多時,我們能輕鬆分辨每層的高度差異。

但當蛋糕層數超過4層,要比較某一特定口味在多個蛋糕中的含量就變得異常困難。

下面我們用Python模擬一個常見的堆積條形圖場景:調查某產品5個功能模塊的用户滿意度(5個維度),共收集了4個季度的數據。

# 模擬數據:4個季度,5個滿意度維度(強烈反對、反對、中立、同意、堅決同意)
quarters = ["第一季度", "第二季度", "第三季度", "第四季度"]
categories = ["強烈反對", "反對", "中立", "同意", "堅決同意"]
colors = ["#FF6B6B", "#FF9F6B", "#D6CBCB", "#6BCF7F", "#4D96FF"]

# 每個季度的滿意度分佈(百分比)
data = np.array(
    [
        [5, 10, 25, 40, 20],  # 第一季度
        [3, 8, 20, 45, 24],  # 第二季度
        [4, 12, 18, 43, 23],  # 第三季度
        [2, 6, 15, 50, 27],  # 第四季度
    ]
)

# 傳統橫向堆積條形圖
fig, ax = plt.subplots(1, 2, figsize=(14, 4), gridspec_kw={"width_ratios": [1, 1]})

# 左圖:傳統橫向堆積條形圖
# ... 省略 ...

# 右圖:橫向堆疊條形圖的改進版,添加分隔線
# ... 省略 ...

plt.tight_layout()
plt.show()

這個橫向堆積條形圖展示了每個季度用户滿意度的完整分佈,隨便右邊的圖稍微做了一些改進,

但如果我們想回答以下問題就會遇到困難:

  • "堅決同意" 的比例在哪個季度最高?
  • "反對""強烈反對" 的比例如何隨時間變化?

2. 拆解重構--多個子圖

與其把所有食材燉在一鍋裏,不如將它們分盤擺放。

我們將堆積條形圖拆解為5個小圖,每個小圖只關注一個滿意度維度的季度變化。

import matplotlib.gridspec as gridspec

fig = plt.figure(figsize=(12, 6))
gs = gridspec.GridSpec(2, 5, figure=fig, hspace=0.3, wspace=0.4)
# 拆解堆積條形圖:為每個類別創建單獨的橫向子圖
axes = []
for i in range(5):
    axes.append(fig.add_subplot(gs[0, i]))

# 為每個滿意度維度創建一個橫向條形圖
for i, (category, color, ax) in enumerate(zip(categories, colors, axes)):
    # ... 省略 ...

ax = fig.add_subplot(gs[1, :]) # 第1行,所有列 (等同於 gs[1, 0:5])
# ... 省略 ...

plt.show()

拆解後的圖表確實提升了單一維度的對比效果,但仍有一個明顯問題:我們的視線需要在多個圖表間來回跳躍,無法形成統一的視覺印象。

這就像閲讀一本分散在多個頁面的表格,需要不斷翻頁對照。

3. 雙向對比--蝴蝶圖

蝴蝶圖(也稱為人口金字塔圖或雙向條形圖)是數據可視化的"瑞士軍刀",特別適合展示對立或雙向比較的數據。

它的設計哲學是:讓對比在中心軸兩側自然展開,就像蝴蝶展開雙翅。

# 4. 創建畫布
fig, ax = plt.subplots(2, 1,figsize=(10, 6))
y_pos = np.arange(len(quarters))
# 拆分數據列
strongly_disagree = data[:, 0]
disagree          = data[:, 1]
neutral           = data[:, 2]
agree             = data[:, 3]
strongly_agree    = data[:, 4]

# ==========================================
# 核心邏輯修改:以中立(Neutral)的中心為0點
# ==========================================
# 1. 繪製中立 (灰色):跨越 0 軸
# left 從 -width/2 開始,這樣 0 就在正中間

# 2. 繪製左側 (負面情緒):向左堆疊
# 反對 (Green):起始位置在 -neutral/2 的左邊

# 強烈反對 (Purple):起始位置在 反對 的左邊

# 3. 繪製右側 (正面情緒):向右堆疊
# 同意 (Orange):起始位置在 neutral/2

# 強烈同意 (Red):起始位置在 同意 的右邊

# 5. 美化圖表
# 添加中間的基準線 (穿過中立條形)
# ... 省略 ...
plt.show()

蝴蝶圖和一般的堆積條形圖放在一起,可以明顯看出兩者在數據展示邏輯和視覺重心上有顯著區別。

蝴蝶圖側重於展示 “對立態度的對比”,適合看正反兩面的力量懸殊以及整體的情緒傾向,而且也便於比較同側的數據。

4. 總結

總之,堆積條形圖像一鍋大雜燴,當食材(數據維度)過多時,我們很難品嚐(分析)到每種食材的原味。

通過拆解和重構,我們獲得了更清晰的視角。而蝴蝶圖則像一位優雅的舞者,將對比數據以對稱的方式展開,既保留了整體視野,又強化了局部對比。

優秀的數據可視化不在於展示所有信息,而在於以最少的認知成本傳達最多的洞察。

下次當我們面對多維數據對比的挑戰時,不妨試試橫向蝴蝶圖這把"瑞士軍刀",它可能會給你帶來意想不到的清晰與美感。

繪製文中圖像的完整代碼共享在:優化堆積條形圖.ipynb (訪問密碼: 6872)

user avatar
0 位用戶收藏了這個故事!

發佈 評論

Some HTML is okay.