期望、方差是統計學中的核心概念,廣泛應用於機器學習的模型評估、特徵分析、正則化方法等領域。以下是對它們的系統講解,包括定義、性質、計算方法及實際應用
一、期望(Expectation)
1. 定義
期望是隨機變量在大量實驗中的“平均值”,用於描述其中心趨勢。
- 離散隨機變量
:
- 連續隨機變量
:
其中 是概率密度函數(PDF)。
2. 性質
- 線性性:
(
為常數)。
。
- 獨立性:若
和
獨立,則
。
- 條件期望:
(全期望公式)。
3. 示例
- 伯努利分佈(
):
- 正態分佈(
):
4. 機器學習中的應用
- 損失函數優化:如均方誤差(MSE)的期望最小化。
- 隨機梯度下降(SGD):通過期望分析收斂性。
- 貝葉斯估計:後驗分佈的期望作為參數估計。
二、方差(Variance)
1. 定義
方差衡量隨機變量圍繞期望的離散程度:
- 離散隨機變量:
- 連續隨機變量:
2. 性質
- 非負性:
。
- 縮放性:
。
- 獨立性:若
和
獨立,則
。
- 標準差:
。
3. 示例
- 伯努利分佈:
- 正態分佈:
4. 機器學習中的應用
- 模型評估:高方差可能表示過擬合。
- 正則化:L2正則化通過限制參數方差防止過擬合。
- 集成學習:Bagging通過降低方差提升泛化能力。