凡事應該儘量簡單,直到不能再簡單為止。
維度建模簡介
一、用於度量的事實表
1.應該儘量將來源於同一個業務過程的底層度量結果存儲於一個維度模型中。
2.事實表中的每一行對應一個度量事件。每行中的數據是一個特定級別的細節數據,稱為粒度。
物理世界的每一個度量事件與對應的事實錶行具有一對一的關係,這一思想是維度建模的基本原則。
3.事實表包含多個外鍵,外鍵集合成主鍵,所以事實表的主鍵常稱為組合鍵。
二、用於環境描述的維度表
1.數據倉庫的好壞直接取決於維度屬性的設置。
2.每個維度表由單一主鍵定義,用於在與事實表連接操作時作為參照完整性的基礎。
3.維度表通常以層次關係表示。
4.關注維度表的簡單性和可訪問性,不需要滿足第三範式,也儘量減少雪花模式。
三、維度表與事實表的連接
1.每個業務過程包含事實表,圍繞事實表的是多個維度表,採用星形連接。
2.粒度最小的數據或原子數據具有最多的維度。
Kimbal的DW/BI架構
1.數據清洗
消除拼寫錯誤、解決領域衝突、處理錯誤的元素、解析為標準格式等。
2.建立維度表
代理鍵分配、查找代碼以提供適當的描述、拆分或組合列以提供適當的數據值、連接滿足第三範式的數據表成為扁平的不滿足規範化要求的維度等。
怎樣去實施維度模型
根據企業的所有業務過程,以及相關的主要的描述性維度數據。構建出企業數據倉庫總線矩陣。
1.模型中必須包含詳細的原子數據。
2.必須使用公共的、一致性的維度建立維度結構。
3.對組織業務過程的徹底理解是提高效率和隨後的可執行的基礎,優先處理具有最大影響和可行性最高的業務過程。
4.健壯的維度是建立健壯的DW/BI系統的基礎,考慮描述業務的中心名詞,針對這些名詞開發一致性維度。