1 為什麼要進行特徵編碼? 我們拿到的數據通常比較髒亂,可能會帶有各種非數字特殊符號,比如中文。下面這個表中顯示了我們最原始的數據集。而實際上機器學習模型需要的數據是數字型的,因為只有數字類型才能進行計算。因此,對於各種特殊的特徵值,我們都需要對其進行相應的編碼,也是量化的過程。 2 特徵編碼類型 本篇,我們主要説一下分類型特徵的編碼方式。對於分類型數據