博客 / 列表

MrVolleyball - 彩筆運維勇闖機器學習--決策樹

前言 決策樹是一種常用的機器學習模型,用於分類和迴歸任務,它通過模擬“樹”的結構來對數據進行決策。本節我們詳細討論的是決策樹中的分類任務 開始探索 scikit-learn 假設以下運維場景 CPU 低:40% 中:40%~70% 高:70% 內存 低:60% 中:60%~85% 高:85% 磁盤I/O 低:40%

機器學習

MrVolleyball - 彩筆運維勇闖機器學習--隨機森林

前言 隨機森林的出現,是為了解決決策樹對訓練數據過擬合的問題而出現的。決策樹在訓練的工程中,可以讓每一個葉子節點的不確定性降為0(即熵或者基尼指數為0),這樣做可能把訓練數據中的偶然性、異常值或噪聲也當成了“規 律”去學習了 對於複雜高維的數據,隨機森林的算法可以更好的泛化能力 開始探索 scikit-learn 老規矩,先上代碼,看看隨機森林的用法 from sklearn.ensemble i

機器學習

MrVolleyball - 彩筆運維勇闖機器學習--梯度下降法

前言 彩筆運維勇闖機器學習,今天我們來討論一下梯度下降法 梯度 首先要搞明白什麼是梯度,那就要先從導數説起 導數 函數\(y=f(x)\)的自變量\(x\)在一點\(x_0\)上產生一個增量\(\Delta x\)時,函數輸出值的增量\(\Delta y=f(x_0 + \Delta x)-f(x_0)\)與自變量增量\(\Delta x\)的比值在\(\Delta x\)趨於0時的極限\(a\)

機器學習

MrVolleyball - 彩筆運維勇闖機器學習--lasso迴歸

前言 彩筆運維勇闖機器學習,今天我們來討論一下lasso迴歸,本期又是一起數學推理過程展示 座標下降法 目標找到一組參數,使目標函數值最小。比如\(f(x,y)=3x^2+5xy+10y^2\),要找到\(x,y\)使得\(f(x,y)\)取值最小 \[x_j^{(k+1)} = \arg \min_{x_j} f(x_1^{(k+1)}, \dots, x_{j-1}^{(k+1)}, x_j

機器學習

MrVolleyball - 彩筆運維勇闖機器學習--GBDT

前言 本文討論的GBDT算法,也是基於決策樹 開始探索 scikit-learn 老規矩,先上代碼,看看GBDT的用法 from sklearn.datasets import load_iris from sklearn.ensemble import GradientBoostingClassifier from sklearn.model_selection import train_tes

機器學習

MrVolleyball - 彩筆運維勇闖機器學習--KNN算法

前言 彩筆運維勇闖機器學習:KNN算法,它也是分類中的一種 開始探索 scikit-learn import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler

機器學習

MrVolleyball - 彩筆運維勇闖機器學習--孤立森林

前言 孤立森林,一種非常高效快速的異常檢測算法 開始探索 scikit-learn import numpy as np import matplotlib.pyplot as plt from sklearn.ensemble import IsolationForest rng = np.random.RandomState(0) X_train = 0.3 * rng.randn(100

機器學習