Nov 07 2025
MrVolleyball -
彩筆運維勇闖機器學習--決策樹
前言
決策樹是一種常用的機器學習模型,用於分類和迴歸任務,它通過模擬“樹”的結構來對數據進行決策。本節我們詳細討論的是決策樹中的分類任務
開始探索
scikit-learn
假設以下運維場景
CPU
低:40%
中:40%~70%
高:70%
內存
低:60%
中:60%~85%
高:85%
磁盤I/O
低:40%
機器學習
Nov 07 2025
MrVolleyball -
彩筆運維勇闖機器學習--隨機森林
前言
隨機森林的出現,是為了解決決策樹對訓練數據過擬合的問題而出現的。決策樹在訓練的工程中,可以讓每一個葉子節點的不確定性降為0(即熵或者基尼指數為0),這樣做可能把訓練數據中的偶然性、異常值或噪聲也當成了“規 律”去學習了
對於複雜高維的數據,隨機森林的算法可以更好的泛化能力
開始探索
scikit-learn
老規矩,先上代碼,看看隨機森林的用法
from sklearn.ensemble i
機器學習
Nov 07 2025
MrVolleyball -
彩筆運維勇闖機器學習--梯度下降法
前言
彩筆運維勇闖機器學習,今天我們來討論一下梯度下降法
梯度
首先要搞明白什麼是梯度,那就要先從導數説起
導數
函數\(y=f(x)\)的自變量\(x\)在一點\(x_0\)上產生一個增量\(\Delta x\)時,函數輸出值的增量\(\Delta y=f(x_0 + \Delta x)-f(x_0)\)與自變量增量\(\Delta x\)的比值在\(\Delta x\)趨於0時的極限\(a\)
機器學習
Nov 07 2025
MrVolleyball -
彩筆運維勇闖機器學習--lasso迴歸
前言
彩筆運維勇闖機器學習,今天我們來討論一下lasso迴歸,本期又是一起數學推理過程展示
座標下降法
目標找到一組參數,使目標函數值最小。比如\(f(x,y)=3x^2+5xy+10y^2\),要找到\(x,y\)使得\(f(x,y)\)取值最小
\[x_j^{(k+1)} = \arg \min_{x_j} f(x_1^{(k+1)}, \dots, x_{j-1}^{(k+1)}, x_j
機器學習
Nov 07 2025
MrVolleyball -
彩筆運維勇闖機器學習--GBDT
前言
本文討論的GBDT算法,也是基於決策樹
開始探索
scikit-learn
老規矩,先上代碼,看看GBDT的用法
from sklearn.datasets import load_iris
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.model_selection import train_tes
機器學習
Nov 07 2025
MrVolleyball -
彩筆運維勇闖機器學習--KNN算法
前言
彩筆運維勇闖機器學習:KNN算法,它也是分類中的一種
開始探索
scikit-learn
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
機器學習
Nov 07 2025
MrVolleyball -
彩筆運維勇闖機器學習--孤立森林
前言
孤立森林,一種非常高效快速的異常檢測算法
開始探索
scikit-learn
import numpy as np
import matplotlib.pyplot as plt
from sklearn.ensemble import IsolationForest
rng = np.random.RandomState(0)
X_train = 0.3 * rng.randn(100
機器學習