tag DQN

標籤
貢獻1
4
02:52 PM · Dec 28 ,2025

@DQN / 博客 RSS 訂閱

爛漫樹林 - GBDT的損失函數是什麼

本文主要講解有關 Deep Q Network(DQN)算法的相關內容。 1. DQN 的基本思想 傳統的 Q-Learning 算法當 Q 表過大時不僅難以存儲而且難以搜索,並且當狀態是連續的話,用 Q 表存儲是不現實的,這時可以用一個函數來擬合 Q 表,所以提出了神經網絡和 Q-Learning 相融合的 Dee

機器學習 , 強化學習 , DQN , 神經網絡 , 人工智能 , deep q network , GBDT的損失函數是什麼

收藏 評論