此分類用於記錄吳恩達深度學習課程的學習筆記。
課程相關信息鏈接如下:
- 原課程視頻鏈接:[雙語字幕]吳恩達深度學習deeplearning.ai
- github課程資料,含課件與筆記:吳恩達深度學習教學資料
- 課程配套練習(中英)與答案:吳恩達深度學習課後習題與答案
本篇為第三課的第一週內容,1.5到1.7的內容。
本週為第三課的第一週內容,本週的內容關於在實際項目進行中的一些基本策略,並不涉及技術性的知識。
經過整個第一課和第二課後, 我們已經瞭解了足夠支持我們構建一個完整的基礎神經網絡項目的知識和技術,本週便是在這些基礎上的一個指導策略,可以幫助實現更好確定項目方向,優化和評估模型性能。
只要對前面兩課涉及的技術原理足夠了解,可以説,本週的內容不存在理解上的難度。
本篇的內容關於數據集設置,有很大一部分內容在之前已經提到過,所以篇幅會較短一些,並且我會在重複的部分進行標註。
1. 數據集劃分經驗(重複)
實際上,在之前的偏差與方差部分我們已經瞭解過這方面的內容,只是在本週的範疇裏,課程中再次強調了這一段,為了每一篇的邏輯完整一些,我們也簡單重複一下,就不佔用太多篇幅了。
2.確保測試集和訓練集來自同一分佈(重複)
3.何時更改驗證集和指標?
這部分是這幾節課程裏新補充的內容,課程裏把驗證集,測試集和指標的設置比作畫靶子,也就是任務的目標。
簡單舉個例子,就像上面説的,如果我們使用類似用户上傳的模糊照作為驗證集,以此不斷調優擬合,那説明我們的目標就是實現用户上傳的模糊圖像的正確分類。
再比如,如果是某種要求分辨可疑人員的模型,在上一篇提及的評估指標中,如果使用單一評估指標,那麼我們其實更傾向於使用召回率,因為這個任務的性質更偏向於”寧殺錯,不放過”。
現在,轉換一下這個標題:何時更改驗證集和指標?其實是在説:什麼現象讓我們發現自己的設置和目標不匹配?
這才是課程裏講述的內容,我們來展開課程裏的一個例子(這部分彈幕驟增):
因此,在這個例子中,真實應用發現指標的設置不能正確反應任務要求,因此,我們需要修改指標。
還有就是我們一直説的”高清貓“和”模糊貓”的問題,在那種情景下,真實應用發現驗證集,測試集不能正確實現任務目標,因此,我們需要修改驗證集和測試集。
這就是本篇的內容,幾乎沒有理解上的難度。下一篇就是本週內容的最後一篇,通過比較模型性能和人的表現討論模型優化的方向和空間,也有一些新的概念。