摘要 本項目的目標是使用深度學習來識別樂曲風格,如一首歌曲是流行樂還是搖滾樂。 我們將把樂曲特徵轉換為圖像數據,再利用 HuBERT 進行訓練,生成的模型可以存儲到你自己的 Hugging Face 帳號中。 本教程的 Jupyter 文件地址: https://openbayes.com/console/public/tutorials/ODwKxev36xS 本教程的視頻地址: h
摘要 本項目的目標是使用深度學習來檢測數字 0-9 的語音。 我們將利用深度學習技術,把語音文件轉譯為文本數據,例如把英語 three 的發音轉譯為文本 "three"。 我們將使用 TensorFlow/Keras 來創建模型、訓練模型,再使用測試數據評估它的性能。 本教程的 Jupyter 文件地址: https://openbayes.com/console/public/tutori