Audiblez - 從電子書生成有聲讀物 - News Detail

Audiblez 使用 Kokoro 的高質量語音合成技術,將普通.epub電子書轉換為.m4b有聲讀物。

Kokoro-82M 是一款近期發佈的文本轉語音模型,僅包含 8200 萬個參數,輸出的聲音非常自然。該模型基於 Apache 許可證發佈,並使用不到 100 小時的音頻進行訓練。目前支持以下語言:🇺🇸 🇬🇧 🇪🇸 🇫🇷 🇮🇳 🇮🇹 🇯🇵 🇧🇷 🇨🇳

在 Google Colab 的 T4 GPU 上通過 Cuda,將 Orwell 的《Animal's Farm》(約 160,000 個字符)轉換為有聲讀物大約需要 5 分鐘,速度約為每秒 600 個字符。

項目作者實測,在其 M2 MacBook Pro 上使用 CPU 運行時,耗時約 1 小時,轉換速率約為每秒 60 字符。