AVFrame 音頻幀數據的大小詳情 - AVFrame 音頻幀數據的大小,音視頻,幀率,採樣率,音視頻,計算機視覺,人工智能 IT劍客風雲博客

錄製視頻過程中,視頻幀率視頻設置幀率為25, 而此時從採集設備過來的數據流也是25frame/s ,如是我十分好奇音頻有沒有類似幀率一説,

百度到如下資料:感覺十分清楚的説明了該問題:

採樣率Sample Rate指單位時間內對媒體對象的採樣次數，單位Hz（這句話好像和原來不太一樣，鬱悶）。

    幀率（Frame per second，fps），單位時間內媒體幀的個數。

   這兩個概念都描述了媒體的“連續”性，二者的區別在於一個Frame可能包含多個Sample。一般每個視頻幀中只包含一個視頻採樣，而音頻幀中會包含多個音頻採樣。如1個AAC幀中包含1024個採樣。所以，幀率常用在視頻方面，採樣率常用於音頻方面。採樣率（幀率）越高，媒體越流暢，當然人的感受就越過癮。但是，由於人的視/聽器官分辨能力的侷限，往往這些數值達到末各程度就可以滿足人對“連續”性的需求了。比如，對採樣率高於44.1kHz的聲音，人很難聽出區別了。對幀率高於30的視頻，人很難看出幀率的區別。

    比特率（bps或kbps），與前面兩個概念不同，它描述了單位時間長度的媒體內容需要空間。當然該值越高，每個採樣的信息量就越大，對這個採樣的描述就越精確。

    對於人的感受來説，當然上述數值越大越好，但是這總是會受到網絡帶寬和處理設備能力的限制。所以，媒體工程師會取一個折中的數值來製作媒體內容，在符合能力的範圍內，提供最佳的體驗。

例子：一張CD，雙聲道，採樣率44.1kHz每個採樣13bit，時長74分鐘（4440秒），則CD的容量為13*2*44100*4440約等於640MB

這篇文章如此剛好解釋了為什麼配置採集設備,聲音需要配置採樣率.

如果採用aac編碼:

1個AAC幀中包含1024個採樣.,對於採樣率為48K的音頻數據(1秒中需要編碼 48000/1024 = 46.87 個aac包, )所以可以計算:(對於為什麼 aac一次編碼需要1024個採樣這個和aac算法的用1024個點的mdct).

音頻fps

duration = 1/fps;

對與 44K 採樣:

44100/1024= 43.0666(ms).
fps =  1024/44100 ~0.02321

對於用mp4v2 封裝為 mp4 文件的音視頻同步問題. 只要控制好音視頻的幀率,也會解決.

本文章為轉載內容，我們尊重原作者對文章享有的著作權。如有內容錯誤或侵權問題，歡迎原作者聯繫我們進行內容更正或刪除文章。

IT劍客風雲博客

IT劍客風雲博客

博客 / 詳情

AVFrame 音頻幀數據的大小

發佈評論

Product

Company

Support

Company

博客 / 詳情

AVFrame 音頻幀數據的大小

發佈 評論

發佈評論