錄製 視頻 過程中,視頻幀率視頻設置幀率為25, 而此時 從採集設備過來的 數據流也是25frame/s ,如是 我十分好奇音頻有沒有類似幀率一説,
百度到如下資料:感覺十分 清楚的説明了 該問題:
採樣率Sample Rate指單位時間內對媒體對象的採樣次數,單位Hz(這句話好像和原來不太一樣,鬱悶)。
幀率(Frame per second,fps),單位時間內媒體幀的個數。
這兩個概念都描述了媒體的“連續”性,二者的區別在於一個Frame可能包含多個Sample。一般每個視頻幀中只包含一個視頻採樣,而音頻幀中會包含多個音頻採樣。如1個AAC幀中包含1024個採樣。所以,幀率常用在視頻方面,採樣率常用於音頻方面。採樣率(幀率)越高,媒體越流暢,當然人的感受就越過癮。但是,由於人的視/聽器官分辨能力的侷限,往往這些數值達到末各程度就可以滿足人對“連續”性的需求了。比如,對採樣率高於44.1kHz的聲音,人很難聽出區別了。對幀率高於30的視頻,人很難看出幀率的區別。
比特率(bps或kbps),與前面兩個概念不同,它描述了單位時間長度的媒體內容需要空間。當然該值越高,每個採樣的信息量就越大,對這個採樣的描述就越精確。
對於人的感受來説,當然上述數值越大越好,但是這總是會受到網絡帶寬和處理設備能力的限制。所以,媒體工程師會取一個折中的數值來製作媒體內容,在符合能力的範圍內,提供最佳的體驗。
例子:一張CD,雙聲道,採樣率44.1kHz每個採樣13bit,時長74分鐘(4440秒),則CD的容量為13*2*44100*4440約等於640MB
這篇文章 如此剛好解釋了 為什麼配置 採集設備,聲音需要配置採樣率.
如果採用aac編碼:
1個AAC幀中包含1024個採樣.,對於採樣率為48K的音頻數據(1秒中需要編碼 48000/1024 = 46.87 個aac包, )所以可以計算:(對於為什麼 aac一次編碼需要1024個採樣 這個和aac算法的用1024個點的mdct).
音頻fps
duration = 1/fps;
對與 44K 採樣:
44100/1024= 43.0666(ms).
fps = 1024/44100 ~0.02321
對於用mp4v2 封裝為 mp4 文件的音視頻同步 問題. 只要控制好 音視頻的幀率,也會解決.