概念原理
技術特性
比較不同聲音編碼格式的比特率、采樣率與延遲性。
Opus可以處理各種音頻應用,包括IP語音、視頻會議、游戲內聊天、流音樂、甚至遠程現場音樂表演。它可以從低比特率窄帶語音擴展到非常高清音質的立體聲音樂。支持的功能包括:
-
6 kb/秒到510 kb/秒的比特率;單一頻道最高256 kb/秒
-
采樣率從8 kHz(窄帶)到48 kHz(全頻)
-
幀大小從2.5毫秒到60毫秒
-
支持恆定比特率(CBR)、受約束比特率(CVBR)和可變比特率(VBR)
-
支持語音(SILK層)和音樂(CELT層)的單獨或混合模式
-
支持單聲道和立體聲;支持多達255個音軌(多數據流的幀)
-
可動態調節比特率,音頻帶寬和幀大小
-
良好的魯棒性丟失率和數據包丟失隱藏(PLC)
-
浮點和定點實現
優點特色
150毫秒以下的單向延遲是大多數VoIP系統的首選目標,使自然對話與轉向受到延遲的影響很小。音樂家通常會感覺到高達約30毫秒音頻延遲的時間,大致符合Haas效果的融合時間,盡管將每個用戶自己的樂器的播放延遲與往返延遲相匹配也可以有所幫助。音頻╱視頻同步,約45-100毫秒的音頻延遲可能是可以接受的。
Opus允許減少質量或提高比特率以實現更小的算法延遲(最小5.0 ms)。雖然參考實現的默認Opus幀為20.0 ms長,但SILK層需要進一步5.0 ms的前瞻加1.5 ms進行重采樣,默認延遲為26.5 ms。當CELT層處於活動狀態時,默認情況下,為了與SILK層同步,窗口重疊需要2.5 ms的前視,其中添加了4.0 ms的匹配延遲。如果編碼器在特殊限制低延遲模式下實例化,則刪除4.0 ms匹配延遲,並禁用SILK層,允許5.0 ms的最小算法延遲。
參考文檔: