opus編解碼的特色和優點

本文轉載自查看原文 2022-04-20 10:20 809

概念原理

Opus是一個有損音頻壓縮的數字音頻編碼格式，由Xiph.Org基金會開發，之后由互聯網工程任務組（IETF）進行標准化，目標是希望用單一格式包含聲音和語音，取代Speex和Vorbis，且適用於網絡上低延遲的即時聲音傳輸，標准格式定義於RFC 6716文件。Opus格式是一個開放格式，使用上沒有任何專利或限制。

Opus集成了兩種聲音編碼的技術：以語音編碼為導向的SILK和低延遲的CELT。Opus可以無縫調節高低比特率。在編碼器內部它在較低比特率時使用線性預測編碼在高比特率時候使用變換編碼（在高低比特率交界處也使用兩者結合的編碼方式）。Opus具有非常低的算法延遲（默認為22.5 ms），非常適合用於低延遲語音通話的編碼，像是網絡上的即時聲音流、即時同步聲音旁白等等，此外Opus也可以透過降低編碼比特率，達成更低的算法延遲，最低可以到5 ms。在多個聽覺盲測中，Opus都比MP3、AAC、HE-AAC等常見格式，有更低的延遲和更好的聲音壓縮率。

技術特性

比較不同聲音編碼格式的比特率、采樣率與延遲性。

Opus可以處理各種音頻應用，包括IP語音、視頻會議、游戲內聊天、流音樂、甚至遠程現場音樂表演。它可以從低比特率窄帶語音擴展到非常高清音質的立體聲音樂。支持的功能包括：

6 kb/秒到510 kb/秒的比特率；單一頻道最高256 kb/秒
采樣率從8 kHz（窄帶）到48 kHz（全頻）
幀大小從2.5毫秒到60毫秒
支持恆定比特率（CBR）、受約束比特率（CVBR）和可變比特率（VBR）
支持語音（SILK層）和音樂（CELT層）的單獨或混合模式
支持單聲道和立體聲；支持多達255個音軌（多數據流的幀）
可動態調節比特率，音頻帶寬和幀大小
良好的魯棒性丟失率和數據包丟失隱藏（PLC）
浮點和定點實現

優點特色

Opus在更高的比特率下，已被證明具有優異的音質，而它的音頻格式比AAC、HE-AAC和Vorbis更具有競爭力。

在64kbit / s的聽力測試中，與HE-AAC編解碼器相比，Opus表現出更優異的音質，HE-AAC由於使用了專利的頻譜帶復制（SBR）技術，這些編解碼器在以前占主導地位。在96 kbit / s的聽力測試中，Opus顯示出比Vorbis略高的音質，與AAC和MP3相比音質明顯更好。

Opus具有非常低的算法延遲，作為低音頻延遲通信鏈路一部分的必要性，可以在現場活動中允許自然對話，網絡音樂表演或對嘴表演。音頻格式的總算法延遲是無論處理速度和傳輸速度如編碼器和實況音頻流的解碼器必須承擔的延遲的總和，例如將音頻樣本緩沖到塊或幀中，允許窗口重疊和可能允許對噪聲整形在解碼器中先行和任何其他形式的先行的，或用於將MP3編碼器，使用的比特存儲器。

150毫秒以下的單向延遲是大多數VoIP系統的首選目標，使自然對話與轉向受到延遲的影響很小。音樂家通常會感覺到高達約30毫秒音頻延遲的時間，大致符合Haas效果的融合時間，盡管將每個用戶自己的樂器的播放延遲與往返延遲相匹配也可以有所幫助。音頻╱視頻同步，約45-100毫秒的音頻延遲可能是可以接受的。

Opus允許減少質量或提高比特率以實現更小的算法延遲（最小5.0 ms）。雖然參考實現的默認Opus幀為20.0 ms長，但SILK層需要進一步5.0 ms的前瞻加1.5 ms進行重采樣，默認延遲為26.5 ms。當CELT層處於活動狀態時，默認情況下，為了與SILK層同步，窗口重疊需要2.5 ms的前視，其中添加了4.0 ms的匹配延遲。如果編碼器在特殊限制低延遲模式下實例化，則刪除4.0 ms匹配延遲，並禁用SILK層，允許5.0 ms的最小算法延遲。

參考文檔：

1 https://zh.wikipedia.org/wiki/Opus_(%E9%9F%B3%E9%A2%91%E6%A0%BC%E5%BC%8F)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 從wav到Ogg Opus 以及使用java解碼OPUS 編解碼－marshalling Python 編解碼 Huffman樹及其編解碼 android pcm編解碼 netty之編解碼 Netty 編解碼奧秘 ffmpeg：編解碼過程，基本用法視頻編解碼基礎概念【GPU編解碼】GPU硬解碼---DXVA