VoIP網關設備中,常用的編碼有G.711-uLaw、G.711-aLaw、G.723-53k、G.723-63k、G729
其中,G.711和G.729是企業VoIP部署中非常流行的兩種編解碼器。與通過G.729編碼的語音流相比,G.711音質表現出色。G.711通常用於不存在帶寬問題的LAN環境,帶寬需求約為80kbps,其中包括開銷帶寬。
G.729通常用於帶寬有限的WAN環境,帶寬需求約為30kbps。
G.711是語音模擬信號的一種非線性量化,細分有二種:G.711 A-law 和 G.711 u-law。不同的國家和地方都會選取一種作為自己的標准。G.711 bitrate 是64kbps。詳細的資料可以在ITU 上下到相關的spec,下面主要列出一些性能參數:
G.711(PCM方式:PCM=脈碼調制 :Pulse Code Modulation)
采樣率:8kHz
信息量:64kbps/channel
理論延遲:0.125msec
品質:MOS值4.10
G.723.1是一個雙速率的語音編碼器,是ITU-T建議的應用於低速率多媒體服務中語音或其它音頻信號的壓縮算法;其目標應用系統包括H.323、H.324等多媒體通信系統,目前該算法已成為IP電話系統中的必選算法之一;編碼器的幀長為30ms,還有7.5ms的前瞻,編碼器的算法時延為37.5ms;編碼器首先對語音信號進行傳統電話帶寬的濾波(基於G.712),再對語音信號用傳統8000-Hz速率進行抽樣(基於G.711),並變換成16 bit線性PCM碼作為該編碼器的輸入。
在解碼器中對輸出進行逆操作來重構語音信號;高速率編碼器使用多脈沖最大似然量化(MP-MLQ),低速率編碼器使用代數碼激勵線性預測(ACELP)方法,編碼器和解碼器都必須支持此兩種速率,並能夠在幀間對兩種速率進行轉換。此系統同樣能夠對音樂和其他音頻信號進行壓縮和解壓縮,但它對語音信號來說是最優的;采用了執行不連續傳輸的靜音壓縮,這就意味着在靜音期間的比特流中加入了人為的噪聲。除了預留帶寬之外,這種技術使發信機的調制解調器保持連續工作,並且避免了載波信號的時通時斷。
G.729采用的算法是共軛結構的代數碼激勵線性預測(CSACELP),是基於CELP編碼模型的算法;能夠實現很高的語音質量(長話音質)和很低的算法延世;算法幀長為10ms,編碼器含5ms前瞻,算法時延15ms;其重建語音質量在大多數工作環境下等同於32kb/s的ADPCM(G.726),MOS分大於4.0;編碼時輸入16bitPCM語音信號,輸出2進制比特流;譯碼時輸入為2進制比特流,輸出16bitPCM語音信號;在語音信號8KHz取樣的基礎上,16bit線性PCM后進行編碼,壓縮后數據速率為8Kbps;具有相當於16:1的壓縮率。
G.729系列在當前的VOIP得到廣泛的應用,且相關分支較多,可以直接從ITU網上得到source code和相關文檔。
G.729(CS-ACELP方式:Conjugate Structure Algebraic Code Excited Linear Prediction)
采樣率:8kHz
信息量:8kbps/channel
幀長:10msec
理論延遲:15msec
品質:MOS值3.9
注:MOS值常以衡量通信系統語音質量的重要指標,0分代表最差的質量,5分為最高分