HTML5實時語音通話聊天,MP3壓縮傳輸3KB每秒


自從Recorder H5 GitHub開源庫優化后,對邊錄邊轉碼成小語音片段文件實時上傳服務器這種操作支持非常良好,因此以前不太好支持的H5語音通話已經有了更好的突破空間。因此花了兩晚時間打造了一個H5語音通話聊天的demo。

歡迎在線把玩:https://xiangyuecn.github.io/Recorder/

webrtc

一、把玩方法

  1. 准備局域網內兩台設備(Peer A、Peer B)用最新版本瀏覽器(demo未適配低版本)分別打開demo頁面(也可以是同一瀏覽器打開兩個標簽)
  2. 勾選頁面中的H5版語音通話聊天,在Peer A中點擊新建連接
  3. 把Peer A的本機信手動復制傳輸給Peer B,粘貼到遠程信息中,並點擊確定連接
  4. 把Peer B自動生成的本機信息手動復制傳輸給Peer A,粘貼到遠程信息中,並點擊確定連接
  5. 雙方P2P連接已建立,使用頁面上方的錄音功能,隨時開啟錄音,音頻數據會實時發送給對方

局域網H5版對講機😂

二、技術特性

(1)數據傳輸

github demo中考慮到減少對服務器的依賴,因此采用了WebRTC P2P傳輸功能,無需任何服務器支持即可實現局域網內的兩個設備之間互相連接,連接代碼也算簡單。有服務器支持可能就要逆天了,不過代碼也會更復雜。

如果正式使用,可能不太會考慮使用WebRTC,用WebSocket通過服務器進行轉發可能是最佳的選擇。

WebRTC局域網P2P連接要點(實際代碼其實差不多,只不過多做了點兼容):

/******Peer A(本機)******/
var peerA=new RTCPeerConnection(null,null)

//開啟會話,等待遠程連接
peerA.createOffer().then(function(offer){
	peerA.setLocalDescription(offer);
	peerAOffer=offer;
});

var peerAICEList=[......] //通過peerA.onicecandidate監聽獲得所有的ICE連接信息候選項,如果有多個網絡適配器,就會有多個候選

//創建連接通道對象,A端通過這個來進行數據發送
var peerAChannel=peerA.createDataChannel("RTC Test");



/******Peer B(遠程)******/
var peerB=new RTCPeerConnection(null,null)

//連接到Peer A
peerB.setRemoteDescription(peerAOffer);

//開啟應答會話,等待Peer A確認連接
peerB.createAnswer().then(function(answer){
	peerB.setLocalDescription(answer);
	peerBAnswer=answer;
});

//把Peer A的連接點都添加進去
peerB.addIceCandidate(......peerAICEList)

var peerBICEList=[......] //通過peerB.onicecandidate監聽獲得所有的ICE連接信息候選項,如果有多個網絡適配器,就會有多個候選

var peerBChannel=... //通過peerB.ondatachannel得到連接通道對象,B端通過這個來進行數據發送


/*******最終完成連接********/
//連接到Peer B
peerA.setRemoteDescription(peerBAnswer);

//把Peer B的連接點都添加進去
peerA.addIceCandidate(......peerBICEList)

/*
peerA peerB分別等待peerA/BChannel.onopen回調即完成P2P連接
,然后通過監聽peerA/BChannel.onmessage獲得對方發送的信息
,通過peerA/BChannel.send(data) 發送數據。
*/

(2)音頻采集和編碼

由於是在我的Recorder庫中新加的demo,因此音頻采集和編碼都是現成的,Recorder庫有好的兼容性和穩定性,因此節省了最大頭的工作量。

編碼最佳使用MP3格式,因為此格式已優化了實時編碼性能,可做到邊錄邊轉碼,16kbps 16khz的情況下可做到2kb每秒的文件大小,音質還可以,實時傳輸時為3kb每秒,15分鍾大概3M的流量。

用wav格式也可以,不過此格式編碼出來的數據量太大,16位 16khz接近50kb每秒的實時傳輸數據,15分鍾要37M多流量。其他格式由於暫未對實時編碼進行優化,使用中會導致明顯卡頓。

降噪、靜音檢測等高級功能是沒有的,畢竟是非專業人員😂 要求高點可以,但不要超出范圍太多啦。

(3)音頻實時接收和播放

接收到一個音頻片段后,本應該是立即播放的,但由於編碼、網絡傳輸導致的延遲,可能上個片段還未播放完(甚至未開始播放),因此需要緩沖處理。

因為存在緩沖,就需要進行實時同步處理,如果緩沖內積壓了過多的音頻片段,會導致語音播放滯后太多,因此需要適當進行對數據進行丟棄,實測發現網絡正常、設備性能靠譜的情況下基本沒有丟棄的數據。

然后就是播放了,本應是播完一個就播下一個,測試發現這是不靠譜的。因為結束一個片段后再開始播放下一個發出聲音,這個過程會中斷比較長時間,明顯感覺得出來中間存在短暫停頓。因此必須在片段未播完時准備好下一個片段的播放,並且提前開始播放,達到抹掉中間的停頓。

我寫了兩個播放方式:

  1. 實時解碼播放
  2. 雙Audio輪換播放

最開始用一個Audio停頓感太明顯,因此用兩個Audio輪換抹掉中間的停頓,但發現不同格式Auido播放差異巨大,播放wav非常流暢,但播放mp3還是存在停頓(后面用解碼的發現是得到的PCM時長變長了,導致事件觸發會出現誤差,為什么會變長?怪異)。

因此后面寫了一個解碼然后再播放,mp3這次終於能正常連續播放了,wav格式和雙Audio的播放差異不大。實時解碼里面也用到了雙Audio中的技巧,其實也是用到了兩個BufferSource進行類似的輪換操作,以抹掉兩個片段間的停頓。

不過最終播放效果還是不夠好,音質變差了點,並且多了點噪音。如果有現成的播放代碼拿過來用就就好了。

三、應用場景

  1. 數據傳輸改成WebSocket,做個仿微信語音通話H5版還是可以的(受限於Recorder瀏覽器支持)
  2. 局域網H5版對講機(前端玩具)
  3. ......沒有想到

完。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM