之前有大概介紹了音頻采樣相關的思路,詳情見《簡潔明了的插值音頻重采樣算法例子 (附完整C代碼)》。 音頻方面的開源項目很多很多。 最知名的莫過於谷歌開源的WebRTC, 其中的音頻模塊就包含有 AGC自動增益補償(Automatic Gain Control)自動調麥克風的收音量,使 ...
在一些特殊情況下,經常需要依據圖像中的人臉,對圖片進行傾斜矯正。 例如拍照角度幅度過大之類的情況,而進行人工矯正確實很叫人頭大。 那是不是可以有一種算法,可以根據人臉的信息對圖片進行角度的修復呢 答案肯定是確認的。 再次例如,想要通過人臉的特征對人物的表情和情緒進行精准判斷, 那么這個時候如果能確保人臉沒有發現嚴重傾斜,無疑對准確率判斷有一定的幫助。 那么假如一張圖片只有一個人臉,其實很好判斷,通 ...
2018-05-08 21:42 2 4888 推薦指數:
之前有大概介紹了音頻采樣相關的思路,詳情見《簡潔明了的插值音頻重采樣算法例子 (附完整C代碼)》。 音頻方面的開源項目很多很多。 最知名的莫過於谷歌開源的WebRTC, 其中的音頻模塊就包含有 AGC自動增益補償(Automatic Gain Control)自動調麥克風的收音量,使 ...
人臉檢測 識別一直是圖像算法領域一個主流話題。 前年 SeetaFace 開源了人臉識別引擎,一度成為熱門話題。 雖然后來SeetaFace 又放出來 2.0版本,但是,我說但是。。。 沒有訓練代碼,想要自己訓練一下模型那可就犯難了。 雖然可以閱讀源碼,從前向傳播的角度,反過來實現訓練代碼 ...
以及普通照明陰影中的效果都明顯不同。高斯平滑也用於計算機視覺算法中的預先處理階段,以增強圖像在不同比例大 ...
說起紅眼算法,這個話題非常古老了。 百度百科上的描述: “紅眼”一般是指在人物攝影時,當閃光燈照射到人眼的時候,瞳孔放大而產生的視網膜泛紅現象。 由於紅眼現象的程度是根據拍攝對象色素的深淺決定的,如果拍攝對象的眼睛顏色較深,紅眼現象便不會特別明顯。 “紅眼”也指傳染性結膜炎 ...
絕大數人都知道mp3格式編碼,以及aac,amr等壓縮格式編碼。 而在語音通信界有一個強悍的音頻格式編碼opus. 經過實測,壓縮比最高可以達到1:10。 100KB 壓縮后 10KB 雖然是 ...
近期比較忙, 抽空出來5.1開源獻禮. 但凡學習音頻降噪算法的朋友,肯定看過一個算法. <<語音增強-理論與實踐>> 中提及到基於對數的最小均方誤差的降噪算法,也就是LogMMSE. 資料見: <<Speech enhancement using ...
降噪是音頻圖像算法中的必不可少的。 目的肯定是讓圖片或語音 更加自然平滑,簡而言之,美化。 圖像算法和音頻算法 都有其共通點。 圖像是偏向 空間 處理,例如圖片中的某個區域。 圖像很多時候是以二維數據為主,矩形數據分布。 音頻更偏向 時間 處理,例如語音中的某段時長。 音頻一般是一維 ...
WebRTC提供一套音頻處理引擎, 包含以下算法: AGC自動增益控制(Automatic Gain Control) ANS噪音抑制(Automatic Noise Suppression) AEC是聲學回聲消除(Acoustic Echo Canceller for Mobile ...