原文:(一)准備訓練語音文件

安裝音頻錄放工具 sox : sox 主要包含兩個命令,后續將會用到:rec 錄音 和play 播放 。 sudo apt get install sox 創建目錄樹: 為了有序組織各種中間文件,在創建如圖所示目錄樹: mkdir p htk color config,data test mfc,speech ,train mfc,speech ,dict,hmm ,hmm ,hmm ,hmm ...

2014-12-27 14:43 2 3019 推薦指數:

查看詳情

pytorch: 准備訓練和測試自己的圖片數據

大部分的pytorch入門教程,都是使用torchvision里面的數據進行訓練和測試。如果我們是自己的圖片數據,又該怎么做呢? 一、我的數據 我在學習的時候,使用的是fashion-mnist。這個數據比較小,我的電腦沒有GPU,還能吃得消。關於fashion-mnist數據,可以百度 ...

Thu Sep 14 20:54:00 CST 2017 8 55239
使用TensorFlow訓練自己的語音識別AI

這次來訓練一個基於CNN的語音識別模型。訓練完成后,我們將嘗試將此模型用於Hotword detection。 人類是怎樣聽懂一句話的呢?以漢語為例,當聽到“wo shi”的錄音時,我們會想,有哪兩個字是讀作“wo shi”的,有人想到的是“我是”,也有人覺得是“我市”。我們可以通過”wo ...

Tue Feb 04 19:35:00 CST 2020 0 935
訓練語音降噪模型的一些感想

當前基於深度學習的語音降噪方法主要分為兩個類: 基於TF時頻域的方法 (有兩大類:基於mask和非基於mask的方法) 基於時域的方法,就我自己的實驗結果來說,基於時域的方法比基於TFmask的方法要差一些,可能這樣方法的trick更多一些吧。 基於時頻域方法中 ...

Wed Mar 04 01:48:00 CST 2020 0 757
HTS語音合成訓練(二)-自有數據訓練

HTS語音合成訓練(二)-自有數據訓練 簡介: 在《HTS語音合成訓練(一)》中我們安裝好了必要的軟件,並且跑通了DEMO,HTS語音合成訓練(二)則主要是用自己的數據來構建自己的語音合成系統,主要分為以下兩個步驟: 准備訓練數據 HTS訓練模型和合成語音 1.准備訓練數據 ...

Thu Mar 03 22:36:00 CST 2022 5 390
QQ替換語音文件

QQ替換語音文件 當別人點開你的語音時,沒想到,那居然是一首幾分鍾的無損音質的歌曲,那這個要怎么實現呢 環境 root,Android 工具 mt管理器,QX模塊(要適配你當前的qq版本,然后去設置里把轉發語音開啟,用過的都知道) 替換 一般語音文件都在ptt這個文件 ...

Sun Dec 13 04:16:00 CST 2020 0 974
2-GMM-HMMs語音識別系統-訓練

本文記錄在傳統的語音識別中,訓練GMM-HMMs聲學模型過程中的公式推導過程。 Outline GMM - 混合高斯模型 HMM – 隱馬爾科夫模型 Forward-Backward Algorithm – 前向后向算法 首先假設這里的訓練數據,都做 ...

Mon Apr 24 04:04:00 CST 2017 0 1649
帶你了解3類預訓練語音模型預測方法

摘要:在調研多篇論文后,筆者發現預訓練語音模型的預測方法基本可以分為以下3類:<1>用前文預測當前及后文(自回歸)<2> 隨機mask 一些幀並預測 <3> 用兩側上下文預測中間幀。 本文分享自華為雲社區《預訓練語音模型調研小結》,作者: Hudson ...

Fri Oct 29 17:42:00 CST 2021 0 838
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM