原文:HTK語音識別示例(Ubuntu)

一 簡介 HTK Hidden Markov Model Toolkit 是一款語音識別工具包,誕生於Cambridge University Engineering Department CUED ,后來幾經易手,目前的HTK 由CUED和Microsoft維護。現在Microsoft對HTK依舊保留一定的版權,但是源碼可以免費獲得,用於教學和科研是沒有問題的。 這里是我使用的源碼與教程的當時版 ...

2014-12-10 17:33 0 6308 推薦指數:

查看詳情

語音識別工具箱之HTK安裝與使用

HTK(HMM Toolkit)一款基於hmm模型的語音處理工具,早就聽說它了,一直因為用MATLAB中的工具箱在學習,或自己寫代碼在做HMM方面的試驗,所以沒有接觸到它。現在,上海朋友家里的網速超贊,我就趁投簡歷的時間空隙,下載了它的一些資料,包括安裝文件,使用文檔(最好中英文版都要找到 ...

Fri Aug 03 16:52:00 CST 2012 20 18446
Windows 安裝HTK3.4.1語音識別工具

此文根據http://blog.csdn.net/xiaoding133/article/details/6745981原文修改而成,只是修改了部分我們自己遇到的問題,首先下載HMM 的開發包HTK,現在的版本是3.4.1.可以從CMU的官網進行下載。 http ...

Mon Feb 20 22:33:00 CST 2012 3 5729
語音識別ASR - HTK(HResults)計算字錯率WER、句錯率SER

HResults計算字錯率(WER)、句錯率(SER) 前言 好久沒發文,看到仍有這么多關注的小伙伴,覺得不發篇文對不住。確實好久沒有輸出經驗總結相關的文檔,抽了個時間,整理了下筆記 ...

Thu Apr 04 04:22:00 CST 2019 2 6994
語音識別-TDNN

近來在了解卷積神經網絡(CNN),后來查到CNN是受語音信號處理中時延神經網絡(TDNN)影響而發明的。本篇的大部分內容都來自關於TDNN原始文獻【1】的理解和整理。該文寫與1989年,在識別"B", "D", "G"三個濁音中得到98.5%的准確率,高於HMM的93.7%。是CNN的先驅 ...

Mon Jan 14 01:11:00 CST 2019 0 1274
Python 語音識別

調用科大訊飛語音聽寫,使用Python實現語音識別,將實時語音轉換為文字。 參考這篇博客實現的錄音,首先在官網下載了關於語音聽寫的SDK,然后在文件夾內新建了兩個.py文件,分別是get_audio.py和iat_demo.py,並且新建了一個存放錄音的文件夾 ...

Wed Aug 07 22:15:00 CST 2019 0 706
語音識別 -- 概述

1. 語音合成zhrtvc:https://github.com/KuangDD/zhrtvc 2.離線語音識別 vosk+kaldi:https://alphacephei.com/vosk/ tacotron:https://github.com/keithito/tacotron ...

Fri Nov 20 19:18:00 CST 2020 0 607
語音識別基礎

首先我們要知道語音的產生過程 由肺產生向外的氣流,完全放松時聲帶張開,就是平時的呼吸。如果聲帶一張一合(振動)形成周期性的脈沖氣流。這個脈沖氣流的周期稱之為——基音周期(題主所言因音色不同導致的頻率不同,事實上音色的大多是泛頻上的差異,建立在基頻之上,這個基頻就是基音周期了,泛頻可以忽略 ...

Mon Apr 17 22:51:00 CST 2017 0 1726
基於android的語音識別

1.注冊賬戶,添加應用 2.針對android平台的選擇應用,下載SDK 3.將SDK的libs下文件拷貝到工程的libs目錄下 4.添加用戶權限 5.初始化語音配置對象 6.拷貝assets目錄下資源文件到android工程 ...

Sun Jun 18 14:32:00 CST 2017 3 2522
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM