離線語音識別,vosk,離線流式實時靜音噪聲監測,支持多語言開發python c++ c# java等


 

#!/usr/bin/env python3

from vosk import Model, KaldiRecognizer, SetLogLevel
import sys
import os
import wave

SetLogLevel(0)

if not os.path.exists("model"):
    print ("Please download the model from https://alphacephei.com/vosk/models and unpack as 'model' in the current folder.")
    exit (1)

wf = wave.open("3.wav", "rb")
if wf.getnchannels() != 1 or wf.getsampwidth() != 2 or wf.getcomptype() != "NONE":
    print ("Audio file must be WAV format mono PCM.")
    exit (1)

model = Model("model")
rec = KaldiRecognizer(model, wf.getframerate())

num = 0
while True:
    data = wf.readframes(256)
    # print(data)
    if len(data) == 0:
        break
    if rec.AcceptWaveform(data):
        print(rec.Result())
    else:
        print("第{}貞".format(num))
        print(rec.PartialResult())

        num = num + 1
print(rec.FinalResult())

  結果

第111貞
{
  "partial" : ""
}
第112貞
{
  "partial" : ""
}
第113貞
{
  "partial" : ""
}
第114貞
{
  "partial" : "小"
}
第115貞
{
  "partial" : "小"
}
第116貞
{
  "partial" : "小"
}
第117貞
{
  "partial" : "小"
}
第118貞
{
  "partial" : "小"
}
第119貞
{
  "partial" : "小"
}
第120貞
{
  "partial" : "小"
}
第121貞
{
  "partial" : "小"
}
第122貞
{
  "partial" : "小"
}
第123貞
{
  "partial" : "小"
}
第124貞
{
  "partial" : "小"
}
第125貞
{
  "partial" : "小"
}
第126貞
{
  "partial" : "小"
}
第127貞
{
  "partial" : "小記"
}
第128貞
{
  "partial" : "小記"
}
第129貞
{
  "partial" : "小記"
}
第130貞
{
  "partial" : "小記"
}

  

更多內容請參考 

https://github.com/LiuXinyu12378/vosk-api

https://alphacephei.com/vosk/models

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM