python文字轉語音庫及使用方法


作者:陳哲
鏈接:https://www.zhihu.com/question/473797102/answer/2019063801
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。

Python 文字轉語音(TTS,TextToSpeech)有很多庫可以實現,例如:

  • pyttsx3
  • gTTS
  • IBM Watson TTS
  • win32com(Windows 平台)

注意:如未安裝請先安裝,為節省時間,以下我把安裝和使用寫在一個代碼塊中了,應該是分開的。

 

pyttsx3

pip install pyttsx3 import pyttsx3 pyttsx3.speak("Hello World")

gTTS

pip install gTTS from gtts import gTTS tts = gTTS('Hello World') tts.save('hello.mp3')

IBM Watson TTS

pip install tts-watson from tts_watson.TtsWatson import TtsWatson ttsWatson = TtsWatson('watson_user', 'watson_password', 'en-US_AllisonVoice') ttsWatson.play("Hello World")

win32com(Windows 平台)

import win32com.client as wincl speak = wincl.Dispatch("SAPI.SpVoice") speak.Speak("Hello World")

 

當然,還包括國內的語音平台也提供 TTS 服務,例如,訊飛科技,百度智能語音開放平台,阿里雲,騰訊雲,思必馳,捷通華聲(靈雲)等等。

 

在這里沒有直接給出結論,到底是哪個好呢?如果脫離了業務,就會變得毫無意義,不然也就沒有類似於“技術選型”的必要性了,以上,只是提供了最初最初的參考。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM