華為語音合成服務，為用戶提供實時、可替換、多音調的語音播放體驗

本文轉載自查看原文 2022-01-07 17:08 755

在不能操作手機或總盯着手機看的情況下，如何及時獲取資訊信息、方便閱讀呢？用耳朵聽不失為一種好方法。華為機器學習服務的語音合成服務，采用深度神經網絡技術，提供高度擬人、流暢自然的語音合成服務。開發者可以在小說閱讀、智能硬件、地圖導航類應用中集成該能力，為用戶提供實時、可替換、多音調的語音播放體驗。

語音合成，助力及時性內容送達

語音合成服務支持在線將文字信息轉換為語音輸出，已在全球部署。該服務的優勢有——

多語言、多音色：支持中文、英文、中英文混讀合成，更有2種標准男聲發音、6種標准女聲發音可供選擇。以下為音色試聽：
語速、音量可調節：支持多種參數配置，可根據場景需求對發音人的語速、音量進行調整。
集成方式靈活豐富：提供離線SDK、在線SDK快速集成，充分滿足不同場景下的語音合成需求。

語音合成服務可以應用於閱讀播報、新聞播報、虛擬播報、地圖播報、信息通知等及時性較強的場景。比如，用戶在騎車、駕車使用地圖導航時，路上不方便一直看手機。語音合成廣播可以保證表達清晰，准確到達目的地；在司機端打車軟件、餐飲叫號、排隊軟件等場景下，通過語音合成進行訂單播報，讓用戶便捷獲取通知信息；市場上很火的電子閱讀類應用，提供語音播報和收聽功能。用戶可以很容易地實現“聽書”。即使在鎖屏狀態下，也可以通過語音播報繼續收聽，消除地鐵、公交、跑步等閱讀環境的限制。一些不方便閱讀的老人和小孩，同樣可以通過“聽書”，解決看不清、情緒陪伴等問題。

在智能硬件領域，語音合成服務則可以集成到兒童故事機、智能機器人、平板設備等智能設備上，使人機交互更加自然、親切。對於短視頻App的內容創作者來說，在視頻應用中指定文字就可以合成一些語音效果，加快了短視頻制作流程。

定制音色，滿足用戶個性化需求

近期，華為語音合成服務即將上線定制音色功能。用戶可以錄制並合成自己的聲音到應用中，讓平日里聽小說、導航等生活學習場景更加有趣、親切。家里有小朋友的父母還可以用自己的聲音給孩子們講故事，釋放育兒疲勞的同時加深親子互動陪伴。

開發實戰

開發准備
Maven倉和SDK的配置步驟可以參考開發者網站中的應用開發介紹：
https://developer.huawei.com/consumer/cn/doc/development/hiai-Guides/ml-tts-0000001050068169?ha_source=hms1

配置集成的SDK包

在應用的build.gradle文件中，dependencies內添加TTS的SDK依賴：
// 引入基礎SDK
implementation 'com.huawei.hms:ml-computer-voice-tts:3.3.0.274'
// 引入離線語音合成bee語音包
implementation 'com.huawei.hms:ml-computer-voice-tts-model-bee:3.3.0.274'
// 引入離線語音合成eagle語音包
implementation 'com.huawei.hms:ml-computer-voice-tts-model-eagle:3.3.0.274'

配置AndroidManifest.xml

打開main文件夾中的AndroidManifest.xml文件，可以根據場景和使用需要，配置網絡和讀寫權限，在<application>前添加
<uses-permission android:name="android.permission.INTERNET" />
<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />
<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />

代碼開發（在線TTS）

3.1創建應用自定義的activity界面，用於選擇在線或者離線TTS，並通過api_key或者Access Token設置應用鑒權信息

public class MainActivity extends AppCompatActivity {
    @Override
    protected void onCreate(@Nullable Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        MLApplication.getInstance().setAccessToken("your access token");
}
}

3.2 創建TTS配置及TTS 引擎，可以根據需要配置不同參數

MLTtsEngine mlTtsEngine;
MLTtsConfig mlConfigs;

mlConfigs = new MLTtsConfig()
        // Setting the language for synthesis.
        .setLanguage(MLTtsConstants.TTS_ZH_HANS)
        // Set the timbre.
        .setPerson(MLTtsConstants.TTS_SPEAKER_FEMALE_ZH)
        // Set the speech speed. Range: 0.2–4.0 1.0 indicates 1x speed.
        .setSpeed(1.0f)
        // Set the volume. Range: 0.2–4.0 1.0 indicates 1x volume.
        .setVolume(1.0f)
        // set the synthesis mode.
        .setSynthesizeMode(MLTtsConstants.TTS_ONLINE_MODE);

mlTtsEngine = new MLTtsEngine(mlConfigs);
//Sets the volume of the built-in player.
mlTtsEngine.setPlayerVolume(20);
設置回調（回調見3.3）
// Pass the TTS callback to the TTS engine.
mlTtsEngine.setTtsCallback(callback);

3.3 配置TTS回調，接收處理語音合成的結果

MLTtsCallback callback = new MLTtsCallback() {
    String task = "";

    String fileName = "audio_" + task;

    @Override
    public void onError(String taskId, MLTtsError err) {
        String str = taskId + " " + err;
        sendMsg(str);
    }

    @Override
    public void onWarn(String taskId, MLTtsWarn warn) {
        String str = taskId + " 提示：" + warn;
        sendMsg(str);
    }

    @Override
    public void onRangeStart(String taskId, int start, int end) {
        String str = taskId + " onRangeStart [" + start + "，" + end + "]";// + temp.get(taskId).substring(start);
        sendMsg(taskId + " onRangeStart[" + start + "," + end + "]");
        sendMsg1(taskId, start, end);
    }

    @Override
    public void onAudioAvailable(String taskId, MLTtsAudioFragment audioFragment, int offset,
        Pair<Integer, Integer> range, Bundle bundle) {
        if (!task.equals(taskId)) {
            task = taskId;
            fileName = "/sdcard/audio_" + task + ".pcm";
        }
        writeTxtToFile(audioFragment.getAudioData(), fileName, true);
    }

    @Override
    public void onEvent(String taskId, int eventId, Bundle bundle) {
        StringBuffer stringBuffer = new StringBuffer();
        stringBuffer.append(taskId + " ");
        switch (eventId) {
            case MLTtsConstants.EVENT_PLAY_START:
                stringBuffer.append("onPlayStart ");
                break;
            case MLTtsConstants.EVENT_PLAY_STOP:
                stringBuffer.append("onPlayStop ");
                stringBuffer.append(bundle.getBoolean(MLTtsConstants.EVENT_PLAY_STOP_INTERRUPTED));
                break;
            case MLTtsConstants.EVENT_PLAY_RESUME:
                stringBuffer.append("onPlayResume ");
                break;
            case MLTtsConstants.EVENT_PLAY_PAUSE:
                stringBuffer.append("onPlayPause ");
                break;
            case MLTtsConstants.EVENT_SYNTHESIS_COMPLETE:
                stringBuffer.append("onSynthesisComplete ");
                PCMCovWavUtil.convertWaveFile(fileName);
                break;
            case MLTtsConstants.EVENT_SYNTHESIS_START:
                stringBuffer.append("onSynthesisStart ");
                break;
            case MLTtsConstants.EVENT_SYNTHESIS_END:
                stringBuffer.append("onSynthesisEnd ");
                break;
        }
        Log.d(TAG, "onEvent: " + stringBuffer.toString());
    }
};

3.4 調用speak合成請求，及播放控制

String id = mlTtsEngine.speak(text, MLTtsEngine.QUEUE_APPEND));

mlTtsEngine.pause();
mlTtsEngine.resume();
mlTtsEngine.stop();

調用完畢后，釋放引擎
if (mlTtsEngine != null) {
    mlTtsEngine.stop();
    mlTtsEngine.shutdown();
}

離線TTS

4.1 離線功能需要新增下載發音人模型包的步驟

private MLLocalModelManager mLocalModelManager;
mLocalModelManager = MLLocalModelManager.getInstance();
MLTtsLocalModel mLocalModel = new MLTtsLocalModel.Factory('發音人'
).create();
mLocalModelManager.isModelExist(mLocalModel).addOnSuccessListener(new OnSuccessListener<Boolean>() {
    @Override
    public void onSuccess(Boolean aBoolean) {
        if (aBoolean) {
            mlTtsEngine.speak(text, MLTtsEngine.QUEUE_APPEND)
       } else {
            downloadModel(true); 
        }
    }
}).addOnFailureListener(new OnFailureListener() {
    @Override
    public void onFailure(Exception e) {
        Log.e(TAG, e.getMessage());
    }
});

下載模型方法為：

private void downloadModel(final boolean needSpeak) {
    MLModelDownloadStrategy request = new MLModelDownloadStrategy.Factory().needWifi().create();

    MLModelDownloadListener modelDownloadListener = new MLModelDownloadListener() {
        @Override
        public void onProcess(long alreadyDownLength, long totalLength) {
            showProcess(alreadyDownLength, "Model download is complete", totalLength);
        }
    };
    mLocalModelManager.downloadModel(mLocalModel, request, modelDownloadListener)
        .addOnSuccessListener(new OnSuccessListener<Void>() {
            @Override
            public void onSuccess(Void aVoid) {
                Log.i(TAG, "downloadModel: " + mLocalModel.getModelName() + " success");
                showToast("downloadModel Success");
                updateconfig();
                if (needSpeak) {
                    speak();
                }
            }
        })
        .addOnFailureListener(new OnFailureListener() {
            @Override
            public void onFailure(Exception e) {
                Log.e(TAG, "downloadModel failed: " + e.getMessage());
                showToast(e.getMessage());
            }
        });
}

其他使用和在線TTS一致

了解更多詳情>>

訪問華為開發者聯盟官網
獲取開發指導文檔
華為移動服務開源倉庫地址：GitHub、Gitee

關注我們，第一時間了解 HMS Core 最新技術資訊~

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 語音合成 - 什么是語音合成？ Python語音合成 SpeechSynthesisUtterance 語音合成如何使用華為機器學習服務和Kotlin實現語音合成 speechSynthesis，TTS語音合成。語音合成技術概述 C# 語音合成 python騰訊語音合成【album】語音合成技術語音語音合成科大訊飛和Tizen-TTS語音合成引擎