QT應用(9)-百度AI語音識別(音頻-＞文字)

本文轉載自查看原文 2021-02-04 06:14 260

功能：發一段音頻給百度，百度返回一段文字給你。
結果圖：
語音識別一般分在線和離線兩種。本文說的是在線過程。錄制一段音頻文件->baidu,baidu ->返回一段文字給你。

1.注冊賬戶
2.錄制音頻文件
3.發送http請求
4.解析json數據

1.百度注冊賬戶+創建應用+API文檔
https://console.bce.baidu.com/ai/#/ai/speech/overview/index
https://cloud.baidu.com/doc/SPEECH/s/ek38lxj1u
請AK和SK請自行注冊

const QString baiduSpeechTokenUrl = "https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=%1&client_secret=%2";
const QString speech_client_AK= "yLnualRuHnCcZDi2B3wEZ1rs";
const QString speech_client_SK= "LA55muGIGSWZPBkcQWnjA9AmlKeSRGLA";
const QString BaiduSpeechVideoUrl = "https://vop.baidu.com/pro_api?dev_pid=1537&cuid=%1&token=%2";

2.錄制音頻文件

1.一般支持的音頻格式：pcm、wav、amr、m4a
2.編碼要求：采樣率 16000、16bit、單聲道

3.發送http請求
3.1向 baiduSpeechTokenUrl 發請求得access_token （參數為：AK,SK）

 QString m_accessToken,m_text;
    QString TokenUrl = QString(baiduSpeechTokenUrl).arg(speech_client_AK).arg(speech_client_SK);
    QMap<QString ,QString>header;
    header.insert(QString("Content-Type") ,QString("audio/pcm;rate=16000"));
    QByteArray requestData;
    QByteArray replyData;
    myhttp m_http;
    bool ret;
    if(m_accessToken.isEmpty() == true)
    {
        ret = m_http.post_sync(TokenUrl ,header ,requestData ,replyData);
        if(ret)
        {
            QString key = "access_token";
            m_accessToken = getJsonValueBtn(replyData ,key);
            replyData.clear();
            qDebug() << "獲取的token" << m_accessToken;
        }
        else
        {
        }
  }

下圖為返回結果

3.2 向BaiduSpeechVideoUrl 發請求得文本（參數為：access_token,錄音文件流）
發送代碼：

 QString speechUrl = QString(BaiduSpeechVideoUrl).arg(QHostInfo::localHostName()).arg(m_accessToken);
     ret = m_http.post_sync(speechUrl ,header ,requestData ,replyData);
     if(ret)
     {
         QString key = "result";
         m_text = getJsonValueBtn(replyData ,key);
         replyData.clear();
         qDebug() << "得到的文本結果：" << m_text;
     }

3.3 post代碼：

bool myhttp::post_sync(QString Url ,QMap<QString ,QString>header ,QByteArray &requestData ,QByteArray &replyData)
{
  
    //QNetworkAccessManager Url QNetworkRequest  QNetworkReply
    QNetworkAccessManager m_manager;
    QNetworkRequest m_request;
    m_request.setUrl(Url);
    QMapIterator<QString ,QString> it(header);
    while(it.hasNext())
    {
        it.next();
        m_request.setRawHeader(it.key().toLatin1() ,it.value().toLatin1());
    }
    QNetworkReply *pReply = m_manager.post(m_request ,requestData);
    QEventLoop l;
    connect( pReply ,&QNetworkReply::finished ,&l ,&QEventLoop::quit);
    l.exec();
    if(pReply != nullptr && pReply->error() == QNetworkReply::NoError)
    {
       replyData = pReply->readAll();
       qDebug()<<"replyData:"<<replyData;
       return true;
    }
    return false;



}

4.解析json數據

	JSON	RAW
編碼	讀取二進制后base64編碼	讀取直接放在Body中

數據長度	數據增大1/3
	len =原始大小	音頻文件大小 Content-Length
header	Content-Type:application/json	Content-Type: audio/pcm;rate=16000
url:cuid
token：	APPID ,API KEY,Secret KEY
dev_pid	1537(普通話)

QString mySpeech::getJsonValue(QByteArray &data, QString &key)
{
    QString ansstr="";
    QJsonParseError parseError;
    QJsonDocument jsonDocument = QJsonDocument::fromJson(data, &parseError);
     if(parseError.error == QJsonParseError::NoError)
    {
        if(jsonDocument.isObject())
        {
            QJsonObject jsonObj = jsonDocument.object();
            if(jsonObj.contains(key))
            {
                QJsonValue jsonVal = jsonObj.value(key);
                if(jsonVal.isString())
                {
                    return jsonVal.toString();
                }
                if(jsonVal.isArray())
                {
                    QJsonArray arr = jsonVal.toArray();
                    for(int index = 0;index < arr.size();index++)
                    {
                        QJsonValue subValue = arr.at(index);
                        if(subValue.isString())
                        {
                            ansstr += subValue.toString() + " ";
                        }
                    }
                    return ansstr;
                }
            }
            else
            {
                qDebug() << "不包含關鍵字:" << key;
            }//contains(key)
        }
        else
        {
            qDebug() << "不是json對象";
        }//isObject
    }
    else
    {
        qDebug() << "未成功解析JSON";
    }//NoError
    qDebug() << "未成功解析JSON："<< data.data();
    return QString("");
    return ansstr;
}
點擊並拖拽以移動

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 語音識別和文字轉語音（基於百度AI）百度AI的語音合成,語音識別百度AI---語音識別百度語音識別入門利用百度語音識別接口將語音轉換成文字教程 C#實現百度AI-實時語音識別轉寫-附源碼利用百度語音API進行語音識別。 mui 百度語音識別轉換文字什么？小程序實時語音識別你還在痛苦的對接科大訊飛？百度Ai識別？玩轉百度語音識別，就是這么簡單