遇到一個需求,需要識別圖片中的文字,可以通過調用百度的ocr接口輕松實現。
1、打開百度圖文識別網站:https://console.bce.baidu.com/ai/#/ai/ocr/overview/index,輸入賬號密碼登錄;
2、進入后點擊創建應用
3、自定義一個應用名稱
文字識別包名可選不需要,應用描述隨便填寫,
4、點擊立即創建,出現如下圖,點擊查看應用詳情
申請到的API Key和Secret Key如圖,即可使用。
5、使用步驟,以JavaScript為例
5.1 圖片轉換成base64格式
var path = "/sdcard/pic/test01.jpg"; var imag64 = images.toBase64(images.read(path));
5.2 獲取access_token
var getTokenUrl="https://aip.baidubce.com/oauth/2.0/token";
var token_Res = http.post(getTokenUrl, {
grant_type: "client_credentials",
client_id: API_Key, //API Key
client_secret: Secret_Key, //Secret Key
});
var access_token = token_Res.body.json().access_token;
5.3 調用百度ocr通用文字識別API
var ocrUrl = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"; var ocr_Res = http.post(ocrUrl, { headers: { "Content-Type": "application/x-www-form-urlencoded" }, access_token: access_token, //5.2生成的token image: imag64, //5.1生成的base64編碼 language_type:"CHN_ENG" }); var json = ocr_Res.body.json();
得到json格式結果:
{ "words_result": [ {"words": "小微"}, {"words": "測試"} ], "log_id": 2471272194, "words_result_num": 2 }