教你用python搭建一個「生活常識解答」機器人


今天教大家如何用Python爬蟲去搭建一個「生活常識解答」機器人。

思路:這個機器人主要是依托於“阿里達摩院發布的語言模型PLUG”,通過爬蟲的方式,發送post請求(提問),然后返回json數據(回答)

1、問答平台

這個「生活常識解答」機器人采用的是:阿里達摩院發布的語言模型PLUG(最近剛發布的,目前是測試階段),地址鏈接如下:

https://nlp.aliyun.com/portal#/BigText_chinese

該模型參數規模達270億,采用1TB以上高質量中文文本訓練數據,包括了新聞、小說、詩歌、常識問答等類型。

先來看一下原頁面效果

這里是需要登錄阿里雲賬號,登錄之后可以在網頁進行測試問答!

因此我們下面將通過抓包方式獲取這個問答的請求鏈接,然后在python代碼中requests發送post請求去進行提問,然后返回結果(答案)。

2、抓包

在瀏覽器里面F12,點擊network,然后點擊一下提問,獲取鏈接。

首先是發送的參數(提問)

然后是返回的json數據

請求鏈接

https://nlp.aliyun.com/otherApi/yymx/cdgmwbsc

因此這個數據包的相關信息(請求鏈接,參數,返回結果)我們已經知道了,下面開始編寫python代碼

3、編寫代碼

首先是導入python庫和請求頭

import requests
import json
header={
    'content-type':'application/json',
    'cookie':'上面頁面中你自己的cookie',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3947.100 Safari/537.36',
}

經過測試,有用的請求頭參數是上面三個(content-type、cookie、User-Agent),缺一不可

參數(其中q是問題,length是返回答案長度,type是對應常識問題)

q = "程序員脫發用什么洗發水好?"
data = {
    'length':'128',
    'type':'2',
    'passage':q,
}

發送請求

url = "https://nlp.aliyun.com/otherApi/yymx/cdgmwbsc"
text = requests.post(url,data = json.dumps(data),headers=header).json()
print(text['res'])

返回結果

下面為了能夠多輪提問,將請求部分代碼放到循環中(如果輸入是exit則退出循環)

4、小結

今天阿辰主要就教大家用Python爬蟲去搭建一個「生活常識解答」機器人。

這個機器人主要是依托於“阿里達摩院發布的語言模型PLUG”,通過爬蟲的方式,發送post請求(提問),然后返回json數據(回答)。輕松實現多輪提問。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM