python爬取有道翻譯


1.准備工作

先來到有道在線翻譯的界面http://fanyi.youdao.com/

F12 審查元素 ->選Network一欄,然后F5刷新 (如果看不到Method一欄,右鍵Name欄,選中Method)

輸入文字自動翻譯后發現Method一欄有GET還有POST;GET是指從服務器請求和獲得數據,POST是向指定服務器提交被處理的數據、

隨便打開一個POST,找到preview可以看到我們輸入的“我愛你一生一世”數據,可以證明post的提交數據的

下面分析一下Headers各個字段的意義;User-agent字段很重要

 

 

 

 

下面來看一下request模塊中urlopen方法,查看文檔;

發現urlopen有一個data參數,如果參數沒賦值(默認None)就是GET形式,如果data參數被賦值了,就以POST形式提交

 

在這里,data參數其實是一個字典 ;就是源代碼中From Data的數據

 

 

下面一篇文章是對urlencodeunquote的詳細解釋:urllib庫里可惜沒有urldecode函數)

https://www.cnblogs.com/caicaihong/p/5687522.html

為什么要進行編碼和解碼呢?------》對於一些中文或者字符,url是不識別的,需要進行編碼轉換!
encode('utf-8')把unicode的形式變成utf-8
decode('utf-8')把utf-8形式變成Unicode編碼形式
 
 
 
2.下面進行敲!
 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM