1.本周下載過一個筆畫網站http://bihua.51240.com/e998bf__bihuachaxun/
如上圖所示,輸入阿對應的是http://bihua.51240.com/e998bf__bihuachaxun/這個鏈接,輸入七對應的是http://bihua.51240.com/e4b883__bihuachaxun/這個鏈接,為了下載漢字的筆畫,所以只需要找到漢字與鏈接的對應關系即可,比如上面的即為阿對應e998bf、七對應e4b883,現在我們如何獲取八對應的呢
2.分析網站加載的js,發現獲取筆畫會加載一個http://f.51240.com/file/bihua/js.js的js,查看此js,當然網站上一般都會把js壓縮的,所以可以在線解壓一下
解壓后看到值時通過這樣的js代碼得到的
比如:
<!DOCTYPE HTML> <html> <head> <script type="text/javascript"> a = '八' aa = encodeURIComponent(a).replace(/%/g, "").toLowerCase() alert(aa) </script> </head> <body> </body> </html>
運行,結果如下,得到八對應的為e585ab
3.那用Python代碼該如何獲取漢字對應值,此例中就是Python里哪個編碼函數可以與JS的encodeURIComponent函數對應,我們知道是urllib.quote
以上可以通過編碼漢字后拼接url,得到其在本筆畫網站的的url鏈接
注意:其實可以了解一下他們的對應的解碼函數,如decodeURIComponent、urllib.unquote