用python實現的百度新歌榜、熱歌榜下載器

本文轉載自查看原文 2014-06-10 15:56 1939 python/ urllib/ 模擬登錄/ PyQt/ urllib2/ Python

首先聲明，本工具僅僅為學習之用，不涉及版權問題，因為百度音樂里面的歌曲本身是可以下載的，而且現在百度也提供了”百度音樂播放器”，可以通過這個工具進行批量下載。

我當時做這個工具的時候，百度還沒有提供”百度音樂播放器”,而我又想批量下載，所以做了這樣的一個下載工具。當然，主要還是為了學習。

工具采用Python2.7.3+PyQt開發。

功能：

1.集中展示百度新歌榜或熱歌榜可下載的歌單。

2.支持單個、多個歌曲的下載。

3.可復制歌單中所有的鏈接內容，方便在迅雷等下載工具中創建下載組。

缺陷：

目前采用單線程，效率不高，UI界面容易假死。

本工具運行流程：

1.模擬用戶登錄百度。

2.若登錄成功，采集並解析頁面內容，加載歌單列表。

3.用戶點擊下載按鈕或者批量下載按鈕后，下載歌曲。

使用方法：

1.在配置文件setting.py的最后，配置可登錄百度的賬號和密碼，及百度熱歌榜或新歌榜的URL.

username = "your baidu acount"    #配置你的百度賬號
password = "your baidu password"  #配置你的百度密碼

musiclistUrl = "http://music.baidu.com/top/dayhot"  #   http://music.baidu.com/top/new

2.直接運行mainWindow.py文件即可，如果網速不給力的話可能要等上3、4分鍾。

運行后如圖：

用到的知識：

1.首先用到了PyQt的GUI編程，窗體布局及QTableWidget、QProgressBar、QPushButton等控件及控件的重寫

2.用到了網絡編程的部分內容，利用urllib,urllib2,cookielib請求網頁，模擬登錄百度。

3.利用HTMLParser解析網頁內容，匹配網頁元素。

4.利用codecs進行文件的讀寫。

遇到的問題：

1.編碼問題，由於在創建文件時將文件編碼設置為UTF-8,當需要向文件寫入的內容為中文等非ASCII碼內容時，總是提示編碼問題。其實，百度音樂的網頁全部為UTF-8格式，因此從網頁中獲取的內容也是UTF-8格式，但是，要講內容寫入UTF-8的文本中，必須將網頁內容進行decode(“utf8”)解碼為unicode格式，才能正常寫入。

檢測內容編碼，可以用chardet模塊的chardet.detect(“內容”)的方法。

另外，HTMLParser解析網頁內容過程中，有的下載頁面會出現問題，根據提示信息發現還是編碼問題，將feed()方法中的內容參數進行decode(“utf8”)后，結果正常。

decode將內容根據參數內容解碼為unicode類型，具體要根據所采集的頁面的編碼。

github下載地址：點這里

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 爬取百度熱榜屏蔽百度熱榜爬取百度熱搜榜爬取今日熱榜百度熱搜TOP10 爬取百度熱搜榜以及數據分析爬取百度熱搜風雲榜數據爬取百度熱搜榜及數據分析與可視化處理 Python爬取網易雲熱歌榜所有音樂及其熱評 Python爬取百度實時熱點排行榜爬取百度排行榜