解決fetch_20newsgroups下載速度巨慢


控制台的輸出是:

Downloading 20news dataset. This may take a few minutes. Downloading dataset from https://ndownloader.figshare.com/files/5975967 (14 MB)


默認在當前用戶下生成文件

C:\Users\funy(用戶名)\scikit_learn_data

首先手動下載這個數據包

 http://qwone.com/~jason/20Newsgroups/20news-bydate.tar.gz

 

把下載的20news-bydate.tar.gz放到上述文件夾中

 

打開twenty_newsgroups.py文件(在fetch_20newsgroups函數名上,右鍵轉到定義即可找到)

把第一個紅框注釋(其實就是原本用來下載的代碼)。
寫上第二個紅框,也就是下載安裝包的路徑。

 

運行程序,完美解決。

程序會自動解壓20news-bydate.tar.gz。

然后刪除,最后生成一個緩存文件20news-bydate.pkz。

 

在Linux系統也差不多,我是單獨建了一個文件夾,然后上傳上述的20news-bydate.tar.gz數據文件,程序執行后會刪除原來的壓縮包。

操作流程如下所示:

 

 

參考資料:

http://www.mamicode.com/info-detail-2749128.html

https://blog.csdn.net/u012620645/article/details/47080745

——


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM