控制台的輸出是:
Downloading 20news dataset. This may take a few minutes.
Downloading dataset from https://ndownloader.figshare.com/files/5975967 (14 MB)
默認在當前用戶下生成文件
C:\Users\funy(用戶名)\scikit_learn_data

首先手動下載這個數據包
http://qwone.com/~jason/20Newsgroups/20news-bydate.tar.gz
把下載的20news-bydate.tar.gz放到上述文件夾中
打開twenty_newsgroups.py文件(在fetch_20newsgroups函數名上,右鍵轉到定義即可找到)
把第一個紅框注釋(其實就是原本用來下載的代碼)。
寫上第二個紅框,也就是下載安裝包的路徑。
運行程序,完美解決。
程序會自動解壓20news-bydate.tar.gz。
然后刪除,最后生成一個緩存文件20news-bydate.pkz。
在Linux系統也差不多,我是單獨建了一個文件夾,然后上傳上述的20news-bydate.tar.gz數據文件,程序執行后會刪除原來的壓縮包。
操作流程如下所示:
參考資料:
http://www.mamicode.com/info-detail-2749128.html
https://blog.csdn.net/u012620645/article/details/47080745
——