今天在學習PCA的時候,使用mnist數據集遇到一個問題,代碼是這樣的:
1 import numpy as np 2 from sklearn.datasets import fetch_mldata 3 4 mnist = fetch_mldata("MNIST original")
遇到了報錯:[WinError 10060] 由於連接方在一段時間后沒有正確答復或連接的主機沒有反應,連接嘗試失敗。
原因:
以為是源地址被牆了,就搭梯子試試,結果還是不行
搜了一下原因,是因為源地址已經不能用了
解決辦法:
使用本地數據集,可以從這下載: https://github.com/amplab/datascience-sp14/raw/master/lab7/mldata/mnist-original.mat
這個速度不快,可以使用我的百度雲鏈接:
鏈接:https://pan.baidu.com/s/1NH1VSnX_Bkvr3k-Dku4gAw
提取碼:herq
下載好后使用fetch_mldata的data_home參數指定文件所在目錄
例如:
我的Jupyter文件在 F:\PyCharmWorkSpace\ML下,在其中新建一個datasets,並在代碼中指定
mnist = fetch_mldata("MNIST original",data_home='./datasets')
此時再運行,還是會報錯,先別急
打開datasets文件夾,發現
這樣一個子目錄,把下載好的文件放到這里面去,在運行,OK