第一個機器學習scikit-learn可視化例子

本文轉載自查看原文 2020-03-18 21:44 614 機器學習/ Python

scikit-learn，又寫作sklearn，是一個開源的基於python語言的機器學習工具包。它通過NumPy, SciPy和
Matplotlib等python數值計算的庫實現高效的算法應用，並且涵蓋了幾乎所有主流機器學習算法。
http://scikit-learn.org/stable/index.html

https://sklearn.apachecn.org/

安裝必要的包：

pip install numpy pandas matplotlib scikit-learn  graphviz  scipy jupyter

本例在jupyter里運行，直接復制到jupyter里運行即可。

# -*- coding:utf-8 -*-
from sklearn import tree
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split

wine = load_wine()
print(wine.data.shape)
print(wine.target)
#如果wine是一張表，應該長這樣：
import pandas as pd
pd.concat([pd.DataFrame(wine.data),pd.DataFrame(wine.target)],axis=1)
print(wine.feature_names)
print(wine.target_names)
Xtrain, Xtest, Ytrain, Ytest = train_test_split(wine.data,wine.target,test_size=0.3)
print(Xtrain.shape)
print(Xtest.shape)

clf = tree.DecisionTreeClassifier(criterion="entropy")
clf = clf.fit(Xtrain, Ytrain)
score = clf.score(Xtest, Ytest) #返回預測的准確度
print(score)

feature_name = ['酒精','蘋果酸','灰','灰的鹼性','鎂','總酚','類黃酮','非黃烷類酚類','花青素','顏色強度','色調','od280/od315稀釋葡萄酒','脯氨酸']

import graphviz
dot_data = tree.export_graphviz(clf
                               ,feature_names= feature_name
                               ,class_names=["琴酒","雪莉","貝爾摩德"]
                               ,filled=True
                               ,rounded=True
                               )
graph = graphviz.Source(dot_data)
graph #直接在jupyter里顯示為圖片
graph.render("tree") #同級目錄下生成tree.pdf文件

運行結果：

(178, 13)
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2]
['alcohol', 'malic_acid', 'ash', 'alcalinity_of_ash', 'magnesium', 'total_phenols', 'flavanoids', 'nonflavanoid_phenols', 'proanthocyanins', 'color_intensity', 'hue', 'od280/od315_of_diluted_wines', 'proline']
['class_0' 'class_1' 'class_2']
(124, 13)
(54, 13)
0.9629629629629629

沒有jupyter的同學看這里：https://www.cnblogs.com/v5captain/p/6688494.html

機器學習不能沒有它，嘿嘿！

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 [譯]使用scikit-learn進行機器學習(scikit-learn教程1) 機器學習算法庫scikit-learn的安裝 Python機器學習庫scikit-learn實踐基於 Python 和 Scikit-Learn 的機器學習介紹 4.2 Scikit-Learn簡介（機器學習篇）機器學習-Scikit-Learn與回歸樹機器學習：SVM（scikit-learn 中的 SVM：LinearSVC）機器學習算法庫——scikit-learn工具解讀 python調用scikit-learn機器學習機器學習利器——Scikit-learn的安裝