UCI數據集iris數據簡單的可視化

本文轉載自查看原文 2019-12-13 21:46 405

數據集官網下載；

jupyter notebook 實現；

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt



fname = 'E:\\pythonwork\\project\\Deeplearning\\Task\\data\\iris.data'
with open(fname, 'r+', encoding='utf-8') as f:
    s = [i[:-1].split(',') for i in f.readlines()]
# 讀取TXT，逗號為分隔符

# pandas讀取數據 樣本數為各50個
names=['slength','swidth','plength','pwidth','name']
iris = pd.DataFrame(data=s,  columns=names)
# 刪除一個莫名其妙的空行：
iris.dropna(axis=0, how='any', inplace=True)
# 有三種類別：
seto = iris.iloc[0:50,:]
vers = iris.iloc[50:100,:]
virg = iris.iloc[100:150,:]
seto.shape
vers.shape
# 統計每個品種有多少個樣本
iris['name'].value_counts()
# 字符串類型的數據變成float（否則不能畫圖）
iris.iloc[:,:4]=iris.iloc[:,:4].astype('float')
# 畫出slength和swidth的關系圖
plt.scatter(x=iris['slength'],y=iris['swidth'])
plt.show()

#-------------------
# 按顏色不同分類 畫圖
plt.scatter(x=seto['slength'],y=seto['swidth'],color='red')
plt.scatter(x=vers['slength'],y=seto['swidth'],color='blue',marker="+")
plt.scatter(x=virg['slength'],y=seto['swidth'],color='green',marker='*')
plt.xlabel('s length')
plt.ylabel('s width')
plt.show()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Matlab讀取UCI數據集Iris中數據 Iris數據集 iris數據集 iris 數據集訓練一個核 SVM 模型，可視化其決策區域一個簡單的TensorFlow可視化MNIST數據集識別程序【案例】新冠肺炎的數據集和簡單的可視化和預測分析【R語言學習筆記】6. 運用ggplot2包進行數據可視化----基於鳶尾花卉(iris)數據集鳶尾花數據集可視化波士頓房價數據集可視化 cifar-10數據集的可視化