用 pandas 畫散點圖矩陣
散點圖矩陣就是將所有特征兩兩結合,畫出他們的散點圖。
用到的方法:
pd.plotting.scatter_matrix()
以鳶尾花數據集為例(在 Jupyter lab 中運行):
from sklearn.datasets import load_iris
import matplotlib.pyplot as plt
iris_dataset = load_iris()
# 查看數據集的描述
# print(iris_dataset.DESCR)
import pandas as pd
iris_df = pd.DataFrame(iris_dataset['data'],columns=iris_dataset.feature_names)
iris_df.head()
pd.plotting.scatter_matrix(iris_df, c=iris_dataset['target'],figsize=(15,15),marker='o',alpha=0.5)
plt.savefig('matrix.png') # 保存