主成分分析法代碼實現
之間我介紹過主成分份分析法,這里給出代碼實現
from sklearn.decomposition import PCA
import pandas as pd
import os
path="C:/Users/Administrator/Desktop/o25mso/homework/AMZN.csv"#存放文件路徑,這個文件在我的資源上傳里
df=pd.read_csv(path)#讀取文件
pca=PCA()#創建對象
df=(df.iloc[:,2:]-df.iloc[:,2:].mean())/df.iloc[:,2:].std()#對數據進行中心化處理
#print(df)
pca.fit(df)
print(pca.components_)#返回模型的各個特征向量
print(pca.explained_variance_ratio_)#返回各個成分各自的方差百分比
pca=PCA(2)#設置轉化主成分個數兩個
pca.fit(df)
low_d=pca.transform(df)
print(low_d)#返回降維后的數據
運行結果:

上圖的結果分別為特征向量,和主成分所占的方差百分比,可以發現第一個和第二個主成分占的方差百分比比較多,其他幾個特別小,所以這里我們取兩個主成分進行降維,對應上訴代碼。
好的,代碼很簡單,原理並沒那么簡單,如果不了解原理可以多看看這方面的理論知識。
