主成分分析python代碼實現


主成分分析法代碼實現

之間我介紹過主成分份分析法,這里給出代碼實現

from sklearn.decomposition import PCA
import pandas as pd
import os

path="C:/Users/Administrator/Desktop/o25mso/homework/AMZN.csv"#存放文件路徑,這個文件在我的資源上傳里

df=pd.read_csv(path)#讀取文件

pca=PCA()#創建對象
df=(df.iloc[:,2:]-df.iloc[:,2:].mean())/df.iloc[:,2:].std()#對數據進行中心化處理
#print(df)
pca.fit(df)
print(pca.components_)#返回模型的各個特征向量
print(pca.explained_variance_ratio_)#返回各個成分各自的方差百分比
pca=PCA(2)#設置轉化主成分個數兩個
pca.fit(df)
low_d=pca.transform(df)
print(low_d)#返回降維后的數據

運行結果:
在這里插入圖片描述
上圖的結果分別為特征向量,和主成分所占的方差百分比,可以發現第一個和第二個主成分占的方差百分比比較多,其他幾個特別小,所以這里我們取兩個主成分進行降維,對應上訴代碼。

好的,代碼很簡單,原理並沒那么簡單,如果不了解原理可以多看看這方面的理論知識。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM