【LDA】線性判別分析
參數:
solver:一個字符串,指定了求解最優化問題的算法,可以為如下的值。
- 'svd':奇異值分解。對於有大規模特征的數據,推薦用這種算法。
- 'lsqr':最小平方差,可以結合skrinkage參數。
- 'eigen' :特征分解算法,可以結合shrinkage參數。
skrinkage:字符串‘auto’或者浮點數活者None。該參數通常在訓練樣本數量小於特征數量的場合下使用。該參數只有在solver=lsqr或者eigen下才有意義
- '字符串‘auto’:根據Ledoit-Wolf引理來自動決定shrinkage參數的大小。
- 'None:不使用shrinkage參數。
- 浮點數(位於0~1之間):指定shrinkage參數。
priors:一個數組,數組中的元素依次指定了每個類別的先驗概率。如果為None,則認為每個類的先驗概率都是等可能的。
n_components:一個整數。指定了數組降維后的維度(該值必須小於n_classes-1)。
store_covariance:一個布爾值。如果為True,則需要額外計算每個類別的協方差矩陣。
warm_start:一個布爾值。如果為True,那么使用前一次訓練結果繼續訓練,否則從頭開始訓練。
tol:一個浮點數。它指定了用於SVD算法中評判迭代收斂的閾值。
返回值
coef_:權重向量。
intercept:b值。
covariance_:一個數組,依次給出了每個類別煩人協方差矩陣。
means_:一個數組,依次給出了每個類別的均值向量。
xbar_:給出了整體樣本的均值向量。
n_iter_:實際迭代次數。
方法
fix(X,y):訓練模型。
predict(X):用模型進行預測,返回預測值。
score(X,y[,sample_weight]):返回(X,y)上的預測准確率(accuracy)。
predict_log_proba(X):返回一個數組,數組的元素一次是 X 預測為各個類別的概率的對數值。
predict_proba(X):返回一個數組,數組元素一次是 X 預測為各個類別的概率的概率值
predict_proba(X):返回一個數組,數組元素一次是 X 預測為各個類別的概率的概率值