pipeline管道機制使用方法:
流水線的輸入為一連串的數據挖掘步驟,其中最后一步必須是估計器(Estimator),可理解成分類器
前幾步是轉換器(Transformer)。輸入的數據集經過轉換器的處理后,輸出的結果作為下一步的輸入。
最后,用位於流水線最后一步的估計器對數據進行分類。
每一步都用元組( ‘名稱’,步驟)來表示。現在來創建流水線。
當我們執行 pipe.fit(X_train, y_train)
時,首先由StandardScaler在訓練集上執行 fit和transform方法,transformed后的數據又被傳遞給Pipeline對象的下一步,也即PCA()。和StandardScaler一樣,PCA也是執行fit和transform方法,最終將轉換后的數據傳遞給 LosigsticRegression。