使用sklearn之LabelEncoder將Label標准化

本文轉載自查看原文 2020-04-30 20:53 789

LabelEncoder可以將標簽分配一個0—n_classes-1之間的編碼
將各種標簽分配一個可數的連續編號

將DataFrame中的每一行ID標簽分別轉換成連續編號：

import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.pipeline import Pipeline


class MultiColumnLabelEncoder:
    def __init__(self,columns = None):
        self.columns = columns # array of column names to encode

    def fit(self,X,y=None):
        return self # not relevant here

    def transform(self,X):
        '''
        Transforms columns of X specified in self.columns using
        LabelEncoder(). If no columns specified, transforms all
        columns in X.
        '''
        output = X.copy()
        if self.columns is not None:
            for col in self.columns:
                output[col] = LabelEncoder().fit_transform(output[col])
        else:
            for colname,col in output.iteritems():
                output[colname] = LabelEncoder().fit_transform(col)
        return output

    def fit_transform(self,X,y=None):
        return self.fit(X,y).transform(X)

fruit_data[['fruit','color']]=fruit_data[['fruit','color']].apply(LabelEncoder().fit_transform)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 sklearn——數據標准化 sklearn5_preprocessing數據標准化【原】關於使用sklearn進行數據預處理 —— 歸一化/標准化/正則化 sklearn中的數據預處理----good!! 標准化歸一化在何時使用 sklearn中實現標准化、歸一化歸一化和標准化的差別在哪里？ sklearn api sklearn.preprocessing歸一化標准化等 sklearn.preprocessing.StandardScaler數據標准化 sklearn.preprocessing.StandardScaler數據標准化 sklearn.preprocessing.LabelEncoder的使用