幾種實現one-hot編碼的方式

本文轉載自查看原文 2018-03-25 17:29 2542 開發/ 數據挖掘

方法1

之前寫使用sklearn進行數據挖掘-房價預測(4)—數據預處理一文中處理標簽類特征時候已經提到過，使用sklearn中提供的LabelEncoder和OneHotEncoder方法

a = ['A','B','A','C']
from sklearn.preprocessing import OneHotEncoder,LabelEncoder
label_value = label_encoder.fit_transform(a)
>>label_encoder.classes_
array(['A', 'B', 'C'], dtype='<U1')
>>label_value 
array([0, 1, 0, 2], dtype=int64)
encoder = OneHotEncoder()
>>one_hot.toarray()
[[ 1. 0. 0.]
[ 0. 1. 0.]
[ 1. 0. 0.]
[ 0. 0. 1.]]

方法2

sklearn提供的簡單方法，上面兩步可以合並為一步

from sklearn.preprocessing import LabelBinarizer
encoder = LabelBinarizer()
one_hot = encoder.fit_transform(a)
>>one_hot
array([[1, 0, 0],
       [0, 1, 0],
       [1, 0, 0],
       [0, 0, 1]])

方法3

這次需要隆重介紹的是這個方法，在TensorFlow代碼中看到一個轉為one-hot的實現，方法比較的獨特，里面一些numpy方法自己之前也沒有接觸過，就摘抄下來，反復背誦並默寫 =。=

def dense_to_one_hot(labels_dense, num_classes):
   """Convert class labels from scalars to one-hot vectors."""
   num_labels = labels_dense.shape[0]
   index_offset = np.arange(num_labels) * num_classes
   labels_one_hot = np.zeros((num_labels, num_classes))
   labels_one_hot.flat[index_offset + labels_dense.ravel()] = 1
   return labels_one_hot

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 one-hot 編碼 Numpy 實現 One-hot One-Hot Encoding（獨熱編碼）離散型特征編碼方式：one-hot與啞變量* word2vec 獨熱編碼One-Hot 數據預處理：獨熱編碼（One-Hot Encoding）和 LabelEncoder標簽編碼【深度學習】softmax回歸——原理、one-hot編碼、結構和運算、交叉熵損失【知識相關】機器學習之獨熱編碼（One-Hot）詳解（代碼解釋）幾種常見編碼方式幾種編碼方式