導入特征提取化中的字典向量化
from sklearn.feature_extraction import DictVectorizer
dv = DictVectorizer ()
x_train = dv.fit_transform(x_train)
x_test = dv.fit_transform(x_test)
此處的fit是找到當前字典中的鍵
舉個例子:
如果x_test不fit,那x_test只能轉化x_train中的鍵,它不能轉化自己有但是x_train中沒有的鍵。
當然如果二者鍵名完全相同,x_test可以直接transform,二者結果無區別。