機器學習之路：python 字典特征提取器 DictVectorizer

本文轉載自查看原文 2018-04-30 11:33 3128 機器學習

python3 學習使用api

將字典類型數據結構的樣本，抽取特征，轉化成向量形式

源碼git: https://github.com/linyi0604/MachineLearning

代碼：

 1 from sklearn.feature_extraction import DictVectorizer
 2 
 3 '''
 4 字典特征提取器：
 5     將字典數據結構抽和向量化
 6     類別類型特征借助原型特征名稱采用0 1 二值方式進行向量化
 7     數值類型特征保持不變
 8 '''
 9 
10 # 定義一個字典列表 用來表示多個數據樣本
11 measurements = [
12     {"city": "Dubai", "temperature": 33.0},
13     {"city": "London", "temperature": 12.0},
14     {"city": "San Fransisco", "temperature": 18.0},
15 ]
16 
17 # 初始化字典特征抽取器
18 vec = DictVectorizer()
19 data = vec.fit_transform(measurements).toarray()
20 # 查看提取后的特征值
21 print(data)
22 '''
23 [[ 1.  0.  0. 33.]
24  [ 0.  1.  0. 12.]
25  [ 0.  0.  1. 18.]]
26 '''
27 # 查看提取后特征的含義
28 print(vec.get_feature_names())
29 '''
30 ['city=Dubai', 'city=London', 'city=San Fransisco', 'temperature']
31 '''

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習之路： python nltk 文本特征提取機器學習之路：python 文本特征提取 CountVectorizer, TfidfVectorizer 機器學習之文本特征提取機器學習之數據清洗與特征提取機器學習算法選擇——特征提取特征提取（機器學習數據預處理）機器學習概念之特征提取（Feature extraction） Python_sklearn機器學習庫學習筆記（一）_Feature Extraction and Preprocessing(特征提取與預處理）漫談機器學習經典算法—特征提取與特征選擇文本分類學習（五）機器學習SVM的前奏-特征提取（卡方檢驗續集）