機器學習之路： python 實踐提升樹 XGBoost 分類器

本文轉載自查看原文 2018-05-08 16:53 1580 機器學習

git: https://github.com/linyi0604/MachineLearning

數據集被我下載到本地，可以去我的git上拿數據集

XGBoost
提升分類器
屬於集成學習模型
把成百上千個分類准確率較低的樹模型組合起來
不斷迭代,每次迭代生成一顆新的樹

下面對泰坦尼克遇難預測
使用XGBoost模型和其他分類器性能進行比較

 1 import pandas as pd
 2 from sklearn.cross_validation import train_test_split
 3 from sklearn.feature_extraction import DictVectorizer
 4 from sklearn.ensemble import RandomForestClassifier
 5 from xgboost import XGBClassifier
 6 
 7 '''
 8 XGBoost
 9 提升分類器
10     屬於集成學習模型
11     把成百上千個分類准確率較低的樹模型組合起來
12     不斷迭代,每次迭代生成一顆新的樹
13     
14     
15 下面 對泰坦尼克遇難預測
16 使用XGBoost模型 和 其他分類器性能進行比較
17 
18 '''
19 
20 titanic = pd.read_csv("../data/titanic/titanic.txt")
21 # 抽取pclass age 和 sex 作為訓練樣本
22 x = titanic[["pclass", "age", "sex"]]
23 y = titanic["survived"]
24 # 采集的age空的用平均數補全
25 x["age"].fillna(x["age"].mean(), inplace=True)
26 
27 # 分割訓練數據和測試數據
28 x_train, x_test, y_train, y_test = train_test_split(x,
29                                                     y,
30                                                     test_size=0.25,
31                                                     random_state=33)
32 # 提取字典特征 進行 向量化
33 vec = DictVectorizer()
34 x_train = vec.fit_transform(x_train.to_dict(orient="record"))
35 x_test = vec.transform(x_test.to_dict(orient="record"))
36 
37 # 采用默認配置的隨機森林進行預測
38 rfc = RandomForestClassifier()
39 rfc.fit(x_train, y_train)
40 print("隨機森林預測准確率:", rfc.score(x_test, y_test))  # 0.7811550151975684
41 
42 # 采用XGBoost模型進行預測
43 xgbc = XGBClassifier()
44 xgbc.fit(x_train, y_train)
45 print("XGBoost預測准確率:", xgbc.score(x_test, y_test))  # 0.7872340425531915

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習之路：python 集成分類器隨機森林分類RandomForestClassifier 梯度提升決策樹分類GradientBoostingClassifier 預測泰坦尼克號幸存者機器學習之路: python k近鄰分類器 KNeighborsClassifier 鳶尾花分類預測菜鳥之路——機器學習之SVM分類器學習理解以及Python實現機器學習之路： python 朴素貝葉斯分類器 MultinomialNB 預測新聞類別 Python機器學習筆記(1)——貝葉斯分類器—MultinomialNB Python機器學習(5)——朴素貝葉斯分類器機器學習之路：python線性回歸分類器 LogisticRegression SGDClassifier 進行良惡性腫瘤分類預測機器學習筆記14-----SVM實踐和分類器的性能的評價指標(了解python畫圖的技巧) 機器學習sklearn（88）：算法實例（45）分類（24）XGBoost（二）梯度提升樹（一）重要參數n_estimators Python機器學習（基礎篇---監督學習（線性分類器））

機器學習之路： python 實踐 提升樹 XGBoost 分類器

免責聲明！

機器學習之路： python 實踐提升樹 XGBoost 分類器