參賽歷程
比賽時間:3.10-4.11
歷時一個多月,無論是知識眼界還是心態方面,都有了較大的改變。剛開始選這個賽題,沒有什么特別的地方,順眼就是了。直到着手准備這個比賽的時候,才發現,事情並不簡單,雖然數據集只有訓練集和測試集以及一個提交結果的樣本,
但是數據沒有任何的說明,(數據應該都是從客戶那里收集的,所以主辦方為了保護客戶的隱私,做了脫敏處理)除了ID_code都是數值型的數據,可是它們代表的是什么我們並不知道,這就需要我們不斷地畫圖觀察各個特征與標簽的相關性,
加上比賽的目的是為了預測客戶是否會進行交易,這就需要我們用大量的數據去建立一個適合的模型,我們選擇的模型是LGB模型,現在大部分的比賽都會用到lgb,當然xgb,cnn,nn這些模型也是當下比較‘紅’的模型。也是帶着學習的心態參加這個比
賽,kaggle平台上有很多的專業人士發表含金量高的內核供我們學習,這一點對我們打比賽有着很大的幫助,最后是在公共排行榜上取得了403的成績,銀牌區,總共9038個隊伍參賽。
收獲:對特征工程和模型融合有了進一步的認識和了解,並且意識到了特征工程的重要性,也接觸到了很多python包和功能強大的函數。
心得:做一件事情一定要有始有終,我們在打比賽的第二三周是低谷期,因為准確率始終達不到我們的要求,並且排名也逐漸被刷到九百名開外,后來也是不放棄,有了一次較大的突破,成績最好的時候直奔82名。充分地認識到了我們和kaggle大
神們的差距,也意味着未來還有很長的一段路要走。繼續加油吧,還有頭發,還能再學。QAQ