kaggle比賽心得


參賽歷程

比賽時間:3.10-4.11

歷時一個多月,無論是知識眼界還是心態方面,都有了較大的改變。剛開始選這個賽題,沒有什么特別的地方,順眼就是了。直到着手准備這個比賽的時候,才發現,事情並不簡單,雖然數據集只有訓練集和測試集以及一個提交結果的樣本,

但是數據沒有任何的說明,(數據應該都是從客戶那里收集的,所以主辦方為了保護客戶的隱私,做了脫敏處理)除了ID_code都是數值型的數據,可是它們代表的是什么我們並不知道,這就需要我們不斷地畫圖觀察各個特征與標簽的相關性,

加上比賽的目的是為了預測客戶是否會進行交易,這就需要我們用大量的數據去建立一個適合的模型,我們選擇的模型是LGB模型,現在大部分的比賽都會用到lgb,當然xgb,cnn,nn這些模型也是當下比較‘紅’的模型。也是帶着學習的心態參加這個比

賽,kaggle平台上有很多的專業人士發表含金量高的內核供我們學習,這一點對我們打比賽有着很大的幫助,最后是在公共排行榜上取得了403的成績,銀牌區,總共9038個隊伍參賽。

 

收獲:對特征工程和模型融合有了進一步的認識和了解,並且意識到了特征工程的重要性,也接觸到了很多python包和功能強大的函數。

心得:做一件事情一定要有始有終,我們在打比賽的第二三周是低谷期,因為准確率始終達不到我們的要求,並且排名也逐漸被刷到九百名開外,后來也是不放棄,有了一次較大的突破,成績最好的時候直奔82名。充分地認識到了我們和kaggle大

神們的差距,也意味着未來還有很長的一段路要走。繼續加油吧,還有頭發,還能再學。QAQ


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM