要求 根據貸款申請人的數據信息預測其是否有違約的可能,以此判斷是否通過此項貸款。 數據概況 總數據量超過120w,包含47列變量信息,其中15列為匿名變量。從中抽取80萬條作為訓練集,20萬條作為測試集A,20萬條作為測試集B,同時對employmentTitle、purpose ...
本系列是針對於DataWhale學習小組的筆記,從一個對統計學和機器學習理論基礎薄弱的初學者角度出發,在小組學習資料和其他網絡資源的基礎上,對知識進行總結和整理,今后有了新的理解可能還會不斷完善。由於水平實在有限,不免產生謬誤,歡迎讀者多多批評指正。如需要轉載請與博主聯系,謝謝 比賽核心思路 賽題內容理解 比賽目標及數據 本場比賽的目標屬於典型的分類問題,即依靠某信貸平台提供的超過 萬條貸款記錄, ...
2020-09-15 23:46 1 687 推薦指數:
要求 根據貸款申請人的數據信息預測其是否有違約的可能,以此判斷是否通過此項貸款。 數據概況 總數據量超過120w,包含47列變量信息,其中15列為匿名變量。從中抽取80萬條作為訓練集,20萬條作為測試集A,20萬條作為測試集B,同時對employmentTitle、purpose ...
模型融合 5.1 學習目標 將之前建模調參的結果進行模型融合。 嘗試多種融合方案,提交融合結果並打卡。(模型融合一般用於A榜比賽的尾聲和B榜比賽的全程) 5.2 內容介紹 模型融合是比賽后期上分的重要手段,特別是多人組隊學習的比賽中,將不同隊友的模型進行融合,可能會收獲意想不到的效果 ...
特征工程 項目地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskCont ...
貸款違約預測-賽題理解&基線預測 天池魚佬直播 原網址: https://tianchi.aliyun.com/course/video?liveId=41203 下載地址: https://tianchi-media.oss-cn-beijing.aliyuncs.com ...
一、賽題數據 數據大家可以到官網去下載:https://tianchi.aliyun.com/competition/entrance/531830/information需要報名后才可以下載數據 賽題以預測用戶貸款是否違約為任務,數據集報名后可見並可下載,該數據來自某信貸平台的貸款記錄,總數 ...
建模與調參 4.1 學習目標 學習在金融分控領域常用的機器學習模型 學習機器學習模型的建模過程與調參流程 4.2 內容介紹 邏輯回歸模型: 理解邏輯回歸模型; 邏輯回歸模型的應用; 邏輯回歸的優缺點; 樹模型 ...
本文根據阿里天池學習賽《快來一起挖掘幸福感!》撰寫 加載數據 加載的是完整版的數據 happiness_train_complete.csv 。 數據集基本信息的探索 下面簡單輸出前5行查看。 .dataframe tbody tr th ...
零基礎入門金融風控-貸款違約預測 Task02 探索性數據分析 Task02目的: 熟悉整體數據集的基本情況,異常值,缺失值等, 判斷數據集是否可以進行接下來的機器學習或者深度學習建模. 了解變量間的項目關系/變量與預測值之間的存在關系 為特征工程作准備 准備數據 ...