本次競賽提供的數據源一共有五個,依次做特征提取 一、信用卡賬單特征提取 1、基本思路:將數據分成時間已知時間未知兩部分,時間已知中再分成放款前的數據和放款后的數據,放款前放款后的再分成去重的數據和不去重數據,最終對數據做sum,count,mean,max,min,median,std等指標 ...
競賽地址:http: www.pkbigdata.com common cmpt E A E B E B B E AC BE E A E E A E A E B B E B B E BD E B E E B E D AE.html 數據探索: 比賽一共提供五張表,分別是: 訓練數據:用戶基本屬性,銀行流水記錄,用戶瀏覽行為,信用卡賬單記錄,放款時間,是否逾期 測試數據:用戶基本屬性,銀行流水記錄, ...
2018-04-03 10:44 0 2264 推薦指數:
本次競賽提供的數據源一共有五個,依次做特征提取 一、信用卡賬單特征提取 1、基本思路:將數據分成時間已知時間未知兩部分,時間已知中再分成放款前的數據和放款后的數據,放款前放款后的再分成去重的數據和不去重數據,最終對數據做sum,count,mean,max,min,median,std等指標 ...
數據源:融360-用戶貸款風險預測 參考資料:https://www.jianshu.com/p/aba5685c580a 流程如下: 項目目標 數據解讀 數據預處理 特征工程 1.基於業務理解篩選 2.基於機器學習篩選 模型建立 一、項目目標 ...
零基礎入門金融風控-貸款違約預測 Task02 探索性數據分析 Task02目的: 熟悉整體數據集的基本情況,異常值,缺失值等, 判斷數據集是否可以進行接下來的機器學習或者深度學習建模. 了解變量間的項目關系/變量與預測值之間的存在關系 為特征工程作准備 准備數據 ...
,返料風,給水水量;以及鍋爐的工況,比如鍋爐床溫、床壓,爐膛溫度、壓力,過熱器的溫度等。 數據為:經 ...
一、賽題數據 數據大家可以到官網去下載:https://tianchi.aliyun.com/competition/entrance/531830/information需要報名后才可以下載數據 賽題以預測用戶貸款是否違約為任務,數據集報名后可見並可下載,該數據來自某信貸平台的貸款記錄,總數據 ...
要求 根據貸款申請人的數據信息預測其是否有違約的可能,以此判斷是否通過此項貸款。 數據概況 總數據量超過120w,包含47列變量信息,其中15列為匿名變量。從中抽取80萬條作為訓練集,20萬條作為測試集A,20萬條作為測試集B,同時對employmentTitle、purpose ...
工具導入和數據讀取 工具導入 數據讀取 數據集樣例查看 user_id merchant_id label 0 34176 3906 1 34176 ...
文章目錄 1、明確需求和目的 現代社會,越來越多的人使用信用卡進行消費,大部分人使用信用卡之后會按時還款,但仍然有少部分人不能在約定時間進行還款,這大大的增加了銀行或者金融機構的風險。 本文以某金融機構的歷史數據進行建模分析,對客戶的還款能力進行評估,以預測新客戶 ...