原文:【第17期Datawhale | 零基礎入門金融風控-貸款違約預測】Task02打卡:探索性數據分析 【pandas_profiling生成數據報告異常,解決后單開一篇】

零基礎入門金融風控 貸款違約預測 Task 探索性數據分析 Task 目的: 熟悉整體數據集的基本情況,異常值,缺失值等, 判斷數據集是否可以進行接下來的機器學習或者深度學習建模. 了解變量間的項目關系 變量與預測值之間的存在關系 為特征工程作准備 准備數據 輸出 易得 結果列 isDefault testA相較於train多出兩列: n . n . . . 通過nrows參數, 來設置讀取文件的 ...

2020-09-18 23:01 0 467 推薦指數:

查看詳情

【第17Datawhale | 零基礎入門金融-貸款違約預測Task03打卡:特征工程之特征預處理、異常值處理、數據分桶、特征交互、特征編碼、特征選擇等 【留了大量TODO需要深入學習】

md 零基礎入門金融-貸款違約預測 Task03 特征工程 Task03目的: 學習特征預處理/缺失值處理/異常值處理/數據分桶等特征處理方法 學習特征交互/特征編碼/特征選擇的相應方法 0.0 導包 0.1 公共變量 0.2 數據讀取pandas ...

Tue Sep 22 07:50:00 CST 2020 0 440
阿里雲的金融-貸款違約預測_數據分析

一、賽題數據 數據大家可以到官網去下載:https://tianchi.aliyun.com/competition/entrance/531830/information需要報名才可以下載數據 賽題以預測用戶貸款是否違約為任務,數據集報名可見並可下載,該數據來自某信貸平台的貸款記錄,總數據 ...

Fri Sep 11 23:21:00 CST 2020 0 1519
探索性數據分析

探索性數據分析(Exploratory Data Analysis,EDA)是指對已有數據在盡量少的先驗假設下通過作圖、制表、方程擬合、計算特征量等手段探索數據的結構和規律的一種數據分析方法,該方法在上世紀70年代由美國統計學家J.K.Tukey提出。傳統的統計分析方法常常先假設數據 ...

Sun May 19 00:24:00 CST 2019 0 996
探索性數據分析

簡介   探索性數據分析所謂探索性數據分析( Exploratory Data Analysis )以下簡稱EDA,是指對已有的數據( 特別是調查或觀察得來的原始數據 )在盡量少的先驗假定下進行探索通過作圖、制表、方程擬合、計算特征量等手段探索數據的結構和規律的一種數據分析方法。 目錄 ...

Sun Sep 03 04:03:00 CST 2017 0 1671
金融貸款違約預測筆記

要求 根據貸款申請人的數據信息預測其是否有違約的可能,以此判斷是否通過此項貸款數據概況 總數據量超過120w,包含47列變量信息,其中15列為匿名變量。從中抽取80萬條作為訓練集,20萬條作為測試集A,20萬條作為測試集B,同時對employmentTitle、purpose ...

Wed Sep 16 22:38:00 CST 2020 0 500
數據分析(一)探索性分析

。   我們對大數據以及大數據分析完全沒有頭緒,我們甚至對大數據技術產生了迷茫,產生了退縮。   當我們拿到 ...

Wed Dec 30 10:31:00 CST 2015 0 5904
探索性數據分析EDA綜述

目錄 1. 數據探索的步驟和准備 2. 缺失值處理 為什么需要處理缺失值 Why data has missing values? 缺失值處理的技術 3. 異常值檢測和處理 What is an outlier? What are the types ...

Sat Oct 06 05:40:00 CST 2018 0 986
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM