利用Python進行數據分析_Pandas_處理缺失數據


申明:本系列文章是自己在學習《利用Python進行數據分析》這本書的過程中,為了方便后期自己鞏固知識而整理。

 1 讀取excel數據

import pandas as pd
import numpy as np
file = 'D:\example.xls'
df = pd.DataFrame(pd.read_excel(file))
df

2 檢測缺失值

2.1 isnull返回一個含有布爾值的對象

import pandas as pd
import numpy as np
file = 'D:\example.xls'
df = pd.DataFrame(pd.read_excel(file))
df = df.isnull()
df

2.2 notnull  是isnull 的否定式

import pandas as pd
import numpy as np
file = 'D:\example.xls'
df = pd.DataFrame(pd.read_excel(file))
df = df.notnull()
df

3 濾除缺失數據

3.1 濾除所有包含缺失值的行

df.dropna()

3.2 查看不含缺失值的所有行、列

df.dropna(thresh=4)

4 填充缺失數據

DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)

4.1 統一填充某一個值value

df.fillna(0)或df.fillna(value=0)

4.2 用前面的值填充缺失部分

df.fillna(method='ffill')

4.3 用后面的值填充缺失部分

df.fillna(method='bfill')

4.3 某N列用特定的值填充缺失部分

df.fillna({'起息日':'2018-12-11','評級得分':'100'})

4.4 指定一整個軸的值填充缺失部分

df.fillna(method='ffill',axis=1)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM