Pandas-reindex中關於填充缺失值的幾個方法


在學習Pandas時,當對一個Series或者DataFrame進行重新索引時,需要用到pandas.Series.reindex()或者pandas.DataFrame.reindex()。當某個索引值不存在時,會直接引入缺失值NaN。我們可以通過填充的方式,使Series或者DataFrame中新的index擁有新的索引。這篇文章整理下reindex中關於填充缺失值的幾個方法

索引對象是無法修改的,因此,重新索引是指對索引重新排序而不是重新命名,如果某個索引值不存在的話,會引入缺失值

obj.reindex(['a','b','c','d','e']) #重新填充

對於重建索引引入的缺失值,可以利用fill_value參數填充。

對於順序數據,比如時間序列,重新索引時可能需要進行插值或填值處理,利用參數method選項可以設置:

method = ‘ffill’或‘pad’,表示前向值填充 (#根據前面的值填充)

method = ‘bfill’或‘backfill’,表示后向值填充(#根據后面的值填充)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM