基於pandas索引的數據查找、排序和去重小結

本文轉載自查看原文 2019-11-04 18:40 1343 Python

由於Pandas的索引比較復雜，常常在使用過程中容易搞混，所以整理一份關於索引的查找、排序、去重的總結文檔。

import pandas as pd
import numpy as np

#定義DataFrame
dict={'a':[1,2,3],'b':[4,5,6],'c':[7,8,9]}
df=pd.DataFrame(dict,index=['one','two','three'])
df

可用Index ,也可用數字下標

s1=df['b']
s1['two']
s1[['two','one']]  # 用數組列出離散的標簽，要用[ ]括起來
s1['two':'three']  # 標簽切片
s1[0:2]            # 標號切片的右區間是開的

(1) 直接通過列索引取列

df['b']
df[['b','c']]  # 用數組列出離散的標簽，要用[ ]括起來

(2) .loc 通過標簽索引數據

df.loc[['two','one']]   #索引多行，行名用數組
df.loc['two':'three']   #索引多行，行名用切片
df.loc[:,['b','a']] #索引某行多列，列名用數組
df.loc[:,'b':'a']   #索引某行多列，列名用切片

(3) .iloc 通過通過標號獲取數據

df.iloc[1:3,1:3]

df.set_index('a', inplace=True)  # inplace=True 會在原變量直接改，沒有返回值
df

df1=df.set_index('a', inplace=False)  # inplace=False則有返回值(默認),原變量不變
df1

df.reset_index(inplace=True) 
df

df.sort_index(ascending=True, inplace=False, na_position='first')

df=df[~df.index.duplicated(keep='first')]

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 pandas數據查找替換使用hive數據查詢小結根據list中對象的屬性去重和排序小結 Echarts實例中json數據查找海量數據查找中位數 Json列表數據查找更新 pandas 數據索引與選取 EF 數據查詢（更改默認排序） MongoDB學習（查找文檔和其他數據查找操作） [Python] Pandas 對數據進行查找、替換、篩選、排序、重復值和缺失值處理