Python學習筆記:重復索引處理方法


一、介紹

Pandas 數據框中的索引可以重復,因此切片取數時需注意。

二、實操

1.判斷索引是否重復

  • Series 索引重復判斷
import pandas as pd
import numpy as np
# 重復索引 是否唯一
s = pd.Series([1,2,3,4,5], index=['a','a','b','c','d'])
s.index.is_unique # False
  • DataFrame 索引重復判斷
a = np.arange(9).reshape(3,3)
data = pd.DataFrame(a, 
                    index=['a','b','c'],
                    columns=['one','two','one'])
# 行索引是否重復
data.index.is_unique # True
# 列索引是否重復
data.columns.is_unique # False

2.索引取值

如果一個索引對應多個值,Series 返回的是一個 Series

如果一個索引對應一個值,Series 返回的是一個標量。

DataFrame 返回的始終是一個 DataFrame

  • Series 索引取值
s = pd.Series([1,2,3,4,5], index=['a','a','b','c','d'])
type(s['a']) # pandas.core.series.Series
s['a']
'''
a    1
a    2
dtype: int64
'''
  • DataFrame 索引取值
a = np.arange(9).reshape(3,3)
data = pd.DataFrame(a, 
                    index=['a','b','c'],
                    columns=['one','two','one'])
type(data.loc['b']) # pandas.core.series.Series

data['one']
'''
   one  one
a    0    2
b    3    5
c    6    8
'''

參考鏈接:pandas帶有重復索引操作方法


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM