DataFrame運算


算術運算

  • 加法—series對象.add(值)
  • 減法—series對象.sub(值/對象)

邏輯運算符號<、 >、|、 &

  1. 邏輯運算符號<、 >、|、 &—等價於sql中的where語句
    • 等價於numpy的邏輯運算
    • 返回的是布爾類型的對象(series/df)
  2. 邏輯運算函數
    • df.query()—相當於查詢
    • series.isin(列表)---返回一個布爾series —sql里的 in關鍵詞

統計運算

describe()
綜合分析: 能夠直接得出很多統計結果,count, mean, std, min, max 等

# 計算平均值、標准差、最大值、最小值
data.describe()

統計函數
min(最小值), max(最大值), mean(平均值), median(中位數), var(方差), std(標准差),mode(眾數)結果

對於單個函數去進行統計的時候,坐標軸還是按照這些默認為“columns” (axis=0, default),如果要對行“index” 需要指定(axis=1)

  • df.max(axis=0/1) 0-列 1-行 min sum
  • df.idxmax(axis=0/1)- 最大值所在索引值

累計統計函數

  • 觀察原數據不容易觀察到的信息
  • series.cumsum--返回結果不是一個值

自定義運算
df.apply(func,axis)

  1. func—函數
  2. axis指定計算的軸

data[['open', 'close']].apply(lambda x: x.max() - x.min(), axis=0)

open     22.74
close    22.85
dtype: float64


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM