oc與iloc函數
- loc函數
import pandas as pd import numpy # 導入數據 df = pd.read_csv(filepath_or_buffer="D://movie.csv") df_new = df.set_index(["country"]) df_new.loc[list(["Canada"])] # 1 df_new.loc[df_new["duration"]>160] # 2 df_new.loc[((df_new["duration"] > 200) & (df_new["director_facebook_likes"] > 300 )),"flage"] =1 # 3 df_new.loc[df_new["duration"].isin([100])] # 4 df_new.query("duration > 100 & index == 'UK'") # 5
1:根據列中的元素,選取對應元素的數據集
2:根據元素的選取條件來選取對應的數據集
3:根據元素的選取條件來來選取對應的數據集,並在符合條件的數據行添加flage標簽
4:isin函數是series用來判斷值是否在目標值是否在series
5:query函數中用來判斷條件符合的數據集並返回
- iloc函數
df_new.iloc[0:4]
iloc比較簡單,它是基於索引位來選取數據集,0:4就是選取 0,1,2,3這四行,需要注意的是這里是前閉后開集合
使用標簽選取數據:
-
df.loc[行標簽,列標簽]
-
df.loc['a':'b']#選取ab兩行數據
-
df.loc[:,'one']#選取one列的數據
df.loc的第一個參數是行標簽,第二個參數為列標簽(可選參數,默認為所有列標簽),兩個參數既可以是列表也可以是單個字符,如果兩個參數都為列表則返回的是DataFrame,否則,則為Series。