基本操作
import pandas as pd #導入pandas包 data = pd.read_csv("train.csv") #讀取csv文件 data = pd.read_csv("train.csv", nrows=15) #讀取前n行 data = pd.read_csv("train.csv", usecols=['helpful_votes', 'total_votes']) #讀取前n行 //train=pd.read_csv('hair_dryer.tsv', sep='\t') #讀取tsv格式 print(data) #打印所有文件 //data.head() //data.tail() print (data.head(5)) #打印前5行 print (data.head(5)) #打印前5行 print(data.columns) #返回全部列名 print(data.shape) #f返回csv文件形狀 print(data.loc[2:10]) #打印第2到10行 data.loc[2:4, ['PassengerId', 'Sex']] #打印行中特定列 # 列名 print(df.columns) # 索引 print(df.index)
數據分析
獲取指定類的前n位字符串

對某列求和,或者分組求和


獲取列名與索引:

按照某一列篩選:

按照某一列或者某幾列進行排序:

取出某一列的值(返回值為array數列):

簡單的個數統計:

將表格中的某幾列拆分出來:

pandas中的map函數:

pandas中的applymap函數:

以上內容來自下面鏈接,這里只是做個匯總!
1. https://blog.csdn.net/xz1308579340/article/details/81106310
