1、創建數據框或讀取外部csv文件
- 創建數據框數據
""" 設計數據 """
import pandas as pd
data = {"A": [2,3,9], "B": [4,6,11], "C": [5,6,12], "D": [6,1,5]}
index = ["X","Y","Z"]
df = pd.DataFrame(data=data, index=index)
print(df)
- 讀取外部csv文件(關於“header=None”設定的問題參照 pandas.read_csv()函數讀取文件時,關於“header=None”影響讀取列數區間的右閉合總結 )
""" 讀取數據 """
import pandas as pd
df = pd.read_csv("data/data.csv", header=None)
2、重置索引
import pandas as pd
""" 設計數據 """
data = {"A": [2,3,9], "B": [4,6,11], "C": [5,6,12], "D": [6,1,5]}
index = ["X","Y","Z"]
df = pd.DataFrame(data=data, index=index)
""" 重置索引,從0開始計數 """
# 獲取行數
nrow = df.shape[0]
# 獲取列數
ncol = df.shape[1]
print("該數據框有%d行, %d列" %(nrow,ncol))
# 重置行索引
df.index = range(nrow)
# df.index = [1,2,3] # 也可以使用自定義手動方式
# 重置列索引
df.columns = range(ncol)
print(df)
3、行列讀取
- 讀取列
import pandas as pd
""" 設計數據 """
data = {"A": [2,3,9], "B": [4,6,11], "C": [5,6,12], "D": [6,1,5]}
index = ["X","Y","Z"]
df = pd.DataFrame(data=data, index=index)
""" 讀取數據框 """
# 讀取列
a = df.ix[:, 0] # 讀取單列——第0列
b = df.ix[:, 0:2] # 讀取連續列——第0,1,2列
c = df.ix[:, [0,2]] # 讀取指定某些列——第0,2列
print(a)
print(b)
print(c)
- 讀取行(同理)
# 讀取行
d = df.ix[0, :] # 讀取單行——第0行
e = df.ix[0:2, :] # 讀取連續行——第0,1,2行
f = df.ix[[0,2], :] # 讀取指定某些行——第0,2行
print(d)
print(e)
print(f)
4、數據合並
""" 數據合並 """
import pandas as pd
data1 = {"0": [2,3,9], "1": [4,6,11], "2": [5,6,12], "3": [6,1,5]}
index = [0,1,2]
df1 = pd.DataFrame(data=data1, index=index)
data2 = {"4": [3,9,11], "5": [4,6,20]}
df2 = pd.DataFrame(data=data2, index=index)
# 合並數據框(合並前需要確保數據是DataFrame格式), 其中,如果axis=1,ignore_index將改變的是列上的索引(屬性名)
df = pd.concat([pd.DataFrame(df1), pd.DataFrame(df2)], axis=1) # axis=1 表示橫向合並(左右);axis=0 表示縱向合並(上下)
print(df)
df1:
df2:
df: