一個ndarray是一個多維同類數據容器。每一個數組有一個dtype屬性,用來描述數組的數據類型。
Series是一種一維數組型對象,包含了一個值序列,並且包含了數據標簽----索引(index)。
DataFrame每一列可以是不同類型,即有行索引,又有列索引,可以被是為一個共享相同索引的Series字典。盡管DataFrame是二維的,但可以利用分層索引在DataFrame中展現更高維度的數據。
一、Series、DataFrame---->narray
1)pd.values
In [134]: arr1 Out[134]: a b c a1 100 1 1 b2 10 2 2 In [135]: arr1.values Out[135]: array([[100, 1, 1], [ 10, 2, 2]])
2)np.array(pd)
In [140]: np.array(arr1) Out[140]: array([[100, 1, 1], [ 10, 2, 2]])
3)pd.as_matrix()
In [138]: arr1.as_matrix() /usr/local/bin/ipython:1: FutureWarning: Method .as_matrix will be removed in a future version. Use .values instead. #!/usr/bin/python3 Out[138]: array([[100, 1, 1], [ 10, 2, 2]])
第三種方式會被remove就用第一二種吧
二、narray---->Series、DataFrame
In [161]: arr3 Out[161]: array([0, 1, 2, 3]) In [162]: pd.Series(arr3,index=['a','b','c','d']) Out[162]: a 0 b 1 c 2 d 3 dtype: int64 In [163]: pd.DataFrame(arr3,index=['a','b','c','d']) Out[163]: 0 a 0 b 1 c 2 d 3