numpy中的ndarray與pandas中的series、dataframe的轉換


一個ndarray是一個多維同類數據容器。每一個數組有一個dtype屬性,用來描述數組的數據類型。

Series是一種一維數組型對象,包含了一個值序列,並且包含了數據標簽----索引(index)。

DataFrame每一列可以是不同類型,即有行索引,又有列索引,可以被是為一個共享相同索引的Series字典。盡管DataFrame是二維的,但可以利用分層索引在DataFrame中展現更高維度的數據。

一、Series、DataFrame---->narray

1)pd.values

In [134]: arr1                                                                 
Out[134]: 
      a  b  c
a1  100  1  1
b2   10  2  2

In [135]: arr1.values                                                          
Out[135]: 
array([[100,   1,   1],
       [ 10,   2,   2]])

2)np.array(pd)

In [140]: np.array(arr1)                                                       
Out[140]: 
array([[100,   1,   1],
       [ 10,   2,   2]])

3)pd.as_matrix()

In [138]: arr1.as_matrix()                                                     
/usr/local/bin/ipython:1: FutureWarning: Method .as_matrix will be removed in a future version. Use .values instead.
  #!/usr/bin/python3
Out[138]: 
array([[100,   1,   1],
       [ 10,   2,   2]])

第三種方式會被remove就用第一二種吧

二、narray---->Series、DataFrame

In [161]: arr3                                                                 
Out[161]: array([0, 1, 2, 3])

In [162]: pd.Series(arr3,index=['a','b','c','d'])                              
Out[162]: 
a    0
b    1
c    2
d    3
dtype: int64

In [163]: pd.DataFrame(arr3,index=['a','b','c','d'])                           
Out[163]: 
   0
a  0
b  1
c  2
d  3

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM