python數據分析之pandas庫的Series應用


一、pandas的數據結構介紹

1. Series

1.1 Series是由一種類似於一維數組的對象,它由一組數據以及一組與之相關的數據索引構成。僅由一組數據可產生最簡單的Series。 

from pandas import *

obj=Series([4,5,-7,6])

print  obj
print  obj[1]
通過索引獲取數組值

 

1.2Series的數組運算會保留索引與值的連接

from pandas import *

obj2=Series([4,7,-5,3],index=['d','b','a','c'])

print obj2
print obj2[obj2>0]
print obj2*2
1.2數組運算保留索引與值的對應

1.3如果數據存放在一個字典中,可以根據這個字典來創建Series,Series中的索引就是原字典的鍵

  字典是Python語言中唯一的映射類型。

  映射類型對象里哈希值(鍵,key)和指向的對象(值,value)是一對多的的關系,通常被認為是可變的哈希表。

  字典對象是可變的,它是一個容器類型,能存儲任意個數的Python對象,其中也可包括其他容器類型。

      adict = {key1:value2, key2:value2, …}

  字典特點:
  1)、鍵與值用冒號“:”分開;
  2)、項與項用逗號“,”分開;
  3)、字典中的鍵必須是唯一的,而值可以不唯一。

from pandas import *

sdata={'ohio':35000,'texas':71000,'oregon':16000,'utah':5000}

obj3=Series(sdata)
print obj3

obj4=Series(sdata,index=['california','ohio','oregon','texas'])
print obj4
數據存放在一個字典

 

1.4 Series最重要的功能是在算術運算中會自動對齊不同的索引數據

from pandas import *

sdata={'ohio':35000,'texas':71000,'oregon':16000,'utah':5000}

obj3=Series(sdata)
print obj3

obj4=Series(sdata,index=['california','ohio','oregon','texas'])
print obj4

print obj3+obj4
按索引自動對應並計算

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM