一、pandas的數據結構介紹
1. Series
1.1 Series是由一種類似於一維數組的對象,它由一組數據以及一組與之相關的數據索引構成。僅由一組數據可產生最簡單的Series。

from pandas import * obj=Series([4,5,-7,6]) print obj print obj[1]
1.2Series的數組運算會保留索引與值的連接

from pandas import * obj2=Series([4,7,-5,3],index=['d','b','a','c']) print obj2 print obj2[obj2>0] print obj2*2
1.3如果數據存放在一個字典中,可以根據這個字典來創建Series,Series中的索引就是原字典的鍵
字典是Python語言中唯一的映射類型。
映射類型對象里哈希值(鍵,key)和指向的對象(值,value)是一對多的的關系,通常被認為是可變的哈希表。
字典對象是可變的,它是一個容器類型,能存儲任意個數的Python對象,其中也可包括其他容器類型。
adict = {key1:value2, key2:value2, …}
字典特點:
1)、鍵與值用冒號“:”分開;
2)、項與項用逗號“,”分開;
3)、字典中的鍵必須是唯一的,而值可以不唯一。

from pandas import * sdata={'ohio':35000,'texas':71000,'oregon':16000,'utah':5000} obj3=Series(sdata) print obj3 obj4=Series(sdata,index=['california','ohio','oregon','texas']) print obj4
1.4 Series最重要的功能是在算術運算中會自動對齊不同的索引數據

from pandas import * sdata={'ohio':35000,'texas':71000,'oregon':16000,'utah':5000} obj3=Series(sdata) print obj3 obj4=Series(sdata,index=['california','ohio','oregon','texas']) print obj4 print obj3+obj4