pandas庫是python中專門進行人工智能計算的庫,在使用前首先要用import語句引入該庫,例子如下,引入pandas打印版本號0.25.2:
在pandas中series是基本的數據結構,相當於線性代數中的列向量,下面是建立series的例子,在下面的結果截圖中左邊那列數字是列向量的行標(從0開始),右邊那列數字是列向量中各行的數值。:
下面的例子是通過字典來創建列向量,左邊的a,b,c,d,e是列向量的行標,右邊的一列數字是列向量中各個行的值。
兩個列向量可以拼接在一起形成更長的列向量:
可以使用drop語句來刪除其中的e行:
可以更改其中某個元素的值,把c行的值改為6:
可以用冒號語法輸出s4列向量中前三行的元素的值:
向量加法可以用add函數來實現:
類似的操作還有s3.sub(s1),s4.mul(s3),s4.div(s3)對應着減法,乘法和除法。
上面的代碼可以對列向量求和,類似的函數還有max,min,median等函數。在pandas中series創建向量,dataframe可以創建一個二維數組(矩陣):
在上面的圖中dates是行標,利用date_range函數創建6個日期,columns是列表,這個6行四列的矩陣里的元素值用numpy庫中的randn函數創建,
該函數是生成一個六行四列的隨機矩陣,矩陣里的每個隨機數遵循標准正態分布。
下面這個例子是利用python字典創建一個二維矩陣: