今天我們來學習一下Pandas庫,前面我們講了Numpy庫的學習
接下來我們學習一下比較重要的庫Pandas庫,這個庫比Numpy庫還重要
Pandas庫是在Numpy庫上進行了封裝,相當於高級Numpy庫
在數據處理方面,運用Pandas庫,也是非常多的,廢話不多說
先說第一個函數,read_csv,讀取CSV數據文件
import pandas food = pandas.read_csv("food_info.csv") print(type(food)) print(food.dtypes)
這里我打印了一下Type,可以看到類型為DataFrame,這個類型也是Pandas中,的核心類型
下面我打印了一下,dtypes。可以看到,下面也是在pandas中非常常用的幾種類型。
int64,float64這兩種就不用多說了。但是會發現一個新的類型。object類型
這個類型就相當於str類型,也就是字符串類型值。
然后接着,我們在運行一個函數
food.head()
這個函數的作用是,將我們數據中的,前5行打印出來。結果如下,
那么如果我們想讓數據顯示多條怎么處理呢?
food.head(8),只需要在這個函數中添加參數即可
可以顯示前面的,那么肯定可以顯示后面的,
food.tail(4)
這個方法相當於顯示最后面的4條數據
如圖所示,顯示出最后的4行數據,可以看到跟數據中的數據做下對比,是一樣的
那么如果獲取到數據表中,每一列的列名指標呢?
print(food.columns)
使用這個方便,可以或得到每個列表示的列名,結果是一個list,如下圖
還有一個要說的就是,如果看這個表的維度呢?我們直接在講Numpy的時候講過,如果查看矩陣的維度,用法一樣,shape方法
print(food.shape)
可以看到如下結果,表示,當前數據,有8618 個樣本,36個指標,36列
我們如何從pandas中獲取到某個數據呢?使用如下方法
print(food.loc[0])
這里我們可以看到,我們將第一個樣本的全部值取出來了。對比結果。
那么如果我們想去單獨某條數據,那么只需要修改[0]到你需要的數據上即可。這里下標從0開始。
大小超過數據的樣本集,會直接報錯。
pandas中常用的數據類型如下
object 就是我們常說的字符串類型
int 整型
float 浮點型
bool 布爾型
今天就先講到這里我,感謝大家的閱讀,謝謝!!
更多好文章,請訪問:https://www.yuanrenxue.com/