Python Pandas庫的學習(一)


今天我們來學習一下Pandas庫,前面我們講了Numpy庫的學習

接下來我們學習一下比較重要的庫Pandas庫,這個庫比Numpy庫還重要

Pandas庫是在Numpy庫上進行了封裝,相當於高級Numpy庫

在數據處理方面,運用Pandas庫,也是非常多的,廢話不多說

先說第一個函數,read_csv,讀取CSV數據文件

import pandas
food = pandas.read_csv("food_info.csv")
print(type(food))
print(food.dtypes)

這里我打印了一下Type,可以看到類型為DataFrame,這個類型也是Pandas中,的核心類型

 下面我打印了一下,dtypes。可以看到,下面也是在pandas中非常常用的幾種類型。

int64,float64這兩種就不用多說了。但是會發現一個新的類型。object類型

這個類型就相當於str類型,也就是字符串類型值。

然后接着,我們在運行一個函數

food.head()

這個函數的作用是,將我們數據中的,前5行打印出來。結果如下,

那么如果我們想讓數據顯示多條怎么處理呢?

food.head(8),只需要在這個函數中添加參數即可

可以顯示前面的,那么肯定可以顯示后面的,

food.tail(4)

這個方法相當於顯示最后面的4條數據

如圖所示,顯示出最后的4行數據,可以看到跟數據中的數據做下對比,是一樣的

那么如果獲取到數據表中,每一列的列名指標呢?

print(food.columns)

使用這個方便,可以或得到每個列表示的列名,結果是一個list,如下圖

還有一個要說的就是,如果看這個表的維度呢?我們直接在講Numpy的時候講過,如果查看矩陣的維度,用法一樣,shape方法

print(food.shape)

可以看到如下結果,表示,當前數據,有8618 個樣本,36個指標,36列

我們如何從pandas中獲取到某個數據呢?使用如下方法

print(food.loc[0])

這里我們可以看到,我們將第一個樣本的全部值取出來了。對比結果。

那么如果我們想去單獨某條數據,那么只需要修改[0]到你需要的數據上即可。這里下標從0開始。

大小超過數據的樣本集,會直接報錯。

pandas中常用的數據類型如下

object 就是我們常說的字符串類型

int 整型

float 浮點型

bool 布爾型

今天就先講到這里我,感謝大家的閱讀,謝謝!!

更多好文章,請訪問:https://www.yuanrenxue.com/


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM