pandas庫疑難問題---1、pandas打亂數據集

一、總結

df=df.sample(frac=1.0) #打亂所有數據
df=df.reset_index(drop=True) #打亂后的數據index也是亂的，用reset_index重新加一列index，drop=True表示丟棄原有index一列

博客對應課程的視頻位置：1、pandas打亂數據集-范仁義-讀書編程筆記
https://www.fanrenyi.com/video/39/360

import pandas as pd

In [6]:

data = pd.read_csv('./iris.data',header=None) data

Out[6]:

150 rows × 5 columns

In [7]:

#設置frac=0.5表示隨機抽取50%的數據
data=data.sample(frac=1.0)#打亂所有數據 data

Out[7]:

150 rows × 5 columns

為了結果的復現

可以看到設置的種子一樣的時候，生成的隨機數是一樣的

In [9]:

data = pd.read_csv('./iris.data',header=None) data=data.sample(frac=1.0,random_state=11)#打亂所有數據 data

Out[9]:

150 rows × 5 columns

In [10]:

data = pd.read_csv('./iris.data',header=None) data

Out[10]:

150 rows × 5 columns

In [11]:

data=data.sample(frac=1.0)#打亂所有數據 data

Out[11]:

150 rows × 5 columns

In [12]:

data=data.reset_index(drop=True) #打亂后的數據index也是亂的，用reset_index重新加一列index，drop=True表示丟棄原有index一列 data

Out[12]:

150 rows × 5 columns

In [ ]:

博客對應系列課程視頻位置：
1、pandas打亂數據集-范仁義-讀書編程筆記
https://www.fanrenyi.com/video/39/360
2、pandas切片操作-范仁義-讀書編程筆記
https://www.fanrenyi.com/video/39/379
3、loc方法和iloc方法的區別-范仁義-讀書編程筆記
https://www.fanrenyi.com/video/39/380
4、DataFrame類型轉換成Numpy中ndarray-范仁義-讀書編程筆記
https://www.fanrenyi.com/video/39/381

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 打亂數據集的方法如何打亂數據集的順序 Python數據預處理之打亂數據集 pandas庫疑難問題---4、DataFrame類型轉換成Numpy中ndarray 同時打亂數據集和標簽的幾種方式 matplotlib庫疑難問題---2、將曲線平滑 SQL疑難問題基於 Python 和 Pandas 的數據分析(4) --- 建立數據集 Python-Pandas 如何shuffle（打亂）數據？ matplotlib庫疑難問題---7、去掉刻度和邊框