1.隨機重排序
使用take()隨機排序
如:
df.take([54]) #采取索引為54的數據
可以借助np.random.permutation()函數隨機排序
permutation()函數是指產生0~n-1的所有整數的隨機排列
、
如:對索引為0~10的數據進行隨機排序
df.take(np.random.permutation(10))
(部分)
2.隨機抽樣:
當dataframe樣本數據足夠多時,對數據進行隨機采樣。
方法一:
使用np.random.randint()配合take()函數進行隨機抽樣
方法二:
使用sample(n)函數
n:是采樣個數。
格式:df.sample(n)