Pandas>>sample()函數 隨機選取若干行
功能說明
有時候我們只需要數據集中的一部分,並不需要全部的數據。這個時候我們就要對數據集進行隨機的抽樣。pandas中自帶有抽樣的方法。
功能相似:numpy.random.choice
函數名:
DataFrame.sample(n=None,frac=None,replace=False,weights=None,random_state=None,axis=None)

import pandas as pdimport numpy as npdata_test= pd.DataFrame([['張一',1,1], ['張二',2,2], ['張三',3,3], ['張四',4,4], ['張五',5,5], ['張六',6,6,], ['張七',7,7], ['張八',8,8], ['張九',9,9,], ['張十',10,10] ], columns =['name','number_1','number_2'] )data_test

1.抽取的行數
data_test.sample(n=3)

2.frac:抽取行的比例
data_test.sample(frac=0.4)

3.指定權重信息,需要與 行或者列的數目相等,為列表
data_test.sample(frac=0.3,weights=[0.1, 0.2, 0.3,0.1,0.1,0.1,0.1,0.1,0.2,0.3])
