pandas庫中的sample函數解釋


Pandas>>sample()函數 隨機選取若干行

功能說明

有時候我們只需要數據集中的一部分,並不需要全部的數據。這個時候我們就要對數據集進行隨機的抽樣。pandas中自帶有抽樣的方法。

功能相似:numpy.random.choice

函數名:

DataFrame.sample(n=None,frac=None,replace=False,weights=None,random_state=None,axis=None)

import pandas as pdimport numpy as npdata_test= pd.DataFrame([['張一',1,1], ['張二',2,2], ['張三',3,3], ['張四',4,4], ['張五',5,5], ['張六',6,6,], ['張七',7,7], ['張八',8,8], ['張九',9,9,], ['張十',10,10] ], columns =['name','number_1','number_2'] )data_test

1.抽取的行數

data_test.sample(n=3)

2.frac:抽取行的比例

data_test.sample(frac=0.4)

3.指定權重信息,需要與 行或者列的數目相等,為列表

data_test.sample(frac=0.3,weights=[0.1, 0.2, 0.3,0.1,0.1,0.1,0.1,0.1,0.2,0.3])


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM