pandas中的随机排序和抽样


1.随机重排序

使用take()随机排序

如:

df.take([54])   #采取索引为54的数据

 

可以借助np.random.permutation()函数随机排序

permutation()函数是指产生0~n-1的所有整数的随机排列

如:对索引为0~10的数据进行随机排序

df.take(np.random.permutation(10))

(部分)

 

2.随机抽样:

当dataframe样本数据足够多时,对数据进行随机采样。

方法一:

使用np.random.randint()配合take()函数进行随机抽样

方法二:

使用sample(n)函数

n:是采样个数。

格式:df.sample(n)

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM