花费 7 ms
python isna()和 isnull()

isna()和 isnull()区别: isnan判断是否nan(not a number),一般是数值字段的null isnull()主要是判断字符型是否有值, 可以判断所有的空值,但是pyth ...

Mon Aug 10 21:38:00 CST 2020 0 3791
python value_counts()

value_counts()是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。 print('训练集中因变量cls的分类情况:') print(train[ ...

Fri Aug 21 23:08:00 CST 2020 0 2534
python drop()

drop()——删除dataframe中的指定行列 drop(labels=None, axis=0, index=None, columns=None, level ...

Mon Aug 10 16:51:00 CST 2020 0 2307
python groupby agg()

构造数据 import pandas as pd df = pd.DataFrame({'Country':['China','China', 'India', 'India ...

Wed Aug 19 01:07:00 CST 2020 0 1599
python List 和Numpy array 区别

一个numpy array 是内存中一个连续块,并且array里的元素都是同一类(例如整数)。所以一旦确定了一个array,它的内存就确定了,那么每个元素(整数)的内存大小都确定了(4 byte ...

Mon Aug 03 23:56:00 CST 2020 0 1527
X_train和y_train

1. x_train:包括所有自变量,这些变量将用于训练模型,同样,我们已经指定测试_size=0.4,这意味着来自完整数据的60%的观察值将用于训练/拟合模型,其余40%将用于测试模型。2. y_t ...

Fri Aug 21 23:50:00 CST 2020 0 1094
python实现编辑距离edit distance

1.定义理解 edit distance——指两个字符串之间,一个转为另一个的最小编辑次数(方式有:插入/删除/替换) 若edit distance越小,则字符串之间的相似度越高。 例1: ...

Tue Jul 07 19:01:00 CST 2020 0 1137
python loc和iloc

dataframe是一张二维表,行(索引),列(标签) loc通过列名值进行截取,而iloc通过索引截取 import numpy as np import pandas as pd tes ...

Fri Aug 28 17:51:00 CST 2020 0 1017
python merge()

python merge()——类似于sql中的join()函数 merge(left, right, how='inner', on=None, left_on=None, r ...

Wed Aug 05 22:43:00 CST 2020 0 1054

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM