isna()和 isnull()区别: isnan判断是否nan(not a number),一般是数值字段的null isnull()主要是判断字符型是否有值, 可以判断所有的空值,但是pyth ...
isna()和 isnull()区别: isnan判断是否nan(not a number),一般是数值字段的null isnull()主要是判断字符型是否有值, 可以判断所有的空值,但是pyth ...
value_counts()是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。 print('训练集中因变量cls的分类情况:') print(train[ ...
drop()——删除dataframe中的指定行列 drop(labels=None, axis=0, index=None, columns=None, level ...
构造数据 import pandas as pd df = pd.DataFrame({'Country':['China','China', 'India', 'India ...
一个numpy array 是内存中一个连续块,并且array里的元素都是同一类(例如整数)。所以一旦确定了一个array,它的内存就确定了,那么每个元素(整数)的内存大小都确定了(4 byte ...
1. x_train:包括所有自变量,这些变量将用于训练模型,同样,我们已经指定测试_size=0.4,这意味着来自完整数据的60%的观察值将用于训练/拟合模型,其余40%将用于测试模型。2. y_t ...
1.定义理解 edit distance——指两个字符串之间,一个转为另一个的最小编辑次数(方式有:插入/删除/替换) 若edit distance越小,则字符串之间的相似度越高。 例1: ...
dataframe是一张二维表,行(索引),列(标签) loc通过列名值进行截取,而iloc通过索引截取 import numpy as np import pandas as pd tes ...
python merge()——类似于sql中的join()函数 merge(left, right, how='inner', on=None, left_on=None, r ...