原文:Dataframe 根据其他列的条件新增一列

如代码所示,判断如果城市名中含有ing字段且年份为 ,则新列test值赋为 ,否则为 . 另外Series类型也有apply函数,用法示例如下: import numpy as np import pandas as pd data city : Beijing , Shanghai , Guangzhou , Shenzhen , Hangzhou , Chongqing , year : , ...

2020-12-10 16:07 0 771 推荐指数:

查看详情

spark dataFrame 新增一列函数withColumn

例子 result = table1.join(table1,['字段'],"full").withColumn("名称",col("字段")/col("字段"))   新增一列数据,数据的内容是col("字段")/col("字段") ...

Fri May 29 00:38:00 CST 2020 0 4086
spark DataFrame新增一列id(单调递增,不重复)的几种方法

方案一:使用functions里面的monotonically_increasing_id(),生成单调递增,不保证连续,最大64bit,的一列.分区数不变。 注意:有多个分区的时候,每个分区里面是单调递增,step为1,分区之间不保证连续,如一共两个分区,0分区id是0-499 ...

Sat Apr 04 01:41:00 CST 2020 0 1092
dataframe添加一列索引

测试数据自己瞎编的 需求:给现在df数据添加一列sid,要求这一列是和stock一一对应的整数 代码如下: import pandas as pd test_data = {'stock': ['AAPL', 'GOOG', 'AMZN', 'AAPL', 'GOOG', 'AMZN ...

Thu Dec 20 23:36:00 CST 2018 0 3470
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM