将作者单位名称中的邮编去掉
1. 通过pandas读取csv文件
2. 获取某一列的值并进行类型转换
3. 通过apply方法中的匿名函数进行数据的处理
4. 输出到原始文件中
import pandas as pd file = "2019/万网2019.csv" data = pd.read_csv(file,encoding='utf-8') data[u'作者单位名称'] = data[u'作者单位名称'].astype(str) data[u'作者单位名称'] = data[u'作者单位名称'].apply(lambda x :re.sub('\d+','',x)) data.to_csv(file,index=False, encoding='utf-8')