（新手)使用pandas操作EXCEL

本文轉載自查看原文 2019-01-08 10:18 2555

import pandas as pd
import numpy as np
from pandas import DataFrame,Series
#path = r'C:\Users\tsl\Desktop\數據.xlsx'
#一列數據前面添加字符串
def add_C(village_data):
    village_data['電話'] = ['C%s' % y for y in village_data['電話']]
    return village_data['電話']
#讀取excel
data = pd.read_excel(r'C:\Users\tsl\Desktop\數據.xlsx')
#判定某列中是否有null,如果有刪除null 行
if data['電話'].isnull().any():
#將excel里面空值修改
    data['電話'] = data['電話'].fillna('999')
#得到999值的索引室號
    data_index = data[data.電話=='999'].index.tolist()
#刪除
    data = data.drop(data_index)
#以街道分組
group_by_name = data.groupby('街道')
#需要groups得出具體結果
for i in group_by_name.groups:
    village_data = data.loc[data['街道'] == i ]
    add_C(village_data)
　　#以樓棟分組
    group_by_name_build = village_data.groupby('樓棟')
    for build_name in group_by_name_build.groups:
        build_data = village_data.loc[village_data['樓棟'] == build_name]
        build_data = build_data.drop_duplicates(subset='室號', keep='first')
　　　　　　#更改列的數據類型
        build_data['室號'] = build_data['室號'].astype(np.str)
        row_index = 0
        for house_num in build_data['室號']:
            if '-' in house_num:
                house_num = house_num.replace('-','9') #並沒有修改原內存地址的值，固需要賦值給原有內存地址
            #選區某行某列並賦值
                build_data.iat[row_index,2] = house_num
            row_index +=1
        del build_data['街道']
        del build_data['樓棟']
        #修改列名
        build_data.columns = ['用戶編碼','指定開門','電話號碼']
        build_data['指定開門'] = '雙門'
        build_data_row_index = 0
        for modify_num in build_data['用戶編碼']:
            if len(modify_num) < 4:
                modify_num = '0' + modify_num   #並沒有修改原內存地址的值，固需要賦值給原有內存地址
                build_data.iat[build_data_row_index,0] = modify_num
            build_data_row_index +=1
#保存/生成新的excle
        DataFrame(build_data).to_excel('C:\\Users\\tsl\Desktop\info\%s.xls' % (build_name),sheet_name='Sheet1',index=False,header=True )

##優化后

import pandas as pd
import numpy as np
from pandas import DataFrame,Series
#讀取excel
#path = r'C:\Users\tsl\Desktop\數據.xlsx'
def Build_data(build_data):
    #一個有索引和行內容的迭代器
    for data_line_index,data_line in build_data.iterrows():
            if '-' in data_line['用戶編碼']:
                data_line['用戶編碼'] = data_line['用戶編碼'].replace('-','9')
                # house_num = house
            if len(data_line['用戶編碼'])<4:
                data_line['用戶編碼'] = '0'+ data_line['用戶編碼']
            data_line['電話號碼'] = data_line['電話號碼'][:-2]
    return build_data
def add_C(village_data):
    village_data['電話'] = ['C%s' % y for y in village_data['電話']]
    return village_data['電話']
data = pd.read_excel(r'C:\Users\tsl\Desktop\數據.xlsx')
data_index = 0
#判定列中是否有null,如果有刪除null 行
if data['電話'].isnull().any():
#將excel里面空值修改
    data['電話'] = data['電話'].fillna('999')
#得到999值的索引室號
    data_index_1 = data[data.電話=='999'].index.tolist()
#刪除
    data = data.drop(data_index_1)
#已街道分組
group_by_name = data.groupby('街道')
#需要groups得出具體結果
for i in group_by_name.groups:
    village_data = data.loc[data['街道'] == i ]
    add_C(village_data)
    group_by_name_build = village_data.groupby('樓棟')
    for build_name in group_by_name_build.groups:
        build_data = village_data.loc[village_data['樓棟'] == build_name]
        build_data = build_data.drop_duplicates(subset='室號', keep='first')
        del build_data['街道']
        del build_data['樓棟']
        #修改列名
        build_data.columns = ['用戶編碼','指定開門','電話號碼']
        build_data['指定開門'] = '雙門'
        build_data  = build_data.astype(np.str)
        build_data = Build_data(build_data)
        DataFrame(build_data).to_excel('C:\\Users\\tsl\Desktop\info\%s.xls' % (build_name),sheet_name='Sheet1',index=False,header=True )

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Excel中vlookup函數的使用方法（適合新手） Pandas操作excel 【Python】Pandas 操作Excel pandas操作excel表 pandas操作Excel pandas之excel操作【Git】關於git新手使用操作流程（簡單版）使用python第三方庫pandas來操作excel表格 python使用xlrd,xlrwt,openpyxl,xlwings,pandas等庫操作Excel github新手使用