import numpy as np
import pandas as pd
import os #遍歷文件夾需要用到的庫
dancunzhanshi = [] #建立空列表來存放每次遍歷的數據
lujing = r"C:\Users\呆呆\Desktop\pythonXX\cunganbu" #為初始文件夾位置設置一個變量接收,r是轉譯作用
for danzhen in os.listdir(lujing):
fenlujing = f"{lujing}\\{danzhen}" # f是格式化字符串,是用初始路徑與該文件夾下每個小文件夾合並形成后面的路徑來讀取
for dancun in os.listdir(fenlujing):
if dancun[-4:] != '.doc': #遇到word文件不讀取這里做個條件判斷
erfenlujing = f"{lujing}\\{danzhen}\\{dancun}" # f是格式化字符串,是用初始路徑與該文件夾下每個小文件夾合並形成后面的路徑來讀取
for danren in os.listdir(erfenlujing):
sanfenlujing = f"{lujing}\\{danzhen}\\{dancun}\\{danren}" # f是格式化字符串,是用初始路徑與該文件夾下每個小文件夾合並形成后面的路徑來讀取
danbiao = pd.read_excel(sanfenlujing, header = 1, converters={"身份證號碼": str,"手機號碼": str})
danbiao['Rcode'] = danren #這里也是一個小技巧,這是在每次循環完,添加一個遍歷的標簽
danbiao['Ccode'] = dancun #這里也是一個小技巧,這是在每次循環完,添加一個遍歷的標簽
danbiao['Zcode'] = danzhen #這里也是一個小技巧,這是在每次循環完,添加一個遍歷的標簽
dancunzhanshi.append(danbiao) #將每次遍歷的數據追加到之前建立的空列表中
hechengbiao = pd.concat(dancunzhanshi) # 將每次遍歷的數據合並成一張dataframe數據表