python 提取Excel中的圖片
注意:下面的方法只能讀取到擴展名為 .xlsx 的Excel. xls不行。
方法一:
1、將待讀取的excel文件后綴名改成zip,變成壓縮文件。
2、再解壓這個文件。
3、在解壓后的文件夾中,就有excel中的圖片。
4、這樣讀excel中的圖片,就變成了讀文件夾中的圖片了,和普通文件一樣,可以做各種處理。
''' File Name: readexcelimg Author: tim Date: 2018/7/26 19:52 Description: 讀取excel中的圖片,打印圖片路徑 先將excel轉換成zip包,解壓zip包,包下面有文件夾存放了圖片,讀取這個圖片 ''' import os import zipfile # 判斷是否是文件和判斷文件是否存在 def isfile_exist(file_path): if not os.path.isfile(file_path): print("It's not a file or no such file exist ! %s" % file_path) return False else: return True # 修改指定目錄下的文件類型名,將excel后綴名修改為.zip def change_file_name(file_path, new_type='.zip'): if not isfile_exist(file_path): return '' extend = os.path.splitext(file_path)[1] # 獲取文件拓展名 if extend != '.xlsx' and extend != '.xls': print("It's not a excel file! %s" % file_path) return False file_name = os.path.basename(file_path) # 獲取文件名 new_name = str(file_name.split('.')[0]) + new_type # 新的文件名,命名為:xxx.zip dir_path = os.path.dirname(file_path) # 獲取文件所在目錄 new_path = os.path.join(dir_path, new_name) # 新的文件路徑 if os.path.exists(new_path): os.remove(new_path) os.rename(file_path, new_path) # 保存新文件,舊文件會替換掉 return new_path # 返回新的文件路徑,壓縮包 # 解壓文件 def unzip_file(zipfile_path): if not isfile_exist(zipfile_path): return False if os.path.splitext(zipfile_path)[1] != '.zip': print("It's not a zip file! %s" % zipfile_path) return False file_zip = zipfile.ZipFile(zipfile_path, 'r') file_name = os.path.basename(zipfile_path) # 獲取文件名 zipdir = os.path.join(os.path.dirname(zipfile_path), str(file_name.split('.')[0])) # 獲取文件所在目錄 for files in file_zip.namelist(): file_zip.extract(files, os.path.join(zipfile_path, zipdir)) # 解壓到指定文件目錄 file_zip.close() return True # 讀取解壓后的文件夾,打印圖片路徑 def read_img(zipfile_path): if not isfile_exist(zipfile_path): return False dir_path = os.path.dirname(zipfile_path) # 獲取文件所在目錄 file_name = os.path.basename(zipfile_path) # 獲取文件名 pic_dir = 'xl' + os.sep + 'media' # excel變成壓縮包后,再解壓,圖片在media目錄 pic_path = os.path.join(dir_path, str(file_name.split('.')[0]), pic_dir) file_list = os.listdir(pic_path) for file in file_list: filepath = os.path.join(pic_path, file) print(filepath) # 組合各個函數 def compenent(excel_file_path): zip_file_path = change_file_name(excel_file_path) if zip_file_path != '': if unzip_file(zip_file_path): read_img(zip_file_path) # main if __name__ == '__main__': compenent('/Users/Desktop/test/people.xlsx')
方法二:
pip install pillow
pip install pypiwin32
from PIL import ImageGrab import win32com.client as win32 excel = win32.gencache.EnsureDispatch('Excel.Application') workbook = excel.Workbooks.Open(r'C:\Users\file.xlsx') for sheet in workbook.Worksheets: for i, shape in enumerate(sheet.Shapes): if shape.Name.startswith('Picture'): shape.Copy() image = ImageGrab.grabclipboard() image.save('{}.jpg'.format(i+1), 'jpeg') excel.Quit()