python解析excel中圖片+提取圖片


解析表格是常用的技術。但是有些表各里面有圖片怎么辦?我想獲得表格里面的圖片,值得注意的是,圖片沒有位置信息,所以最好給圖片進行編號,編號代表位置。

下面附上提取表格里面圖片的代碼。只要輸出表格地址,和圖片存放目錄就行

import os,shutil
import zipfile


# 判斷是否是文件和判斷文件是否存在
def isfile_exist(file_path):
    if not os.path.isfile(file_path):
        print("It's not a file or no such file exist ! %s" % file_path)
        return False
    else:
        return True



# 修改指定目錄下的文件類型名,將excel后綴名修改為.zip
def change_file_name(file_path, new_type='.zip'):
    if not isfile_exist(file_path):
        return ''

    extend = os.path.splitext(file_path)[1]  # 獲取文件拓展名
    if extend != '.xlsx' and extend != '.xls':
        print("It's not a excel file! %s" % file_path)
        return False

    file_name = os.path.basename(file_path)  # 獲取文件名
    new_name = str(file_name.split('.')[0]) + new_type  # 新的文件名,命名為:xxx.zip

    dir_path = os.path.dirname(file_path)  # 獲取文件所在目錄
    new_path = os.path.join(dir_path, new_name)  # 新的文件路徑
    if os.path.exists(new_path):
        os.remove(new_path)

    os.rename(file_path, new_path)  # 保存新文件,舊文件會替換掉

    return new_path  # 返回新的文件路徑,壓縮包


# 解壓文件
def unzip_file(zipfile_path):
    if not isfile_exist(zipfile_path):
        return False

    if os.path.splitext(zipfile_path)[1] != '.zip':
        print("It's not a zip file! %s" % zipfile_path)
        return False

    file_zip = zipfile.ZipFile(zipfile_path, 'r')
    file_name = os.path.basename(zipfile_path)  # 獲取文件名
    zipdir = os.path.join(os.path.dirname(zipfile_path), str(file_name.split('.')[0]))  # 獲取文件所在目錄
    for files in file_zip.namelist():
        file_zip.extract(files, os.path.join(zipfile_path, zipdir))  # 解壓到指定文件目錄

    file_zip.close()
    return True


# 讀取解壓后的文件夾,打印圖片路徑
def read_img(zipfile_path,img_path):
    if not isfile_exist(zipfile_path):
        return False

    dir_path = os.path.dirname(zipfile_path)  # 獲取文件所在目錄
    file_name = os.path.basename(zipfile_path)  # 獲取文件名
    unzip_dir = os.path.join(dir_path, str(file_name.split('.')[0]))
    pic_dir = 'xl' + os.sep + 'media'  # excel變成壓縮包后,再解壓,圖片在media目錄
    pic_path = os.path.join(dir_path, str(file_name.split('.')[0]), pic_dir)

    file_list = os.listdir(pic_path)
    for file in file_list:
        filepath = os.path.join(pic_path, file)
        print(filepath,img_path)
        shutil.move(filepath,img_path)
    os.unlink(zipfile_path)
    shutil.rmtree(unzip_dir)


# 組合各個函數
def compenent(excel_file_path,img_path):
    zip_file_path = change_file_name(excel_file_path)
    if not os.path.exists(img_path):
        os.mkdir(img_path)
    if zip_file_path != '':
        unzip_msg = unzip_file(zip_file_path)
        if unzip_msg:
            read_img(zip_file_path,img_path)


# main
if __name__ == '__main__':
    #excel地址
    excel_path = 'C:\\Users\\SHEIN\\Desktop\\test\img.xlsx'
    #圖片目錄
    img_dir = 'C:\\Users\\SHEIN\\Desktop\\test\\imgage'
    compenent(excel_path,img_dir)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM