使用python,將excel數據批量導入數據庫


  • 這是上一篇文章的優化版本,相較於一條一條的執行sql語句,本文中,將excel中所有的數據先寫到list列表中
  • 在通過函數
    cursor.executemany(sql, list)
    一次性寫入到數據庫中
  • import pymysql
    import xlrd
    
    
    '''
        連接數據庫
        args:db_name(數據庫名稱)
        returns:db
        
    '''
    def mysql_link(de_name):
        try:
            db = pymysql.connect(host="127.0.0.1", user="root",
                                 passwd="XXX",
                                 db=de_name,
                                 charset='utf8')
            return db
        except:
            print("could not connect to mysql server")
    
    
    '''
        讀取excel函數
        args:excel_file(excel文件,目錄在py文件同目錄)
        returns:book
    '''
    def open_excel(excel_file):
        try:
            book = xlrd.open_workbook(excel_file)  #文件名,把文件與py文件放在同一目錄下
            return book
        except:
            print("open excel file failed!")
    
    
    '''
        執行插入操作
        args:db_name(數據庫名稱)
             table_name(表名稱)
             excel_file(excel文件名,把文件與py文件放在同一目錄下)
             
    '''
    def store_to(db_name,table_name,excel_file):
        db = mysql_link(db_name)  # 打開數據庫連接
        cursor = db.cursor()  # 使用 cursor() 方法創建一個游標對象 cursor
    
        book = open_excel(excel_file)   # 打開excel文件
        sheets = book.sheet_names()   # 獲取所有sheet表名
        for sheet in sheets:
            sh = book.sheet_by_name(sheet)   # 打開每一張表
            row_num = sh.nrows
            print(row_num)
            list = []   # 定義列表用來存放數據
            for i in range(1, row_num):  # 第一行是標題名,對應表中的字段名所以應該從第二行開始,計算機以0開始計數,所以值是1
                row_data = sh.row_values(i)  # 按行獲取excel的值
                value = (row_data[0], row_data[1],row_data[2],row_data[3],row_data[4],row_data[5],\
                         row_data[6],row_data[7],row_data[8],row_data[9],row_data[10],row_data[11],row_data[12],row_data[13],row_data[14])
                list.append(value)  # 將數據暫存在列表
                # print(i)
            sql = "INSERT INTO "+ table_name + " ( bj_shijian,bjr_xingbie,anfa_didian,\
                zb_x,zb_y,bj_chongfu,jiejing_lb_name,baojing_lb_name,baojing_lx_name,baojing_lx_xl_name,\
                guanxia_qy_name,guanxian_dw_name,anfa_qulu,anfa_xiaoqu,chujing_dw_name)VALUES(%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)"
            cursor.executemany(sql, list)  # 執行sql語句
            db.commit()  # 提交
            list.clear()  # 清空list
            print("worksheets: " + sheet + " has been inserted " + str(row_num) + " datas!")
        cursor.close()  # 關閉連接
        db.close()
    
    
    if __name__ == '__main__':
        store_to('demo','demo_yangben','qh.xlsx')
    

      可以選擇傳入的數據庫,及數據庫表名,excel文件名(excel文件和py文件同目錄,否則加上路徑)

  •  每一萬條寫入一次
  • import pymysql
    import xlrd
    import sys
     
    '''
        連接數據庫
        args:db_name(數據庫名稱)
        returns:db
     
    '''
     
     
    def mysql_link(de_name):
        try:
            db = pymysql.connect(host="127.0.0.1", user="xxx",
                                 passwd="xxx",
                                 db=xxx,
                                 charset='utf8')
            return db
        except:
            print("could not connect to mysql server")
     
     
    '''
        讀取excel函數
        args:excel_file(excel文件,目錄在py文件同目錄)
        returns:book
    '''
     
     
    def open_excel(excel_file):
        try:
            book = xlrd.open_workbook(excel_file)  # 文件名,把文件與py文件放在同一目錄下
            print(sys.getsizeof(book))
            return book
        except:
            print("open excel file failed!")
     
     
    '''
        執行插入操作
        args:db_name(數據庫名稱)
             table_name(表名稱)
             excel_file(excel文件名,把文件與py文件放在同一目錄下)
     
    '''
     
     
    def store_to(db_name, table_name, excel_file):
        db = mysql_link(db_name)  # 打開數據庫連接
        cursor = db.cursor()  # 使用 cursor() 方法創建一個游標對象 cursor
        list = []  # 定義列表用來存放數據
    
    
        book = open_excel(excel_file)  # 打開excel文件
        sheets = book.sheet_names()  # 獲取所有sheet表名
        for sheet in sheets:
            sh = book.sheet_by_name(sheet)  # 打開每一張表
            row_num = sh.nrows
            print(row_num)
            
            num = 0  # 用來控制每次插入的數量
            for i in range(1, row_num):  # 第一行是標題名,對應表中的字段名所以應該從第二行開始,計算機以0開始計數,所以值是1
                row_data = sh.row_values(i)  # 按行獲取excel的值
                value = (row_data[0], row_data[1], row_data[2], row_data[3], row_data[4], row_data[5], \
                         row_data[6], row_data[7], row_data[8], row_data[9], row_data[10], row_data[11], row_data[12],
                         row_data[13], row_data[14])
                list.append(value)  # 將數據暫存在列表
                num += 1
                if( num>= 10000 ):  # 每一萬條數據執行一次插入
                    print(sys.getsizeof(list))
                    sql = "INSERT INTO " + table_name + " (time, xingbie, afdd, xzb, yzb, cfbj, jjlbmc, \
                    bjlbmc, bjlxmc, bjlxxlmc, gxqymc,gxdwmc, afql, afxqxx, cjdwmc)\
                    VALUES(%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)"
                    cursor.executemany(sql, list)  # 執行sql語句
     
                    num = 0  # 計數歸零
                    list.clear()  # 清空list
                    print("worksheets: " + sheet + " has been inserted 10000 datas!")
    # 將剩下不足10000的數據執行插入   sql = "INSERT INTO " + table_name + " (time, xingbie, afdd, xzb, yzb, cfbj, jjlbmc, \ bjlbmc, bjlxmc, bjlxxlmc, gxqymc,gxdwmc, afql, afxqxx, cjdwmc)\ VALUES(%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)" cursor.executemany(sql, list) # 執行sql語句 print("worksheets: " + sheet + " has been inserted "+len(list)+" datas!") list.clear() # 清空list print("worksheets: " + sheet + " has been inserted " + str(row_num) + " datas!") db.commit() # 提交 cursor.close() # 關閉連接 db.close() if __name__ == '__main__': store_to('demo', 'demo_yangben', 'xxx.xlsx')

       sys.getsizeof()方法監測內存占用 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM