需要用到三個第三方庫:
pandas、sqlalchemy、pymysql
其中,pandas模塊提供了read_sql_query()函數實現了對數據庫的查詢,to_sql()函數實現了對數據庫的寫入。並不需要實現新建MySQL數據表。
1.根據庫的文檔,我們看到to_sql函數支持兩類mysql引擎一個是sqlalchemy,另一個是sqlliet3.沒錯,在你寫入庫的時候,pymysql是不能用的!!!
mysqldb也是不能用的,你只能使用sqlalchemy或者sqlliet3!!鑒於sqllift3已經很久沒有更新了,筆者這里建議使用sqlalchemy!!
2.to_sql函數並不在pd之中,而是在io.sql之中,是sql腳本下的一個類!!!所以to_sql的最好寫法就是:
pd.io.sql.to_sql(df1,tablename,con=conn,if_exists='repalce')
下面將介紹一個簡單的例子來展示如何在pandas中實現對MySQL數據庫的讀寫:
1 import pandas as pd 2 from sqlalchemy import create_engine 3 # 初始化數據庫連接,使用pymysql模塊 4 # MySQL的用戶:root, 密碼:147369, 端口:3306,數據庫:test 5 engine = create_engine('mysql+pymysql://root:123456@localhost:3306/test') 6 # 查詢語句,選出employee表中的所有數據 7 sql = ''' select * from employee; ''' 8 # read_sql_query的兩個參數: sql語句, 數據庫連接 9 df = pd.read_sql_query(sql, engine) 10 # 輸出employee表的查詢結果 11 print(df) 12 13 # 新建pandas中的DataFrame, 只有id,num兩列 14 df = pd.DataFrame({'id': [1, 2, 3, 4], 'name': ['zhangsan', 'lisi', 'wangwu', 'zhuliu']}) 15 # 將新建的DataFrame儲存為MySQL中的數據表,儲存index列 16 df.to_sql('mydf', engine, index=True) 17 print('Read from and write to Mysql table successfully!')
