pandas操作mysql


需要用到三個第三方庫:

pandas、sqlalchemy、pymysql

其中,pandas模塊提供了read_sql_query()函數實現了對數據庫的查詢,to_sql()函數實現了對數據庫的寫入。並不需要實現新建MySQL數據表。

1.根據庫的文檔,我們看到to_sql函數支持兩類mysql引擎一個是sqlalchemy,另一個是sqlliet3.沒錯,在你寫入庫的時候,pymysql是不能用的!!!

mysqldb也是不能用的,你只能使用sqlalchemy或者sqlliet3!!鑒於sqllift3已經很久沒有更新了,筆者這里建議使用sqlalchemy!!

 2.to_sql函數並不在pd之中,而是在io.sql之中,是sql腳本下的一個類!!!所以to_sql的最好寫法就是:

  pd.io.sql.to_sql(df1,tablename,con=conn,if_exists='repalce') 

下面將介紹一個簡單的例子來展示如何在pandas中實現對MySQL數據庫的讀寫:
 1 import pandas as pd
 2 from sqlalchemy import create_engine
 3 # 初始化數據庫連接,使用pymysql模塊
 4 # MySQL的用戶:root, 密碼:147369, 端口:3306,數據庫:test
 5 engine = create_engine('mysql+pymysql://root:123456@localhost:3306/test')
 6 # 查詢語句,選出employee表中的所有數據
 7 sql = ''' select * from employee; '''
 8 # read_sql_query的兩個參數: sql語句, 數據庫連接
 9 df = pd.read_sql_query(sql, engine)
10 # 輸出employee表的查詢結果
11 print(df)
12 
13 # 新建pandas中的DataFrame, 只有id,num兩列
14 df = pd.DataFrame({'id': [1, 2, 3, 4], 'name': ['zhangsan', 'lisi', 'wangwu', 'zhuliu']})
15 # 將新建的DataFrame儲存為MySQL中的數據表,儲存index列
16 df.to_sql('mydf', engine, index=True)
17 print('Read from and write to Mysql table successfully!')

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM