Python Pandas pandas.DataFrame.to_sql函數方法的使用


Pandas是基於NumPy 的一種工具,該工具是為了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標准的數據模型,提供了高效地操作大型數據集所需的工具。Pandas提供了大量能使我們快速便捷地處理數據的函數和方法。你很快就會發現,它是使Python成為強大而高效的數據分析環境的重要因素之一。本文主要介紹一下Pandas中DataFrame.to_sql方法的使用。

 

DataFrame.to_sql (name,con,schema = None,if_exists ='fail',index = True,index_label = None,chunksize = None,dtype = None ) [source]

將存儲在DataFrame中的記錄寫入SQL數據庫。

支持SQLAlchemy [R16]支持的數據庫。可以新創建,附加或覆蓋表。

 

參數:

name:string

SQL表的名稱。

con:sqlalchemy.engine.Engine或sqlite3.Connection

使用SQLAlchemy可以使用該庫支持的任何數據庫。

為sqlite3.Connection對象提供了舊版支持。

schema:string,optional

指定架構(如果數據庫支持)。如果為None,請使用默認架構。

if_exists:{'fail','replace','append'},默認'fail'

如果表已存在的情況如下,

  • fail:引發ValueError。
  • replace:在插入新值之前刪除表。
  • append:將新值插入現有表。

index:布爾值,默認為True

將DataFrame索引寫為列。使用index_label作為表中的列名。

index_label:字符串或序列,默認為None

索引列的列標簽。如果給出None(默認)且 index為True,

則使用索引名稱。

如果DataFrame使用MultiIndex,則應該給出一個sequence。

chunksize:int,可選

行將一次批量寫入的數量。默認情況下,所有行都將立即寫入。

dtype:dict,可選

指定列的數據類型。鍵應該是列名,值應該是SQLAlchemy類型,

或sqlite3傳統模式的字符串。

異常:

ValueError異常

當表已經存在且if_exists為'fail'時(默認值)。

 

例如,

1)創建內存中的SQLite數據庫

>>> from sqlalchemy import create_engine
>>> engine = create_engine('sqlite://', echo=False)

2)從頭開始創建一個包含3行的表

>>> df = pd.DataFrame({'name' : ['User 1', 'User 2', 'User 3']})
>>> df
     name
0  User 1
1  User 2
2  User 3
>>> df.to_sql('users', con=engine)
>>> engine.execute("SELECT * FROM users").fetchall()
[(0, 'User 1'), (1, 'User 2'), (2, 'User 3')]
>>> df1 = pd.DataFrame({'name' : ['User 4', 'User 5']})
>>> df1.to_sql('users', con=engine, if_exists='append')
>>> engine.execute("SELECT * FROM users").fetchall()
[(0, 'User 1'), (1, 'User 2'), (2, 'User 3'),
 (0, 'User 4'), (1, 'User 5')]

3)用df1覆蓋表

>>> df1.to_sql('users', con=engine, if_exists='replace',
...            index_label='id')
>>> engine.execute("SELECT * FROM users").fetchall()
[(0, 'User 4'), (1, 'User 5')]

4)指定dtype(對於具有缺失值的整數很有用)。請注意,雖然pandas被強制將數據存儲為浮點數,但數據庫支持可空整數。使用Python獲取數據時,我們會返回整數標量。

>>> df = pd.DataFrame({"A": [1, None, 2]})
>>> df
     A
0  1.0
1  NaN
2  2.0
>>> from sqlalchemy.types import Integer
>>> df.to_sql('integers', con=engine, index=False,
...           dtype={"A": Integer()})
>>> engine.execute("SELECT * FROM integers").fetchall()
[(1,), (None,), (2,)]

 

 

 https://www.cjavapy.com/article/158/

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM