python操作數據庫的方法:
一種是導入sqlalchemy包,另一種是導入psycopg2包。
具體用法如下(此處以postgre數據庫舉例)
第一種:
# 導入包
from sqlalchemy import create_engine
import pandas as pd
from string import Template
# 初始化引擎
engine = create_engine('postgresql+psycopg2://' + pg_username + ':' + pg_password + '@' + pg_host + ':' + str(
pg_port) + '/' + pg_database)
query_sql = """
select * from $arg1
"""
query_sql = Template(query_sql) # template方法
df = pd.read_sql_query(query_sql .substitute(arg1=tablename),engine) # 配合pandas的方法讀取數據庫值
# 配合pandas的to_sql方法使用十分方便(dataframe對象直接入庫)
df.to_sql(table, engine, if_exists='replace', index=False) #覆蓋入庫
df.to_sql(table, engine, if_exists='append', index=False) #增量入庫
第二種方法,與jdbc使用極為相似
# 導入包
import psycopg2
# 初始化
conn = psycopg2.connect(database = database, user = username, password = passwd, host = host, port = port)
cursor = conn.cursor()
# 執行sql
cursor.execute(sql, values) # 與jdbc的prepareStatement極為類似,執行的是一個具體的sql語句。
cursor也能調存儲過程,並且獲取返回值。