Pandas dataframe數據寫入文件和數據庫


轉自:http://www.dcharm.com/?p=584

Pandas是Python下一個開源數據分析的庫,它提供的數據結構DataFrame極大的簡化了數據分析過程中一些繁瑣操作,DataFrame是一張多維的表,大家可以把它想象成一張Excel表單或者Sql表。之前這篇文章已經介紹了從各種數據源將原始數據載入到dataframe中,這篇文件介紹怎么將處理好的dataframe中的數據寫入到文件和數據庫中。
首先我們通過二維ndarray創建一個簡單的DataFrame:

1
2
3
4
5
6
7
8
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(3, 4))
df
     0   1   2   3
0   1.0492286140081302  -0.7922606407983686 0.020418054868760225    -1.6649819403741724
1   0.3485250628814134  -2.117606544377745  1.466822878437205   -0.9249205656243358
2   1.3073567907490637  -0.7350348086218035 0.2856083175408006  -0.9053483976251634

1. Dataframe寫入到csv文件

1
df .to_csv( 'D:\\a.csv' , sep= ',' , header=True, index=True)

第一個參數是說把dataframe寫入到D盤下的a.csv文件中,參數sep表示字段之間用’,’分隔,header表示是否需要頭部,index表示是否需要行號。
2. Dataframe寫入到json文件

1
df .to_json( 'D:\\a.json' )

把dataframe寫入到D盤下的a.json文件中,文件的內容為

1
{ "0" :{ "0" :1.049228614, "1" :0.3485250629, "2" :1.3073567907}, "1" :{ "0" :-0.7922606408, "1" :-2.1176065444, "2" :-0.7350348086}, "2" :{ "0" :0.0204180549, "1" :1.4668228784, "2" :0.2856083175}, "3" :{ "0" :-1.6649819404, "1" :-0.9249205656, "2" :-0.9053483976}}

3.Dataframe寫入到html文件

1
df .to_html( 'D:\\a.html' )

把dataframe寫入到D盤下的a.html文件中,文件的內容為

1
< table border = "1" class = "dataframe" >\n  < thead >\n    < tr style = "text-align: right;" >\n      < th ></ th >\n      < th >0</ th >\n      < th >1</ th >\n      < th >2</ th >\n      < th >3</ th >\n    </ tr >\n  </ thead >\n  < tbody >\n    < tr >\n      < th >0</ th >\n      < td >1.049229</ td >\n      < td >-0.792261</ td >\n      < td >0.020418</ td >\n      < td >-1.664982</ td >\n    </ tr >\n    < tr >\n      < th >1</ th >\n      < td >0.348525</ td >\n      < td >-2.117607</ td >\n      < td >1.466823</ td >\n      < td >-0.924921</ td >\n    </ tr >\n    < tr >\n      < th >2</ th >\n      < td >1.307357</ td >\n      < td >-0.735035</ td >\n      < td >0.285608</ td >\n      < td >-0.905348</ td >\n    </ tr >\n  </ tbody >\n</ table >

在瀏覽器中打開a.html的樣式為
table
4.Dataframe寫入到剪貼板中
這個是我認為最為貼心的功能, 一行代碼可以將dataframe的內容導入到剪切板中,然后可以復制到任意地方

1
df .to_clipboard()

5.Dataframe寫入到數據庫中

1
df .to_sql( 'tableName' , con=dbcon, flavor= 'mysql' )

第一個參數是要寫入表的名字,第二參數是sqlarchmy的數據庫鏈接對象,第三個參數表示數據庫的類型,“mysql”表示數據庫的類型為mysql。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM