轉自:http://www.dcharm.com/?p=584
Pandas是Python下一個開源數據分析的庫,它提供的數據結構DataFrame極大的簡化了數據分析過程中一些繁瑣操作,DataFrame是一張多維的表,大家可以把它想象成一張Excel表單或者Sql表。之前這篇文章已經介紹了從各種數據源將原始數據載入到dataframe中,這篇文件介紹怎么將處理好的dataframe中的數據寫入到文件和數據庫中。
首先我們通過二維ndarray創建一個簡單的DataFrame:
|
1
2
3
4
5
6
7
8
|
import
pandas as pd
import
numpy as np
df
= pd.DataFrame(np.random.randn(3, 4))
df
0 1 2 3
0 1.0492286140081302 -0.7922606407983686 0.020418054868760225 -1.6649819403741724
1 0.3485250628814134 -2.117606544377745 1.466822878437205 -0.9249205656243358
2 1.3073567907490637 -0.7350348086218035 0.2856083175408006 -0.9053483976251634
|
1. Dataframe寫入到csv文件
|
1
|
df
.to_csv(
'D:\\a.csv'
, sep=
','
, header=True, index=True)
|
第一個參數是說把dataframe寫入到D盤下的a.csv文件中,參數sep表示字段之間用’,’分隔,header表示是否需要頭部,index表示是否需要行號。
2. Dataframe寫入到json文件
|
1
|
df
.to_json(
'D:\\a.json'
)
|
把dataframe寫入到D盤下的a.json文件中,文件的內容為
|
1
|
{
"0"
:{
"0"
:1.049228614,
"1"
:0.3485250629,
"2"
:1.3073567907},
"1"
:{
"0"
:-0.7922606408,
"1"
:-2.1176065444,
"2"
:-0.7350348086},
"2"
:{
"0"
:0.0204180549,
"1"
:1.4668228784,
"2"
:0.2856083175},
"3"
:{
"0"
:-1.6649819404,
"1"
:-0.9249205656,
"2"
:-0.9053483976}}
|
3.Dataframe寫入到html文件
|
1
|
df
.to_html(
'D:\\a.html'
)
|
把dataframe寫入到D盤下的a.html文件中,文件的內容為
|
1
|
<
table
border
=
"1"
class
=
"dataframe"
>\n <
thead
>\n <
tr
style
=
"text-align: right;"
>\n <
th
></
th
>\n <
th
>0</
th
>\n <
th
>1</
th
>\n <
th
>2</
th
>\n <
th
>3</
th
>\n </
tr
>\n </
thead
>\n <
tbody
>\n <
tr
>\n <
th
>0</
th
>\n <
td
>1.049229</
td
>\n <
td
>-0.792261</
td
>\n <
td
>0.020418</
td
>\n <
td
>-1.664982</
td
>\n </
tr
>\n <
tr
>\n <
th
>1</
th
>\n <
td
>0.348525</
td
>\n <
td
>-2.117607</
td
>\n <
td
>1.466823</
td
>\n <
td
>-0.924921</
td
>\n </
tr
>\n <
tr
>\n <
th
>2</
th
>\n <
td
>1.307357</
td
>\n <
td
>-0.735035</
td
>\n <
td
>0.285608</
td
>\n <
td
>-0.905348</
td
>\n </
tr
>\n </
tbody
>\n</
table
>
|
在瀏覽器中打開a.html的樣式為
4.Dataframe寫入到剪貼板中
這個是我認為最為貼心的功能, 一行代碼可以將dataframe的內容導入到剪切板中,然后可以復制到任意地方
|
1
|
df
.to_clipboard()
|
5.Dataframe寫入到數據庫中
|
1
|
df
.to_sql(
'tableName'
, con=dbcon, flavor=
'mysql'
)
|
第一個參數是要寫入表的名字,第二參數是sqlarchmy的數據庫鏈接對象,第三個參數表示數據庫的類型,“mysql”表示數據庫的類型為mysql。
