創建DateFrame的常用四種方式

本文轉載自查看原文 2019-09-02 16:55 826 python notebook

import pandas as pd
%pylab

一.使用numpy創建

df = pd.DataFrame(np.arange(16).reshape((4,4)),
                  index=list('abcd'),
                  columns=['one','two','three','four'])
df

二.由Series組成的字典

df3 = pd.DataFrame({'one':pd.Series([0,1,2,3]),
                    'two':pd.Series([4,5,6,7]),
                    'three':pd.Series([8,9,10,11]),
                    'four':pd.Series([12,13,14,15])},
                   columns=['one','two','three','four'])
df3

自定義行索引;

df4 = pd.DataFrame({'one':pd.Series([0,1,2,3],index=list('abcd')),
                    'two':pd.Series([4,5,6,7],index=list('abcd')),
                    'three':pd.Series([8,9,10,11],index=list('abcd')),
                    'four':pd.Series([12,13,14,15],index=list('abcd'))},
                   columns=['one','two','three','four'])
df4

總結：

由Series組成的字典，創建Dataframe， columns為字典key， index為Series的標簽（如果
Series沒有指定標簽，則默認數字標簽）

三.由字典或者series組成的列表

data = [{"one":1,"two":2},
        {"one":5,"two":10,
         "three":15}]
df6 = pd.DataFrame(data)
df6

輸出為：

指定行索引，列名：

df7 = pd.DataFrame(data, index = ["a", "b"])
df7

df4 = pd.DataFrame(data, columns = ["one", "two", "three"],index=['a','b'])

總結：

由字典組成的列表創建Dataframe， columns為字典的key， index不做指定默認為數字標簽，
pandas會自動為行，列索引排序；但是如果在pd.dataframe()的參數中指定了index和columns的值，行和列的索引就會按照指定的值排列

四.由字典組成的字典

data = {
    "Jack":{"math":90, "english":89, "art":78},
    "Marry":{"math":82, "english":95, "art":96},
    "Tom":{"math":85, "english":94}
}
df1 = pd.DataFrame(data)
df1

總結：

字典的健值作為dataframe的columns
如果沒有指定index參數的值，行索引使用默認的數字索引
每個序列的長度必須相同
同樣的，pandas會對會對列索引排序，如果顯示的傳入columns參數，將按照傳入的值得順序顯示

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 創建線程的四種方式線程創建的四種方式創建線程的四種方式並發編程（五）創建線程的四種方式創建對象的四種方式 js創建對象的四種方式 01 創建PDB的四種方式 java創建對象的四種方式創建多線程的四種方式 Spark創建RDD的四種方式