DataFrame(3)：DataFrame的創建方式

本文轉載自查看原文 2020-08-31 19:27 1934 pandas/ Python數據分析

1、利用字典生成DataFrame

① 第一種方式：列表組成的字典

stu = {
       "name":["張三","李四","王燕"],
       "age":[18,20,22],
       "sex":["男","男","女"]
}
df = pd.DataFrame(stu)
display(df)

結果如下：

② 第二種方式：上述方式的一般形式

person = {
          "name":"Tom",
          "age":20,
          "subject":["Python","Java","Excel"]
}
df = pd.DataFrame(person)
display(df)

結果如下：

③ 列表組成的列表

x = [[1,2,3,4],[5,6,7,8],[9,10,11,12]]
df = pd.DataFrame(data)
display(df)

結果如下：

④ 字典組成的列表

data = [
        {"one":1,"two":2},
        {"one":5,"two":10,"three":15}
]
df = pd.DataFrame(data)
display(df)

結果如下：

⑤ 字典組成的字典

data = {
    "張三":{"Java":90, "Python":89, "Hive":78},
    "李四":{"Java":82, "Python":95, "Hive":96},
    "王五":{"Java":85, "Python":94}
}
df = pd.DataFrame(data)
display(df)


data = {
    "Java":{"張三":90,"李四":82,"王五":85},
    "Python":{"張三":89,"李四":95,"王五":94},
    "Hive":{"張三":78,"李四":96}
}
df = pd.DataFrame(data)
display(df)

結果如下：

注意：對於上述兩個DataFrame，我們直接可以使用data.T進行DataFrame行、列之間的轉換。

⑥ 由Series或ndarray組成的字典

data = {
    "Java":pd.Series(np.random.randint(70,100,5)),
    "Python":np.random.randint(80,100,5)
}
df = pd.DataFrame(data)
display(df)

結果如下：

2、自定義列、索引、數據生成DataFrame

column = ["Python","Java","Excel"]
dates = pd.date_range("20200202",periods=5)
df = pd.DataFrame(np.random.randint(low=70,high=100,size=(5,3)),
                  index=dates,columns=column)
display(df)

結果如下：

注意：這里有兩個知識點需要掌握，一個是pd.date_range()，一個np.random.randint()，知道怎么用就行了，詳細說明請自行百度。

3、利用二維數組生成DataFrame(常用)

x = np.arange(1,21).reshape(4,5)
index = list("abcde")
df = pd.DataFrame(x,index=index)
display(df)

結果如下：

4、將不同的列表轉化為tuple，生成DataFrame

movie = ["戰狼2","哪吒之魔童降世","流浪地球","紅海行動"]
piapofang = [str(x)+"億" for x in [56.39,49.34,46.18,36.22]]
list_to_tuple = list(zip(movie,piaofang))

df = pd.DataFrame(list_to_tuple,columns=["movies","piaofang"])
display(df)

結果如下：

5、通過讀取sql,csv,excel等文件生成DataFrame

以后工作中都是利用已有的文件，進行數據分析。

最好的方式就是將文件讀取成DataFrame方式，然后利用各種方式進行數據處理。

由於文件格式眾多，這里不細說，你需要讀取哪一種文件，就自行百度學習一下，即可。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 spark創建DataFrame的幾種方式 JAVA SparkSQL初始和創建DataFrame的幾種方式 JAVA反射創建DataFrame（方式一，已知數據類型） DataFrame(4)：DataFrame元素的獲取方式 Spark Java創建DataFrame 二. 創建Series和DataFrame對象【sparkSQL】創建DataFrame及保存 python創建DataFrame，並實現DataFrame的轉置創建DataFrame的兩個途徑 [譯]從列表或字典創建Pandas的DataFrame對象