1、數據分析步驟
''' 數據分析步驟: 1、先加載數據 pandas.read_cvs("path") 2、查看數據詳情 df.info() ,df.describe() ,df.head() 3、根據業務獲取數據(復雜在此) 4、展現數據 '''
2、案例
# coding=utf-8 #911數據中不同月份不同類型的電話的次數的變化情況 import pandas as pd import numpy as np from matplotlib import pyplot as plt #把時間字符串轉為時間類型設置為索引 df = pd.read_csv("./911.csv") df["timeStamp"] = pd.to_datetime(df["timeStamp"]) #添加列,表示分類 temp_list = df["title"].str.split(": ").tolist() cate_list = [i[0] for i in temp_list] # print(np.array(cate_list).reshape((df.shape[0],1))) df["cate"] = pd.DataFrame(np.array(cate_list).reshape((df.shape[0],1))) df.set_index("timeStamp",inplace=True) print(df.head(1)) plt.figure(figsize=(20, 8), dpi=80) #分組 for group_name,group_data in df.groupby(by="cate"): #對不同的分類都進行繪圖 count_by_month = group_data.resample("M").count()["title"] # 畫圖 _x = count_by_month.index print(_x) _y = count_by_month.values _x = [i.strftime("%Y%m%d") for i in _x] plt.plot(range(len(_x)), _y, label=group_name) plt.xticks(range(len(_x)), _x, rotation=45) plt.legend(loc="best") plt.show()
