1.導入模塊
import pandas as pd import matplotlib.pyplot as plt
2.讀取csv文件
讀取文件csvin data = pd.read_csv('catering_sale.csv')
結果:
3.計算銷量的最大值、最小值和平均值
print(data) #1.求銷量的最大值、最小值、平均值 sales_volume_max=data['銷量'].max() print('最大值\n',data[data['銷量']==sales_volume_max]) sales_volume_min=data['銷量'].min() print('最小值\n',data[data['銷量']==sales_volume_min]) sales_volume_mean=data['銷量'].mean() print('平均值\n',sales_volume_mean)
4.獲取缺失的數量以及樣本總量
#2.求缺失值 data['銷量'].isnull() n=data['銷量'].shape[0] -data['銷量'].count() print('樣本總數',data['銷量'].shape[0]) print('缺失值的個數',n)
5.對銷量進行數據分析給出相應的箱式圖
#3.數據分析圖 #解決中文亂碼 plt.rcParams['font.sans-serif'] = ['KaiTi'] # 指定默認字體 plt.rcParams['axes.unicode_minus'] = False # 解決保存圖像是負號'-'顯示為方塊的問題 fig,axes = plt.subplots() data.boxplot(column='銷量',ax=axes) # column參數表示要繪制成箱形圖的數據,可以是一列或多列 axes.set_ylabel('sales_volume of data') fig.savefig(r'輸出圖片')