對csv文件進行計算出一列數據的平均值、最大值和最小值,以及對應的箱式圖


1.導入模塊

import pandas as pd
import matplotlib.pyplot as plt

2.讀取csv文件

讀取文件csvin
data = pd.read_csv('catering_sale.csv')

  結果:

 

 

 

3.計算銷量的最大值、最小值和平均值

print(data)
#1.求銷量的最大值、最小值、平均值
sales_volume_max=data['銷量'].max()
print('最大值\n',data[data['銷量']==sales_volume_max])
sales_volume_min=data['銷量'].min()
print('最小值\n',data[data['銷量']==sales_volume_min])
sales_volume_mean=data['銷量'].mean()
print('平均值\n',sales_volume_mean)

  

 

 

 

4.獲取缺失的數量以及樣本總量

#2.求缺失值
data['銷量'].isnull()
n=data['銷量'].shape[0] -data['銷量'].count()
print('樣本總數',data['銷量'].shape[0])
print('缺失值的個數',n)

  

 

 

 

5.對銷量進行數據分析給出相應的箱式圖 

#3.數據分析圖
#解決中文亂碼
plt.rcParams['font.sans-serif'] = ['KaiTi'] # 指定默認字體
plt.rcParams['axes.unicode_minus'] = False # 解決保存圖像是負號'-'顯示為方塊的問題
fig,axes = plt.subplots()
data.boxplot(column='銷量',ax=axes)
# column參數表示要繪制成箱形圖的數據,可以是一列或多列
axes.set_ylabel('sales_volume of data')
fig.savefig(r'輸出圖片')

  

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM