數據探索中的貢獻度分析


數據探索中的貢獻度分析

貢獻度分析又叫做帕累托分析,簡單例子,如一個公司的80%的利潤來自20%的產品,而其他80%的產品卻只創造了20%的利潤,這種分析對於機器學習中的樣本選取意義有重要的作用

example

一個餐飲企業的產品為菜品,有的菜品銷量好,有的差,通過分析可以選出貢獻度大的產品,從而合理配備供給資源。
比如某月的菜品盈利如下

菜品ID 菜品名 盈利
17148 A1 9173
17154 A2 5729
109 A3 4811
117 A4 3594
17151 A5 3195
14 A6 3026
2868 A7 2378
397 A8 1970
88 A9 1877
426 A10 1782

畫出帕累托圖
菜品分析貢獻度

代碼如下

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import os
import pandas as pd
print pd.__version__
DIR = os.path.dirname(__file__)

dish_profit = DIR + '/data/catering_dish_profit.xls'
data = pd.read_excel(dish_profit, index_col = u'菜品名')
data = data[u'盈利'].copy()
data.sort_values(ascending = False)

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

plt.figure()
data.plot(kind = 'bar')
plt.ylabel(u'盈利(元)')
p = 1.0*data.cumsum()/data.sum()
p.plot(color = 'r', secondary_y = True, style = '-o', linewidth = 2)
plt.annotate(format(p[6], '.4%'), xy = (6, p[6]), xytext = (6*0.9, p[6]*0.9), arrowprops = dict(arrowstyle = '->', connectionstyle = 'arc3, rad = .2'))
plt.ylabel(u'盈利(比例)')
plt.show()

作 者:小閃電

出處:鏈接

本文版權歸作者和博客園共有,歡迎轉載、交流,但未經作者同意必須保留此段聲明,且在文章頁面明顯位置給出原文鏈接。如果覺得本文對您有益,歡迎點贊、歡迎探討。本博客來源於互聯網的資源,若侵犯到您的權利,請聯系博主予以刪除。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM