天貓評論的差評和好評的數據分析
評論的數據是用爬蟲爬的,在這里不說了,很多教程都詳細的介紹了。
實現思路,我的評判標准是:
| 好 | 較好 | 差 | 較差 |
|---|---|---|---|
| 贊 | 喜歡 | 垃圾 | 慢 |
| 非常好 | 不錯 | 坑 | 退 |
| 非常喜歡 | 挺好 | 無語 | 不值 |
| 好評 | 美 | 太差 | 將就 |
| 超級好 | 棒 | 嚴重 | 失望 |
| 非常滿意 | 實用 | 很差 | 根本 |
| 特別好 | 很好 | 差評 | 算了 |
| 驚喜 | 不滿意 |
把這些關鍵詞直接使用IF/FIND/ROUNDUP函數結合使用找出來內容中包含的關鍵字,運用excel在做透視表,匯總起來數據,算出差評率

根據上面的數據,可以用EXCEL中的FIND函數找到評價內容中是否有這個字,如果有對應相對的評價
=ROUNDUP(IFEROR(FIND(K$1,$C2)/1000,0),0)
EXCEL中的$代表鎖定,K$1,代表的鎖定第一行,$C代表的是鎖定C這一列,FIND函數如果找到就返回索引位置,找不到就返回0,ROUNDUP函數是向上取整,例如3.2取為4,0.03取為1。
因為人的情感里面有可能前半句是好話,但是陡然一轉就進行了缺點的批評,故要算出每一個詞出現的評分,最后加起來進行統計,正的話是好評,負的話是差評
=IF(AK2>0,"差",IF(S2>0,"好",S2+AB2-AK2-AV2))
最后統計出結果:
=IF(AY2="差","差評",IF(AY2<0,"差評","好評"))
統計出評價字數:
=IF(LEN(C2)>90,"90字以上",IF(LEN(C2)<50,"50字以下","50字以上"))
之后再進行透視表的匯總和透視圖的繪畫,算出差評率和好評率,以及累積差評率,就不詳細說了。
