一、功能介紹
本文主要介紹利用網頁端微信獲取數據,實現個人微信好友數據的獲取,並進行一些簡單的數據分析,功能包括:
1.爬取好友列表,顯示好友昵稱、性別和地域和簽名, 文件保存為 xlsx 格式
2.統計好友的地域分布,並且做成詞雲和可視化展示在地圖上
二、依賴庫
1、Pyecharts:一個用於生成echarts圖表的類庫,echarts是百度開源的一個數據可視化庫,用echarts生成的圖可視化效果非常棒,使用pyechart庫可以在python中生成echarts數據圖。
2、Itchat:一個開源的微信個人號接口,使用python調用微信從未如此簡單。
3、Jieba:簡單的分詞操作庫。
4、Numpy:NumPy 系統是 Python 的一種開源的數值計算擴展。這種工具可用來存儲和處理大型矩 陣。
5、Pandas:pandas 是基於 NumPy 的一種工具,該工具是為了解決數據分析任務而創建的。
6、Pillow:圖像處理。
7、wxpy:wxpy 在 itchat 的基礎上,通過大量接口優化提升了模塊的易用性,並進行豐富的功能 擴展。 (微信本身提供)
注:Pyecharts可能安裝0.5.*的版本比較好
以上的三方庫可以通過命令符(cmd)來實現安裝,具體命令:pip install ***
三,操作
1 from wxpy import * #導入模塊 2 bot = Bot(cache_path=True) #初始化機器人,選擇掃碼登錄 3 friend_all = bot.friends() #獲取微信好友信息
首先出現的是一張二維碼,然后掃描登錄
成功登錄好了就是這種顯示
之后就可以進行操作了,好友數量,個人信息
1 print(len(friend_all)) #好友的數量
2 print(friend_all[0].raw) #輸出個人信息
顯示的結果
四、接下來把全部的好友信息轉化為一個xlsx文件
獲取全部好友信息
1 for a_friend in friend_all: 2 NickName = a_friend.raw.get('NickName', None) 3 #昵稱 4 #Sex = a_friend.raw.get('Sex', None) 5 Sex = {1: "男", 2: "女", 0: "其它"}.get(a_friend.raw.get('Sex', None), None) 6 #性別(優化) 7 City = a_friend.raw.get('City', None) 8 #城市 9 Province = a_friend.raw.get('Province', None) 10 #省份 11 Signature = a_friend.raw.get('Signature', None) 12 #個性簽名 13 HeadImgUrl = a_friend.raw.get('HeadImgUrl', None) 14 #頭像地址 15 HeadImgFlag = a_friend.raw.get('HeadImgFlag', None) 16 #小Flag 17 list_0=[NickName, Sex, City, Province, Signature, HeadImgUrl, HeadImgFlag] 18 #存為一維數組 19 lis.append(list_0) 20 #疊加數據
存為xlsx文件
1 def list_excel(filename,lis): 2 ''' 3 將列表寫入excel中,其中列表中的元素是列表. 4 filename:保存的文件名(含路徑) 5 lis:元素為列表的列表,如下: 6 lis = [["名稱", "價格", "出版社", "語言"], 7 ["暗時間", "32.4", "人民郵電出版社", "中文"], 8 ["拆掉思維里的牆", "26.7", "機械工業出版社", "中文"]] 9 ''' 10 import openpyxl 11 wb = openpyxl.Workbook() #激活worksheet 12 sheet = wb.active 13 sheet.title = 'sheet1' #創建一個表格 14 file_name = filename +'.xlsx' 15 for i in range(0, len(lis)): 16 for j in range(0, len(lis[i])): 17 sheet.cell(row=i+1, column=j+1, value=str(lis[i][j])) 18 #每行每列的存入數據 19 wb.save(file_name) 20 print("寫入數據成功!") 21 list_excel('wechat',lis)
效果如下:
可以看到其好友基本分布再廣東省,個性簽名也是非常的殺馬特
五、實現詞雲圖(我們也可以從存儲在本地的 excel 中讀取數據進行分析,並查看數據形式。在執行以 下代碼之前,我們需要先把 excel 文件加一個列標題行)
例如nickname sex city province signature headImgUrl headImgFlag
1 #導入模塊 2 from wordcloud import WordCloud 3 import matplotlib.pyplot as plt 4 import pandas as pd 5 from pandas import DataFrame 6 7 word_list= df['city'].fillna('0').tolist() 8 #將 dataframe 的列轉化為 list,其中的 nan 用“0”替換 9 new_text = ' '.join(word_list) 10 wordcloud = WordCloud(font_path='simhei.ttf', background_color="black").generate(new_text) 11 #設計圖背景顏色,字體 12 plt.imshow(wordcloud) 13 plt.axis("off") 14 plt.show()
還可以將詞雲圖存為HTML形式
1 #利用 pyechart 做詞雲 2 import pandas as pd 3 #count = df.city.value_counts() #對 dataframe 進行全頻率統計,排除了 nan 4 city_list = df['city'].fillna('NAN').tolist()#將 dataframe 的列轉化為 list,其中的 nan 用“NAN” 替換 5 count_city = pd.value_counts(city_list)#對 list 進行全頻率統計 6 from pyecharts.charts.wordcloud import WordCloud #設置對象 7 name = count_city.index.tolist() 8 value = count_city.tolist() 9 wordcloud = WordCloud(width=1300, height=620) 10 wordcloud.add("", name, value, word_size_range=[20, 100]) 11 wordcloud.show_config() 12 wordcloud.render(r'D:\python\wechatcloud.html')
再看看效果:
六、轉化為地圖形式
注:安裝地圖數據包:pip install echarts-china-provinces-pypkg pip install echarts-countries-pypkg
1 province_list = df['province'].fillna('NAN').tolist() 2 #將 dataframe 的列轉化為 list,其中的 nan 用 “NAN”替換 3 count_province = pd.value_counts(province_list) 4 #對 list 進行全頻率統計 5 6 from pyecharts import Map 7 value =count_province.tolist() 8 attr =count_province.index.tolist() 9 map=Map("各省微信好友分布", width=1300, height=700) 10 map.add("", attr, value, maptype='china', is_visualmap=True,visual_text_color='#000',is_label_show = True) 11 #顯示地圖上的省份 12 map.show_config() 13 map.render(r'D:\python\wechatProMap.html')
效果:
好了,以上微信好友分析就介紹到這了。