python之微信爬蟲


 

調查自己微信中好友的數據分析

代碼如下

  1 # -*- coding: utf-8 -*-
  2 """
  3 Created on Wed Jun  5 12:33:27 2019
  4 
  5 @author: m1353
  6 """
  7 
  8 from wxpy import Bot
  9 import openpyxl
 10 from pyecharts import Map
 11 from wordcloud import WordCloud
 12 import matplotlib.pyplot as plt
 13 import jieba
 14 
 15 class WeChatRobot:
 16 
 17     '''====================== 1. 獲取微信好友信息 ======================'''
 18     def __init__(self, ToExcelFile="", ToCityFile="", ToMapProvinceFile="", ToMapCityFile=""):
 19         ''' 初始化機器人和其他參數 '''
 20         # 初始化機器人,需要掃碼
 21         self.bot = Bot()
 22         # 獲取我所有的微信好友信息 - 存儲基礎信息(未處理)
 23         self.allFriends_Info = self.bot.friends()
 24         # 我的微信好友個數
 25         self.allFriends_Num = len(self.allFriends_Info)
 26         # 保存微信好友信息的表格文件路徑(.xlsx)
 27         self.ExcelFile = ToExcelFile
 28         # 保存城市詞雲圖的文件路徑(.png/.jpg)
 29         self.WCOfCityFile = ToCityFile
 30         # 保存省份地圖的文件路徑(.html)
 31         self.MapProvinceFile = ToMapProvinceFile
 32         # 其他可用參數
 33         self.MapCityFile = ToMapCityFile
 34         # 自動調用run方法,使得在實例化對象后自動運行其他函數
 35         self.run()
 36 
 37     '''====================== 2. 統計微信好友信息 ======================'''
 38     def getFriendsInfo(self):
 39         ''' 獲取微信好友的全部信息 '''
 40         # 存儲微信好友的信息(經過信息處理的)
 41         self.friendsInfo = []
 42         # 定義列標題
 43         self.infoTitle = ['NickName', 'RemarkName', 'Sex', 'Province', 'City']
 44         for aFriend in self.allFriends_Info:
 45             # 獲取昵稱
 46             NickName = aFriend.raw.get(self.infoTitle[0], None)
 47             # 獲取備注
 48             RemarkName = aFriend.raw.get(self.infoTitle[1], None)
 49             # 獲取性別
 50             Sex = {1:"", 2:"", 0:"其他"}.get(aFriend.raw.get(self.infoTitle[2], None), None)
 51             # 獲取省份
 52             Province = aFriend.raw.get(self.infoTitle[3], None)
 53             # 獲取城市
 54             City = aFriend.raw.get(self.infoTitle[4], None)
 55             lisTmp = [NickName, RemarkName, Sex, Province, City]
 56             self.friendsInfo.append(lisTmp)
 57     
 58     '''====================== 3. 保存微信好友信息 ======================'''
 59     def saveFriendsInfoAsExcel(self, ExcelName):
 60         ''' 保存微信好友的信息到 Excel 表格中 '''
 61         # 生成openpyxl對象
 62         workbook = openpyxl.Workbook()
 63         # 激活表格
 64         sheet = workbook.active
 65         # 設置表格標題
 66         sheet.title = 'WeChatFriendsInfo'
 67         # 填充列標題到第一行
 68         for _ in range(len(self.infoTitle)):
 69             sheet.cell(row=1, column=_+1, value=self.infoTitle[_])
 70         # 填充微信好友信息,從第二行開始
 71         for i in range(self.allFriends_Num):
 72             for j in range(len(self.infoTitle)):
 73                 sheet.cell(row=i+2, column=j+1, value=str(self.friendsInfo[i][j]))
 74         # 若文件名非空,則保存到該路徑下
 75         if ExcelName != "":
 76             workbook.save(ExcelName)
 77             print(">>> Save WeChat friends' information successfully!")
 78 
 79     '''====================== 4. 分析微信好友信息 ======================'''
 80     def quiteAnalyzeFriendsInfo(self):
 81         ''' 分析數據,一步到位,直接了當 '''
 82         print(self.allFriends_Info.stats_text())
 83     
 84     '''====================== 5. 產生city詞雲圖 ======================'''
 85     def creatWordCloudOfCity(self, CityName):
 86         ''' 使用獲取的數據生成city詞雲圖 '''
 87         # 獲取所有的城市
 88         cityStr = ""
 89         for i in range(self.allFriends_Num):
 90             if self.friendsInfo[i][4] not in cityStr:
 91                 cityStr += " " + self.friendsInfo[i][4]
 92         #jieba庫精確模式分詞
 93         wordlist = jieba.lcut(cityStr)
 94         cityStr = ' '.join(wordlist)
 95         # 加載背景圖片
 96         #cloud_mask = np.array(Image.open(BackGroundFile))
 97         #設置詞雲圖屬性
 98         font = r'C:\Windows\Fonts\simfang.ttf' # 設置字體路徑
 99         wc = WordCloud(
100             background_color = 'black',     # 背景顏色
101             #mask = cloud_mask,             # 背景圖片
102             max_words = 100,                # 設置最大顯示的詞雲數
103             font_path = font,               # 設置字體形式(在本機系統中)
104             height = 300,                   # 圖片高度
105             width = 600,                    # 圖片寬度
106             max_font_size = 100,            # 字體最大值
107             random_state = 100,             # 配色方案的種類
108             )
109         # 生成詞雲圖
110         myword = wc.generate(cityStr)
111         #展示詞雲圖
112         plt.imshow(myword)
113         plt.axis('off')
114         plt.show()
115         # 若文件名非空,則保存到該路徑下
116         if CityName != "":
117             #保存詞雲圖
118             wc.to_file(CityName)
119             print(">>> Creat WeChat wordcloud of city successfully!")
120     
121     '''===================== 6. 產生province地圖 ====================='''
122     def creatMapProvince(self, MapFile):
123         ''' 使用獲取的數據生成province地圖 '''
124         # 獲取所有省份
125         provinceList, provinceNum = [], []
126         for i in range(self.allFriends_Num):
127             if self.friendsInfo[i][3] not in provinceList:
128                 provinceList.append(self.friendsInfo[i][3])
129                 provinceNum.append(0)
130         for i in range(self.allFriends_Num):
131             for j in range(len(provinceList)):
132                 if self.friendsInfo[i][3] == provinceList[j]:
133                     provinceNum[j] += 1
134         # 生成 Map
135         map = Map("各省微信好友分布", width=1000, height=800)
136         map.add("", provinceList, provinceNum, maptype="china", is_visualmap=True, visual_text_color='#000')
137         # 若文件名非空,則保存到該路徑下
138         if MapFile != "":
139             #map.show_config()
140             map.render(MapFile)
141             print(">>> Creat WeChat Map of Provinces seccessfully!")
142     
143     '''===================== 7. 產生city地圖 ====================='''
144     def creatMapCity(self, MapFile):
145         ''' 使用獲取的數據生成city地圖 '''
146         # 獲取所有省份
147         CityList, CityNum = [], []
148         for i in range(self.allFriends_Num):
149             if self.friendsInfo[i][4] not in CityList:
150                 CityList.append(self.friendsInfo[i][4])
151                 CityNum.append(0)
152         for i in range(self.allFriends_Num):
153             for j in range(len(CityList)):
154                 if self.friendsInfo[i][4] == CityList[j]:
155                     CityNum[j] += 1
156         for i in range(len(CityList)):
157             CityList[i] += '市'
158         # 生成 Map
159         map = Map("各市微信好友分布", width=1000, height=800)
160         map.add("", CityList, CityNum, maptype="廣東", is_visualmap=True, visual_text_color='#000')
161         # 若文件名非空,則保存到該路徑下
162         if MapFile != "":
163             map.render(MapFile)
164             print(">>> Creat WeChat Map of Cities seccessfully!")
165         
166     '''===================== 8. 自動執行函數 ====================='''
167     def run(self):
168         # 獲取微信好友信息
169         self.getFriendsInfo()
170         print(">>> Get WeChat friends' information successfully!")
171         print(">>> Members:", self.allFriends_Num)
172         # 保存微信好友信息
173         self.saveFriendsInfoAsExcel(self.ExcelFile)
174         # 分析微信好友信息
175         self.quiteAnalyzeFriendsInfo()
176         # 使用微信好友的 city 產生詞雲圖
177         self.creatWordCloudOfCity(self.WCOfCityFile)
178         # 生成微信好友的 province 地圖
179         self.creatMapProvince(self.MapProvinceFile)
180         # 生成微信好友的 city 地圖
181         self.creatMapCity(self.MapCityFile)
182         
183 if __name__ == "__main__":
184     ToExcelFile = "D:\\python wexin\\微信好友1.xlsx"      # 微信好友信息的Excel表格保存路徑
185     ToPictureFile = "D:\\python wexin\\微信好友2.png"   # 微信好友信息city詞雲圖保存路徑
186     ToMapFileProvince = "D:\\python wexin\\微信好友3.html" # 微信好友信息province地圖保存路徑
187     ToMapFileCity = "D:\\python wexin\\微信好友4.html"  # 微信好友信息city地圖保存路徑
188     # WeChatRobot對象實例化
189     robot = WeChatRobot(ToExcelFile, ToPictureFile, ToMapFileProvince, ToMapFileCity)

然后我們可以獲得一個xlsx文件,一個詞雲圖片,兩個html網頁

文件內容如下

xlsx文件有隱私內容我就不放了

直接來到詞雲

之后是第一份html

 

 第二份html

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM