作業要求來自於:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3075 熱門微博— —996與日劇《我要准時下班》 至此,“996話題”在微博上被傳得沸沸揚揚。微博上關於“996”的話題已超過千個,甚至更多 ...
這個作業的要求來自於:https: edu.cnblogs.com campus gzcc GZCC SE homework 。 B站有很多號稱 鎮站之寶 的視頻,擁有着數量極其恐怖的評論和彈幕。這次我的目的就是爬取B站視頻的評論數據,分析某番劇為何會深受大家喜愛。 首先我通過B站大神的數據統計了解到,B站評論數量最多的番劇是 全職高手 。如下圖所示: 通過數據可知 全職高手 這部番的第一集和最 ...
2019-04-24 22:41 0 574 推薦指數:
作業要求來自於:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3075 熱門微博— —996與日劇《我要准時下班》 至此,“996話題”在微博上被傳得沸沸揚揚。微博上關於“996”的話題已超過千個,甚至更多 ...
1.選一個自己感興趣的主題(所有人不能雷同)。 2.用python 編寫爬蟲程序,從網絡上爬取相關主題的數據。 3.對爬了的數據進行文本分析,生成詞雲。 4.對文本分析結果進行解釋說明。 5.寫一篇完整的博客,描述上述實現過程、遇到的問題及解決辦法、數據分析思想 ...
一、題目: 獲取並保存目標網站的下圖所示的所有英文名,網頁轉換通過點擊more names刷新名字並將各個英文名子目錄下,去獲取並保存每一個英文名的名字、性別、寓意、簡介如下圖所示內容紅色標記框 ...
作業要求來自https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3159 可以用pandas讀出之前保存的數據:見上次博客爬取全部的校園新聞並保存csv newsdf = pd.read_csv(r'F:\duym ...
1.選一個自己感興趣的主題或網站。(所有同學不能雷同) https://www.bilibili.com/video/av22224421 2.用python 編寫爬蟲程序,從網絡上爬取相關主題的數據。 3.對爬了的數據進行文本分析,生成詞雲。 4.對文 ...
本次作業的要求來自:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3339 前言 本次作業是在《爬蟲大作業》的基礎上進行的,在《爬蟲大作業》中,我主要對拉勾網python崗位的招聘信息進行的數據爬取,最終得到了2641條數據存在 ...
# _*_ coding:utf-8 _*_ import requests import threading from bs4 import BeautifulSoup import re i ...
1.主題 虎撲體育網2016年至今關於巴薩的新聞 2.用python 編寫爬蟲程序,從網絡上爬取相關主題的數據。 在虎撲巴薩新聞中用開發者工具找出相關信息 #新聞列表 def getListPage(pageUrl): res = requests.get ...