python3.6+BeautifulSoup4.2 爬取各類app應用信息並下載app包


---------------環境配置---------------

1、在Windows操作系統下安裝python-3.6.4-amd64.exe

2、配置環境變量

Path變量:如C:\Users\Administrator\AppData\Local\Programs\Python\Python36\

打開cmd命令窗口,輸入:python命令,可以進入python 編輯命令行,即可。

3、把beautifulsoup4-4.6.0.tar.gz解壓后,放在Python36\目錄下,在cmd中...\Python36\beautifulsoup4-4.6.0\下執行命令

python setup.pyinstall ,安裝成功不報錯。

4、把get-pip.py放在...\Python36\目錄下,執行命令:python get-pip.py,安裝pip成功。

5、在...\Python36\Scripts目錄下,打開cmd,導入requests、pymysql、urllib等模塊,執行命令如下

pip installrequests

pip installpymysql

pip installurllib

測試一下python的環境---導入幾個包,不報錯即可

import requests

from bs4 importBeautifulSoup

import pymysql

fromurllib.request import urlopen

 

-------------執行app應用信息爬取-----

1、首先把app爬取腳本getmiAppInfo整個文件夾放在...\Python36\Lib\site-packages目錄下

2、修改數據庫配置文件

\GetAllAppInfo\baseconfig.ini

如下:

[db]

DB_HOST=192.168.2.73

DB_PORT=3306

DB_USERNAME=root

DB_PASSWORD=cecgw

DB_BASEDATA=app

3、需要創建一個mysql數據庫,數據庫名稱為app

執行表創建腳本

------------------------------

-- Tablestructure for appinfo1

------------------------------

DROP TABLE IFEXISTS `appinfo1`;

CREATE TABLE`appinfo1` (

  `id` int(11) NOT NULL AUTO_INCREMENT,

  `channel` varchar(50) DEFAULT NULL,

  `Faclassname` varchar(255) DEFAULT NULL,

  `subclassname` varchar(100) DEFAULT NULL,

  `appname` varchar(255) DEFAULT NULL,

  `score` varchar(50) DEFAULT NULL,

  `loadcounts` varchar(50) DEFAULT NULL,

  `size` varchar(50) DEFAULT NULL,

  `author` varchar(255) DEFAULT NULL,

  `updatetime` varchar(50) DEFAULT NULL,

  `version` varchar(100) DEFAULT NULL,

  `supsystem` varchar(100) DEFAULT NULL,

  `suplang` varchar(50) DEFAULT NULL,

  `appurl` varchar(255) DEFAULT NULL,

  `loadurl` varchar(255) DEFAULT NULL,

  `str1` varchar(255) DEFAULT NULL,

  `str2` varchar(255) DEFAULT NULL,

  `str3` varchar(255) DEFAULT NULL,

  `str4` varchar(255) DEFAULT NULL,

  `str5` varchar(255) DEFAULT NULL,

  PRIMARY KEY (`id`)

) ENGINE=InnoDBAUTO_INCREMENT=1038 DEFAULT CHARSET=utf8;

4、運行app爬取腳本

打開...\Python36\Lib\site-packages\GetAllAppInfo\目錄,打開cmd,

執行命令python RunMain.py

根據渠道說明,輸入渠道標號

如輸入1,自動執行‘360手機助手’渠道的app應用信息爬取

存儲到數據庫后,根據loadurl需要下載app.apk包下載到\GetAllAppInfo\pkg,請執行python appDownload.py

注意:

源代碼詳見

鏈接:https://pan.baidu.com/s/1ggOJl2j 密碼:0auz


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM