---------------環境配置---------------
1、在Windows操作系統下安裝python-3.6.4-amd64.exe
2、配置環境變量
Path變量:如C:\Users\Administrator\AppData\Local\Programs\Python\Python36\
打開cmd命令窗口,輸入:python命令,可以進入python 編輯命令行,即可。
3、把beautifulsoup4-4.6.0.tar.gz解壓后,放在Python36\目錄下,在cmd中...\Python36\beautifulsoup4-4.6.0\下執行命令
python setup.pyinstall ,安裝成功不報錯。
4、把get-pip.py放在...\Python36\目錄下,執行命令:python get-pip.py,安裝pip成功。
5、在...\Python36\Scripts目錄下,打開cmd,導入requests、pymysql、urllib等模塊,執行命令如下
pip installrequests
pip installpymysql
pip installurllib
測試一下python的環境---導入幾個包,不報錯即可
import requests
from bs4 importBeautifulSoup
import pymysql
fromurllib.request import urlopen
-------------執行app應用信息爬取-----
1、首先把app爬取腳本getmiAppInfo整個文件夾放在...\Python36\Lib\site-packages目錄下
2、修改數據庫配置文件
\GetAllAppInfo\baseconfig.ini
如下:
[db]
DB_HOST=192.168.2.73
DB_PORT=3306
DB_USERNAME=root
DB_PASSWORD=cecgw
DB_BASEDATA=app
3、需要創建一個mysql數據庫,數據庫名稱為app
執行表創建腳本
------------------------------
-- Tablestructure for appinfo1
------------------------------
DROP TABLE IFEXISTS `appinfo1`;
CREATE TABLE`appinfo1` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`channel` varchar(50) DEFAULT NULL,
`Faclassname` varchar(255) DEFAULT NULL,
`subclassname` varchar(100) DEFAULT NULL,
`appname` varchar(255) DEFAULT NULL,
`score` varchar(50) DEFAULT NULL,
`loadcounts` varchar(50) DEFAULT NULL,
`size` varchar(50) DEFAULT NULL,
`author` varchar(255) DEFAULT NULL,
`updatetime` varchar(50) DEFAULT NULL,
`version` varchar(100) DEFAULT NULL,
`supsystem` varchar(100) DEFAULT NULL,
`suplang` varchar(50) DEFAULT NULL,
`appurl` varchar(255) DEFAULT NULL,
`loadurl` varchar(255) DEFAULT NULL,
`str1` varchar(255) DEFAULT NULL,
`str2` varchar(255) DEFAULT NULL,
`str3` varchar(255) DEFAULT NULL,
`str4` varchar(255) DEFAULT NULL,
`str5` varchar(255) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDBAUTO_INCREMENT=1038 DEFAULT CHARSET=utf8;
4、運行app爬取腳本
打開...\Python36\Lib\site-packages\GetAllAppInfo\目錄,打開cmd,
執行命令python RunMain.py
根據渠道說明,輸入渠道標號
如輸入1,自動執行‘360手機助手’渠道的app應用信息爬取
存儲到數據庫后,根據loadurl需要下載app.apk包下載到\GetAllAppInfo\pkg,請執行python appDownload.py
注意:
源代碼詳見
鏈接:https://pan.baidu.com/s/1ggOJl2j 密碼:0auz