Python爬取中國天氣網

基於requests庫制作的爬蟲。

使用方法：打開終端輸入 “python3 weather.py 北京(或你所在的城市)"

程序正常運行需要在同文件夾下加入一個“data.csv”文件，內容請參考鏈接：城市代碼

運行效果：

源碼：

import sys
import re
import requests
import webbrowser
from PIL import Image
from requests.exceptions import RequestException
import csv
data={}
with open("data.csv",'r') as f:
    rawinfos=list(csv.reader(f))
    for i in rawinfos:
        data[i[0]]=i[1]
def get_one_page(url,headers):
    try:
        response=requests.get(url,headers=headers)
        if response.status_code==200:
            response.encoding='utf-8'
            return response.text
        return None
    except RequestException:
        return None
headers={'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/604.4.7 (KHTML, like Gecko) Version/11.0.2 Safari/604.4.7'}
try:
    address=data[sys.argv[1]]
except:
    sys.exit("\033[31m無該城市！\033[0m")
html=get_one_page('http://www.weather.com.cn/weather1d/'+address+'.shtml',headers)
if not html:
    print("城市代碼有誤！")
    exit(1)
ADDRESS=re.findall('<title>(.*?)</title>',html)
aim=re.findall('<input type="hidden" id="hidden_title" value="(.*?)月(.*?)日(.*?)時(.*?) (.*?)  (.*?)  (.*?)"',html,re.S)
airdata=re.findall('<li class="li6 hot">\n<i></i>\n<span>(.*?)</span>\n<em>(.*?)</em>\n<p>(.*?)</p>\n</li>',html,re.S)
print(ADDRESS[0][1:5])
print("當前日期：%s月%s日,%s"%(aim[0][0],aim[0][1],aim[0][4]))
print("更新時間：%s:00"%aim[0][2])
print("當前天氣：%s"%aim[0][5])
print("今日溫度：%s"%aim[0][6])
print("空氣質量："+airdata[0][0]+","+airdata[0][2])
ask_ok=input("是否深入查看（Y/N）：")
if ask_ok=='Y' or ask_ok=='y':
    lightdata=re.findall('<li class="li1 hot">\n<i></i>\n<span>(.*?)</span>\n<em>(.*?)</em>\n<p>(.*?)</p>\n</li>',html,re.S)
    colddata=re.findall('<li class="li2 hot">\n(.*?)</span>\n<em>(.*?)</em>\n<p>(.*?)</p>',html,re.S)
    weardata=re.findall('<li class="li3 hot" id="chuanyi">\n(.*?)<span>(.*?)</span>\n<em>(.*?)</em>\n<p>(.*?)</p>',html,re.S)
    washdata=re.findall('<li class="li4 hot">\n<i></i>\n<span>(.*?)</span>\n<em>(.*?)</em>\n<p>(.*?)</p>\n</li>',html,re.S)
    bloodata=re.findall('<li class="li5 hot">\n<i></i>\n<span>(.*?)</span>\n<em>(.*?)</em>\n<p>(.*?)</p>\n</li>',html,re.S)
    detail = re.findall('hour3data={"1d":(.*?),"23d"', html, re.S)
    detail = re.findall('"(.*?)"', detail[0], re.S)
    print("--"*40)
    print('詳細數據：')
    print("%-10s\t%-10s\t%-10s\t%-10s\t%-10s"%("時間","狀態","溫度","風向","風力"))
    for each in detail:
        each=each.split(',')
        print("%-10s\t%-10s\t%-10s\t%-10s\t%-10s"%(each[0],each[2],each[3],each[4],each[5]))
    print("--"*40)
    print("%s:\t%s\t%s"%(lightdata[0][1],lightdata[0][0],lightdata[0][2]))
    print("%s:\t%s"%(colddata[0][1],colddata[0][2]))
    print("%s:\t%s\t%s"%(washdata[0][1],washdata[0][0],washdata[0][2]))
    print("血糖指數:\t%s,%s"%(bloodata[0][0],bloodata[0][2]))
    print("%s:\t%s\t%s"%(weardata[0][2],weardata[0][1],weardata[0][3]))
    print("--"*40)
    flag=input("是否查看詳細穿衣建議（Y/N）：")
    if flag=='Y' or flag=='y':
        webbrowser.open("http://www.weather.com.cn/forecast/ct.shtml?areaid="+address)
print("數據來源：中央氣象台")

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python爬取中國天氣網天氣數據初識python 之爬蟲：爬取中國天氣網數據 python爬取天氣后報網爬取中國天氣網所有地區的天氣，最高氣溫與最低氣溫情況(python是3.7版本的) Python爬取天氣網歷史天氣數據 Python爬取天氣網歷史天氣數據 python爬取中國地震網 python爬蟲爬取中國天氣網各城市天氣數據（柱狀圖展示和中國地圖展示）（pyquery+pyecharts ) 爬蟲-通過本地IP地址從中國天氣網爬取當前城市天氣情況爬取中國天氣網某城市一周天氣