Python爬蟲第一步之獲取網頁源代碼

本文轉載自查看原文 2016-11-26 13:54 9705 Python

#coding: utf-8
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

html = getHtml("http://blog.sina.com.cn/")

軟件使用：Python2.7 +Pycharm，

# coding=utf-8
#coding: utf-8
#-*- coding: UTF-8 -*-
三個功能應該是一樣的
PY文件當中是不支持中文的，即使你輸入的注釋是中文也不行，為了解決這個問題，就需要把文件編碼類型改為UTF-8的類型，輸入這個代碼就可以讓PY源文件里面有中文了。
建議你寫代碼之前都把這句話加上，因為不管是注釋還是彈出消息提示，免不了的要輸入中文，所以這個基本是必須的。（搜索自百度知道）
全文：http://blog.csdn.net/hongjinlongno1/article/details/51648687

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 RabbitMQ代碼第一步說說我對網頁授權獲取用戶基本信息，前端要做的是第一步簡明Python3教程 5.第一步契約測試第一步--pact-python安裝淘寶API開發第一步創業這3年#邁出第一步邁出第一步:自適應高度的ImageView（AutoHeightImageView）優化第一步各種驅動問題 C# Office Com Addin開發第一步 Unity Ruby's Adventure 第一步