Python爬蟲第一步之獲取網頁源代碼


#coding: utf-8
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

html = getHtml("http://blog.sina.com.cn/")   

軟件使用:Python2.7 +Pycharm,

    • # coding=utf-8
    • #coding: utf-8
    • #-*- coding: UTF-8 -*- 
      三個功能應該是一樣的 
      PY文件當中是不支持中文的,即使你輸入的注釋是中文也不行,為了解決這個問題,就需要把文件編碼類型改為UTF-8的類型,輸入這個代碼就可以讓PY源文件里面有中文了。 
      建議你寫代碼之前都把這句話加上,因為不管是注釋還是彈出消息提示,免不了的要輸入中文,所以這個基本是必須的。(搜索自百度知道)

    • 全文:http://blog.csdn.net/hongjinlongno1/article/details/51648687


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM