Python爬虫第一步之获取网页源代码


#coding: utf-8
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

html = getHtml("http://blog.sina.com.cn/")   

软件使用:Python2.7 +Pycharm,

    • # coding=utf-8
    • #coding: utf-8
    • #-*- coding: UTF-8 -*- 
      三个功能应该是一样的 
      PY文件当中是不支持中文的,即使你输入的注释是中文也不行,为了解决这个问题,就需要把文件编码类型改为UTF-8的类型,输入这个代码就可以让PY源文件里面有中文了。 
      建议你写代码之前都把这句话加上,因为不管是注释还是弹出消息提示,免不了的要输入中文,所以这个基本是必须的。(搜索自百度知道)

    • 全文:http://blog.csdn.net/hongjinlongno1/article/details/51648687


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM