Python爬虫第一步之获取网页源代码

本文转载自查看原文 2016-11-26 13:54 9705 Python

#coding: utf-8
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

html = getHtml("http://blog.sina.com.cn/")

软件使用：Python2.7 +Pycharm，

# coding=utf-8
#coding: utf-8
#-*- coding: UTF-8 -*-
三个功能应该是一样的
PY文件当中是不支持中文的，即使你输入的注释是中文也不行，为了解决这个问题，就需要把文件编码类型改为UTF-8的类型，输入这个代码就可以让PY源文件里面有中文了。
建议你写代码之前都把这句话加上，因为不管是注释还是弹出消息提示，免不了的要输入中文，所以这个基本是必须的。（搜索自百度知道）
全文：http://blog.csdn.net/hongjinlongno1/article/details/51648687

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 RabbitMQ代码第一步说说我对网页授权获取用户基本信息，前端要做的是第一步简明Python3教程 5.第一步契约测试第一步--pact-python安装淘宝API开发第一步创业这3年#迈出第一步迈出第一步:自适应高度的ImageView（AutoHeightImageView）优化第一步各种驱动问题 C# Office Com Addin开发第一步 Unity Ruby's Adventure 第一步