当Python2.7遇到Windows中文目录

本文转载自查看原文 2016-11-01 20:34 2416 Python

　　今天学了会Python爬虫，走的是福利路线（mzitu.com）

　　爬虫还是很顺利的，但是保存福利图的时候遇到了很多困难

　　需求就是根据网页标题来创建文件夹存储当前网页的H图

　　首先网页标题获取的时候特意用

type(title)

　　看了一下，是unicode，为了实现过滤某些字符，比如"?"之类的需要用str.replace()

　　但是直接　

str(title)

　　是不可以的，所以要在爬虫代码最前加入

import sys

reload(sys)
sys.setdefaultencoding('utf-8')

　　之后在Windows创建文件夹，以标题为文件夹名

　　在百度了无数大神的经典解说后，并没卵用（全TM说转码GBK、GB2312、GB18030）

　　自己试出来了，转UTF-8即可

path  = str(title).strip().decode('utf-8')
os.makedirs(os.path.join("D:\mzitu", path)) 
oschdir("D:\mzitu\\" + path)

　　于是 get√

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 Windows 安装 python2.7 windows 安装python2.7 Python2.7 转义和正则匹配中文 python2.7 关于打印中文的各种方法 Windows上使用Python2.7安装pip Windows下编译Python2.7源码 windows环境python2.7安装MySQLdb python2.7入门---file（文件）&OS 文件&目录方法处理Python2.7读写文件中的中文乱码问题 python2.7中关于编码，json格式的中文输出显示