Python escape unescape html

本文转载自查看原文 2017-12-18 20:28 1895

在做网络爬虫的时候经常需要unescape得到的html，

因为得到的html经常如下：

html = '&lt;abc&gt;'

在python 3 中如下：

from html.parser import HTMLParser

html = '<abc>'
html_parser = HTMLParser()
txt = html_parser.unescape(html)

得到的结果如下：

txt = '<abc>'

如果要转回去，可以用cgi模块

import cgi

html = cgi.escape(txt) # 这样又回到了 html = '<abc&gt'

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 C#版的 Escape() 和 Unescape() Python实现unescape解码JS(escape,encodeURI等方法)url编码字符串 js几种escape()解码与unescape()编码 js几种escape()解码与unescape()编码 java实现js端的escape和unescape html.unescape(s) python escape sequences Python 爬虫解决escape问题 python pymysql转义方法escape_string python3中的unicode_escape