标签【python_html】

Python BeautifulSoup 简单笔记

Beautiful Soup 是用 Python 写的一个 HTML/XML 的解析器，它可以很好的处理不规范标记并生成剖析树。通常用来分析爬虫抓取的web文档。对于不规则的 Html文档，也有很多 ...

Python:使用正则去除HTML标签(转)

利用正则式处理，不知道会不会有性能问题，没有经过太多测试。目前我有很多还是使用BeautifulSoup进行这种处理。 HTML实体处理的只是用于处理一些常用的实体。输出结果： G ...

python怎么解压压缩的字符串数据

范例1: gzip 一个简单的例子 ...

Python验证Url地址的正则表达式

如下是django中做url验证的正则表达式： ...

urllib2模块、cookielib模块

urllib2模块 urllib模块和urllib模块类似 ...

SQLite使用小结

一、SQLite简介　　SQLite是一款轻型的数据库，是遵守ACID的关联式数据库管理系统，它的设计目标是嵌入式的，而且目前已经在很多嵌入式产品中使用了它，它占用资源非常的低，在嵌入 ...

用python正则表达式提取网页的url

挺好用的，记录下 ...

Python如何下载文件

利用程序自己编写下载文件挺有意思的。Python中最流行的方法就是通过Http利用urllib或者urllib2模块。当然你也可以利用ftplib从ftp站点下载文件。此外Python还提供了另外一种 ...