import re item = '<h1>[風之領域] NO.056 純純的女孩 寫真集 / 第2頁</h1>' #item = re.sub(u"([^\u4e00-\u9fa5])","",item)
item = re.findall(r'[^<>/h1第0-9頁a-zA-Z .]', item)
#正則去除^<>/h1第0-9頁a-zA-Z . 這些符號 item = ''.join(item) item= item.replace('[','').replace(']','')
#正則去除[] print(item)
常用方法 這兩種好理解