python使用正則表達式文本替換


2D客戶端編程從某種意義上來講就是素材組織,所以,圖片素材組織經常需要批量處理,python一定是最佳選擇,不管是win/linux/mac都有一個簡單的運行環境

舉兩個應用場景:

  • 如果不是在某個文件夾里面則將文件夾名稱插入前面
  • 所有的文件名名稱加上一個前綴

直接看代碼吧

# encoding: UTF-8
import re

# 將正則表達式編譯成Pattern對象
p = re.compile(r'(?P<folder>(\w+/)*)(?P<filename>\w+\.png)')

# 使用Pattern匹配文本,獲得匹配結果,無法匹配時將返回None
#match = pattern.match('<key>xxx/duobaojiemian_L/yangpizi.png</key>')

the_str = """<key>XXXX/duobaojiemian2222_L/duobaojiemian_L/yangpizi.png</key>  
  <key>yangpizi2.png</key>  
  <key>yangpizi3.png</key> """

for m in p.finditer(the_str):
  # 使用Match獲得分組信息
  print m.groupdict()

print '-------------------------------'

#f = lambda m: m.group().find('XXXX/') == -1 and 'XXXX/'+m.group() or m.group() 
def f(m):
  s = m.group()
  return s.find('XXXX/') == -1 and 'XXXX/'+s or s

def f2(m2):
  d = m2.groupdict()
  return d['folder']+'the_'+d['filename']

print p.sub(f2, the_str)

  

關於正則表達式有幾個需要交代的

  • python的正則表達式如果捕獲需要分組則使用這個語法(?P<命名>匹配的正則表達式)
  • re.compile用於編譯正則表達式並返回對象
  • p.finditer返回所有匹配的迭代器
  • p.sub將匹配項傳入回調函數,並且用返回值替換文本
  • m.groupdict,可以使用則的分組命名取相應的值


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM