在使用正則替換時,有時候需要將匹配的結果做對應處理,便可以使用自定義替換方法。
re.sub的用法為:
re.sub('匹配表達式',替換字符或替換函數,替換次數,其他參數)
例如,加入將字符串中的$開頭的變量替換為上下文context中對應的值,可以操作如下。
import re
context = {'a': 1, 'b': 2, 'except': 3}
text = '$a + $b = $except'
def repl_func(matched):
if matched:
text = matched.group(1)
return str(context.get(text))
result = re.sub('\$(\w+)', repl_func, text)
print(result)
打印結果為:
1 + 2 = 3
下面是一個用於替換字符串,字典,列表,元祖類型中特定變量的方法。
import re
import json
def parser(origin, *args, delimiter="$", **kwargs): # 支持修改delimiter定界符
patten = r'\{}(?P<var>.+?)'.format(delimiter)
def repl_func(matched): # 自定義re.sub使用的替換方法
var = matched.group('var')
if var.isdigit(): # 如果是數字, 則從args中替換
index = int(var) - 1
if index < len(args):
return args[index]
else:
return "{}{}".format(delimiter, var) # 無替換參數則返回原值
else:
return kwargs.get(var, None) or "{}{}".format(delimiter, var) # 返回kwargs參數中值 or 原值
if isinstance(origin, str):
return re.sub(patten, repl_func, origin, re.M)
elif isinstance(origin, (dict, list)): # 使用json.dumps轉為字符串, 替換,然后重新轉為dict/list
return json.loads(re.sub(patten, repl_func, json.dumps(origin), re.M))
else:
if isinstance(origin, tuple):
return tuple(json.loads(re.sub(patten, repl_func, json.dumps(origin), re.M))) # 轉換后重新轉為tuple
if __name__ == '__main__':
s = ['性別: $2 年齡: $3\n$a', '$1', {"say": "$a"}]
print(parser(s, 'kevin', 'male', '20', a="hello, world!"))