re的split用法


import re

line = "word; Word; temp"

"""
单一分隔符,str.split()与 re.split()作用一致
"""
print line.split(";")
# ['word', 'Word', 'temp']
print re.split(r"; ", line)
# ['word', 'Word', 'temp']

"""
多个单一 分隔符 时 ,"[]"与 "|"的 效果是一样的,但是 请注意 使用 “|”时 mouxie某些字符 需要转义
"""

line1 = "word;Word,emp?hahaha"
print re.split(r";|,|\?", line1) #别忘了转义"?"
# ['word', 'Word', 'emp', 'hahaha']
print re.split(r"[;,?]", line1)
# ['word', 'Word', 'emp', 'hahaha']
## 当 空格 出现 时

"""
多个 长短 不一 的的分隔符的分隔符时, 就应该使用 "|"
"""
line2 = "word;Word,emp? hahaha; whole, cai"
print re.split(r";|,|\?\s|;\s|,\s", line2)
# ['word', 'Word', 'emp', 'hahaha', ' whole', ' cai']

## 以上 只是 为了 说明这些的吗的适用情况 ,还有 更加渐变简便 的 用法 是
print re.split(r"\W+", line)
print re.split(r"\W+", line1)
print re.split(r"\W+", line2)

"""
适用 “()”则是 将 分隔 后的 结果 连同分隔符均 有所 保留
"""
print re.split(r"(\W+)", line2)
# ['word', ';', 'Word', ',', 'emp', '? ', 'hahaha', '; ', 'whole', ', ', 'cai']
# 注意: 连 空格 都 保留了

"""
在 正则中 具有 含义 的 符号 也将 作为 分隔符 的 通用 解决 办法 ,请不要 在 尝试 要有 多少个 ‘\’
"""

delimiters = "a", "...", "(C)"
regexPattern = '|'.join(map(re.escape, delimiters)) # 'a|\\.\\.\\.|\\(C\\)'
line = "stackoverflow (C) is awesome... isn't it?"
print re.split(regexPattern,line) # ['st', 'ckoverflow ', ' is ', 'wesome', " isn't it?"]

"""
一些 更 复杂 的 就 需要 你对 正则 表达式 的更 深入 的 了解了
以下是 stackoverflow的 关于 re.split的 问题
"""
##split a string like "HELLO there HOW are YOU" by uppercase, thus the result is ['HELLO there', 'HOW are', 'YOU']
line1 = "HELLO there HOW are YOU"
re.split(r"\s+(?=[A-Z]+)", line1) # 后向匹配

# i want to split “400-IF(3>5,5,5)+34+IF(4>5,5,6)” by string 'IF(3>5,5,5)', so re.split() should give list with length: 2 ['400-', '+34+']
line2 = “400-IF(3>5,5,5)+34+IF(4>5,5,6)”
' '.join(re.split(r'IF\(.*?\)',z)).split() # 贪婪模式


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM