findall 函數:
在字符串中找到正則表達式所匹配的所有子串,並返回一個列表,如果沒有找到匹配的,則返回空列表。
注意: match 和 search 是匹配一次 findall 匹配所有,match 和 search 的區別也很大,可以自行網上查找!
這里主要需要討論的是其返回值的展現方式,即findall函數根據正則表達式的不同所返回的結果包含的不同信息!
主要包含三種情況:
1.當給出的正則表達式中帶有多個括號時,列表的元素為多個字符串組成的tuple,tuple中字符串個數與括號對數相同,字符串內容與每個括號內的正則表達式相對應,並且排放順序是按括號出現的順序。
例子,正則表達式里分了兩個組
import re
test = '2018年的下半年,9月份, 27日'
pattern = re.compile(r'(\d)+(年|月|日)')
res = pattern.findall(test)
print(res)
# 輸出結果: [('8', '年'), ('9', '月'), ('7', '日')]
2.當給出的正則表達式中帶有一個括號時,列表的元素為字符串,此字符串的內容與括號中的正則表達式相對應(不是整個正則表達式的匹配內容)。
例子,正則表達式里有一個分組
'''
學習中遇到問題沒人解答?小編創建了一個Python學習交流群:531509025
尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學習教程和PDF電子書!
'''
import re
test = '2018年的下半年,9月份, 27日'
pattern = re.compile(r'\d+(年|月|日)')
res = pattern.findall(test)
print(res)
# 輸出結果: ['年', '月', '日']
3.當給出的正則表達式中不帶括號時,列表的元素為字符串,此字符串為整個正則表達式匹配的內容。
例子,正則表達式里沒有分組
import re
test = '2018年的下半年,9月份, 27日'
pattern = re.compile(r'\d{4}年|\d{1}月|\d{2}日')
res = pattern.findall(test)
print(res)
# 輸出結果: ['2018年', '9月', '27日']
4.同樣是前面的 test 數據,要匹配出和3中同樣的結果,可以這樣寫。
例子,輸出和3中同樣的結果
import re
test = '2018年的下半年,9月份, 27日'
pattern = re.compile(r'\d{1,4}(?:年|月|日)')
res = pattern.findall(test)
print(res)
# 輸出結果: ['2018年', '9月', '27日']
此例子中的 (?:年|月|日) 不表示一個分組