findall 函數:
在字符串中找到正則表達式所匹配的所有子串,並返回一個列表,如果沒有找到匹配的,則返回空列表。
注意: match 和 search 是匹配一次 findall 匹配所有,match 和 search 的區別也很大,可以自行網上查找!
這里主要需要討論的是其返回值的展現方式,即findall函數根據正則表達式的不同所返回的結果包含的不同信息!
主要包含三種情況:
1. 當給出的正則表達式中帶有多個括號時,列表的元素為多個字符串組成的tuple,tuple中字符串個數與括號對數相同,字符串內容與每個括號內的正則表達式相對應,並且排放順序是按括號出現的順序。
1 # 例子,正則表達式里分了兩個組 2 3 import re 4 5 test = '2018年的下半年,9月份, 27日' 6 pattern = re.compile(r'(\d)+(年|月|日)') 7 res = pattern.findall(test) 8 print(res) 9 10 # 輸出結果: [('8', '年'), ('9', '月'), ('7', '日')]
2. 當給出的正則表達式中帶有一個括號時,列表的元素為字符串,此字符串的內容與括號中的正則表達式相對應(不是整個正則表達式的匹配內容)。
1 # 例子,正則表達式里有一個分組 2 3 import re 4 5 test = '2018年的下半年,9月份, 27日' 6 pattern = re.compile(r'\d+(年|月|日)') 7 res = pattern.findall(test) 8 print(res) 9 10 # 輸出結果: ['年', '月', '日']
3. 當給出的正則表達式中不帶括號時,列表的元素為字符串,此字符串為整個正則表達式匹配的內容。
1 # 例子,正則表達式里沒有分組 2 3 import re 4 5 test = '2018年的下半年,9月份, 27日' 6 pattern = re.compile(r'\d{4}年|\d{1}月|\d{2}日') 7 res = pattern.findall(test) 8 print(res) 9 10 # 輸出結果: ['2018年', '9月', '27日']
4. 同樣是前面的 test 數據,要匹配出和3中同樣的結果,可以這樣寫。
1 # 例子,輸出和3中同樣的結果 2 3 import re 4 5 test = '2018年的下半年,9月份, 27日' 6 pattern = re.compile(r'\d{1,4}(?:年|月|日)') 7 res = pattern.findall(test) 8 print(res) 9 10 # 輸出結果: ['2018年', '9月', '27日']
此例子中的 (?:年|月|日) 不表示一個分組,有一個博客網址可以了解一下正則知識。雖然還是python2版本的,但是應該也沒有什么太大的變化!
https://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html
