網上翻了很多文章。。。居然沒有一個有用的。。倒是找到一篇java的,但java的正則表達式和python的還有點不同。
那篇java的文章是用"[keywd1]|[keywod2]|[keywd3]"的模式來匹配,這個在py中就不行了,[]會匹配[]中的任何一個分字。
在python中的應該是"keywd1|keywd2|keywd3"就行了。
然后我個人是喜歡直接使用re.findall() 這樣一個參數是要匹配的字符模式,另一個就是要匹配的文本。比較方便,可以不用管那些search,march,啥的。
再一個就是備注一下正則表達式匹配的參數先后順序:re.findall(pattern, string[, flags]) # [, flags]為可選參數,從第幾個字符開始匹配。
另:關於正則表達式可以通過下面這篇文章詳細介紹:
https://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html