Python筆記:pandas之字符串操作方法


字符串操作

字符串對象方法

#python內置的字符串函數
str.split()             #根據指定的字符分隔字符串,返回一組分隔后列表
srt.strip()             #去除空白符(包括換行符)
'-'.join(list)          #將列表或元組里的字符串用‘-’拼接起來。
'a' in str              #判斷字符串中是否包含'a'
str.index(',')          #返回字符串所在的位置,如果找不到拋出異常
str.find(',')           #返回字符串第一次出現的位置,如果找不到返回-1
str.rfind(',')          #返回字符串最后一次出現的位置,如果找不到返回-1
str.count(',')          #返加子串出現的次數
str.replace(',','')     #將字符串中的','去除,如果第二個參數是指定的字符,則該函數變成替換模式

正則表達式

#正則表達式提供了一種靈活的在文本中搜索或匹配(通常比前者復雜)字符串模式的方式
#正則表達式,常稱作regex,是根據正則表達式語言編寫的字符串
#Python內置的re模塊負責對字符串應用正則表達式
#re模塊的函數可以分為三個大類:模式匹配、替換以及拆分。

import re

#'\s+',描述一個或多個空白符
#調用re.split('\s+',text)時,正則表達式會先被編譯,然后再在text上調用其split方法
#可以用re.compile自己編譯regex以得到一個可重用的regex對象
#如果打算對許多字符串應用同一條正則表達式,強烈建議通過re.compile創建regex對象,這樣將可以節省大量的cpu時間
re.split('\s+', text)

regex = re.compile('\s+')

regex.split(text)
regex.findall(text)     #找到所有匹配正則表達式的文本,返回一個列表
regex.search(text)      #返回文本中第一個匹配正則表達式的文本的起始和結束位置
regex.match(text)       #只匹配在字符串開頭的文本
regex.sub(',',text)     #將匹配到的文本替換為','

#如果不僅想找出文本,還想將文本分成多個部分,只需將待分段的模式的各部分用圓括號包起來即可

pattern = r'([A-Z0-9._%+-]+)@([A-Z0-9.-]+)\.([A-Z]{2,4})'
regex = re.compile(pattern)
m = regex.match('wesm@bright.net')
m.groups()
('wesm','bright','net')


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM