Python 字符串格式化


轉載請注明出處

Python2.6+ 增加了str.format函數,用來代替原有的'%'操作符。它使用比'%'更加直觀、靈活。下面詳細介紹一下它的使用方法。

下面是使用'%'的例子:

""
"PI is %f..." % 3.14159 # => 'PI is 3.141590...'
"%d + %d = %d" % (5, 6, 5+6) # => '5 + 6 = 11'
"The usage of %(language)s" % {"language": "python"} # => 'The usage of python'

格式很像C語言的printf是不是?由於'%'是一個操作符,只能在左右兩邊各放一個參數,因此右邊多個值需要用元組或者字典來包括,不能元組字典一起用,缺乏靈活度。
同樣的例子用format方法改寫:

"PI is {0}...".format(3.14159) # => 'PI is 3.14159...'
"{0} + {1} = {2}".format(5, 6, 5+6) # => '5 + 6 = 11'
"The usage of {language}".format(language = "Python") # => 'The usage of Python'

是不是很直觀?(當然,使用C語言的我也很喜歡前一種格式表達方式 😃 )

格式化字符串

"{named} consist of intermingled character {0} and {1}".format("data", "markup", \
    named = "Formats trings")
format(10.0, "7.3g") # => '     10'
"My name is {0} :-{{}}".format('Fred') # => 'My name is Fred :-{}'

注意第一行的'',如果一個語句要換行,必須在結尾加上反斜線轉義。
用'%'無法像這樣將元組和字典混用。其實這里是命名參數,Python的一個特性。可以在定義數組的時候用*args, **kwargs語法展開集合和字典。需要注意,命名參數放在后面。
第二個語句表示format內置函數用來格式化單個值。
第三個語句表示了{}的轉義,因為{}在被格式化字符串里是特殊字符,不能直接顯示。轉義方式是多嵌套一層。

使用屬性和索引

"My name is {0.name}".format(open('out.txt', 'w')) # => 'My name is out.txt'

'{0.name}' 相當於調用對象的屬性 open('out.txt', 'w').name

"My name is {0[name]}".format(dict(name='Fred')) # => 'My name is Fred'

使用索引也是可以的。
obj[key] 相當於 obj.getitem('key')

標准說明符(Specifiers)

寫過C語言的程序員應該清楚printf的復雜。format也定義了很多標准的說明符,用來解釋一個值的格式,然后插入字符串內。例如:

"My name is {0:8}".format('Fred') # => 'My name is Fred    '

':'之后便是說明符了,上面例子中說明符只有一個'8'(minimumwidth),它表示插入的值寬度至少為8。'Fred'只有4,所以又加了4個空格。

說明符的詳細格式為:
[[fill]align][sign][#][0][minimumwidth][.precision][type]
(不比C的printf更簡潔啊!)
注意:'[]'表示該元素可選。所以,所有的格式說明符都是可選的!就像之前的例子,幾乎都沒有用這個(只是為了例子更清晰)。實際上,這些是很有用的。

我們一個個來看:

  • [fill]align 表示排列方式。當minimumwidth設置的比插入的值大時,就有了留白,就像上一個例子中的'My name is Fred '。默認把留白放在了右邊,也就是說插入值默認是左對齊的。如果我們試試{0:>8},會發現結果變成了'My name is Fred'
    fill 表示用來填充留白的字符。只有在align指定了的情況下fill才有用! align可以是下面的標識:
    • < 左對齊,默認
    • > 右對齊
    • = 將留白放在align標識后面,只對數字有效。什么意思呢?align下面會講到,顯示數字的正負號,同樣只對數字有效。如果指定了'=',那么就會把數字的正負號顯示在留白的前面。例如:format(-12, "0=8") # => '-0000012' 注意這里用的是格式化單個值的內置函數format。'0'是fill元素,用它來填充留白;'='就是該標識了;'8'是指最小寬度為8,因此才有5個留白。那么align呢?align其實就是說明正負號的顯示方式,這里使用默認的'-',之后會講到。
    • ^ 居中對齊
  • sign 數字符號,只對數字有效。
    • + 顯示加號和減號
    • - 不顯示加號,顯示減號。在不指定最小寬度的情況下負數總是比正數多占一個符號位置。默認
    • ' ' (一個空格) 用一個留白代替加號
  • # 顯示數字的前綴表示幾進制(0b, 0o, 0x)
  • 0 用'0'填充留白。
  • minimumwidth 指定最小寬度,已經用過很多次了。
  • .precision 'precision'是一個十進制數字,表示顯示小數點后幾位。
  • type 值的類型:
    • 整型:
      • b 二進制
      • c 字符型,把數字轉成表示unicode的字符
      • d 十進制
      • o 八進制
      • x 十六進制,顯示小寫字母
      • X 十六進制,顯示大寫字母
      • nd行為相同,使用本地的數字表示方式
      • ''(空,沒有空格) 與d相同
    • 浮點數
      • e 科學計數法表示,小寫e
      • E 科學計數法表示,大寫E
      • f 顯示為定點數,默認小數點后六位
      • Ff
      • g 自動選擇是否用科學記數法表示
      • Gg
      • ng,使用本地表示方式
      • % 使用百分比表示
      • ''(空) 同g

每個對象可以重寫自己的格式化說明符,例如datatime類重寫了后可以這樣表示:

"Today is: {0:%a %b %d %H:%M:%S %Y}".format(datetime.now())

預先轉換

':'之后是格式說明符,之前還可以加預先轉換的標識

  • !r 調用對象的____repr____方法來轉換成標准字符串
  • !s 調用對象的____str____方法來轉換成字符串

重寫____format____方法

我們在格式化一個字符串時,首先格式化每個值,然后再插入字符串內。格式化值調用的就是format內置方法。format則是簡單地調用該值的____format____方法。

def format(value, format_spec):
    return value.__format__(format_spec)

在object類內實現了____format____方法,只是將本身用str()轉換成字符串,然后將字符串傳入內置的format方法,實際上就是調用轉換為字符串后的____format____方法。

class object:
    def __format__(self, format_spec):
        return format(str(self), format_spec)

int/float/str自身實現了____format____方法,前面已經介紹了它們各自的說明符。

結束語

還有一點兒是自定義Formatter,不過平常也用不到。留作下篇string模塊源碼解讀的內容吧。建議有興趣的朋友多看看Python標准庫的源碼,很有學習價值。

參考:https://www.python.org/dev/peps/pep-3101/


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM