今天運營的同學反映有一些店鋪的名稱后面帶空格,我下意識的說不可能啊,我已經處理過了啊。然后就找出來看。
其中有個店鋪的名稱是“安踏 ”,第一眼看上去好像是帶了個空格。然后我就仔細的看了下。
1 pry(main)> "安踏 ".strip 2 => "安踏 "
竟然沒有變化。
1 pry(main)> "安踏 "[-1] == " " 2 => false
怪不得,原來不是一個空格。
到底是什么呢? 對,查一下ascii碼
1 pry(main)> " ".bytes 2 => [32]
空格的ascii 是32
1 pry(main)> "安踏 "[-1].bytes 2 => [194, 160]
這個竟然是194,160. 原來如此。
原因是字符串中的一個空格(ASCII:32)被UTF-8編碼之后變成了字符(ASCII:194 和 160的組合)。在 UTF-8編碼里面存在一個特殊的字符,其編碼是“0xC2 0xA0”,轉換成字符的時候表現為一個半角空格,跟一般的半角空格(ASCII 0x20)不同的是它的寬度不會被壓縮,所以排版中常能用到它。但是GB2312、Unicode之類並沒有這樣的字符,所以轉換后前台會顯示為“?” 號,只是顯示為問號而不是真正的問號,所以無法被替換。
解決方法是:
1 Shop.each do |shop| 2 if shop.name.include?(" ") 3 shop.name = shop.name.split(" ")[0] 4 shop.save 5 end 6 end
