1、codePointAt
方法是測試一個字符由兩個字節還是由四個字節組成的最簡單方法。codePointAt
方法會正確返回32位的UTF-16字符的碼點。
function is32Bit(c) { return c.codePointAt(0) > 0xFFFF; } is32Bit("𠮷") // true is32Bit("a") // false
2、ES5提供String.fromCharCode
方法,用於從碼點返回對應字符,但是這個方法不能識別32位的UTF-16字符(Unicode編號大於0xFFFF
)。ES6提供了String.fromCodePoint
方法,可以識別0xFFFF
的字符,彌補了String.fromCharCode
方法的不足。在作用上,正好與codePointAt
方法相反。
String.fromCodePoint(0x20BB7) // "𠮷" String.fromCodePoint(0x78, 0x1f680, 0x79) === 'x\uD83D\uDE80y' // true
上面代碼中,如果String.fromCodePoint
方法有多個參數,則它們會被合並成一個字符串返回。
注意,fromCodePoint
方法定義在String
對象上,而codePointAt
方法定義在字符串的實例對象上。
3、ES6為字符串添加了遍歷器接口,使得字符串可以被for...of
循環遍歷。這個遍歷器最大的優點是可以識別大於0xFFFF
的碼點,傳統的for
循環無法識別這樣的碼點。
var text = String.fromCodePoint(0x20BB7); for (let i = 0; i < text.length; i++) { console.log(text[i]); } // " " // " " for (let i of text) { console.log(i); } // "𠮷"
上面代碼中,字符串text
只有一個字符,但是for
循環會認為它包含兩個字符(都不可打印),而for...of
循環會正確識別出這一個字符。
4、ES6提供字符串實例的normalize()
方法,用來將字符的不同表示方法統一為同樣的形式,這稱為Unicode正規化。
5、傳統上,JavaScript只有indexOf
方法,可以用來確定一個字符串是否包含在另一個字符串中。ES6又提供了三種新方法。
- includes():返回布爾值,表示是否找到了參數字符串。
- startsWith():返回布爾值,表示參數字符串是否在源字符串的頭部。
- endsWith():返回布爾值,表示參數字符串是否在源字符串的尾部。
6、repeat
方法返回一個新字符串,表示將原字符串重復n
次。如果repeat
的參數是負數或者Infinity
,會報錯。
7、ES2017 引入了字符串補全長度的功能。如果某個字符串不夠指定長度,會在頭部或尾部補全。padStart()
用於頭部補全,padEnd()
用於尾部補全。padStart
的常見用途是為數值補全指定位數。下面代碼生成10位的數值字符串。
'1'.padStart(10, '0') // "0000000001" '12'.padStart(10, '0') // "0000000012" '123456'.padStart(10, '0') // "0000123456"
另一個用途是提示字符串格式。
'12'.padStart(10, 'YYYY-MM-DD') // "YYYY-MM-12" '09-12'.padStart(10, 'YYYY-MM-DD') // "YYYY-09-12"
8、模板字符串(template string)是增強版的字符串,用反引號(`)標識。它可以當作普通字符串使用,也可以用來定義多行字符串,或者在字符串中嵌入變量。
// 字符串中嵌入變量 var name = "Bob", time = "today"; `Hello ${name}, how are you ${time}?`
如果使用模板字符串表示多行字符串,所有的空格和縮進都會被保留在輸出之中。