1、codePointAt方法是測試一個字符由兩個字節還是由四個字節組成的最簡單方法。codePointAt方法會正確返回32位的UTF-16字符的碼點。
function is32Bit(c) { return c.codePointAt(0) > 0xFFFF; } is32Bit("𠮷") // true is32Bit("a") // false
2、ES5提供String.fromCharCode方法,用於從碼點返回對應字符,但是這個方法不能識別32位的UTF-16字符(Unicode編號大於0xFFFF)。ES6提供了String.fromCodePoint方法,可以識別0xFFFF的字符,彌補了String.fromCharCode方法的不足。在作用上,正好與codePointAt方法相反。
String.fromCodePoint(0x20BB7) // "𠮷" String.fromCodePoint(0x78, 0x1f680, 0x79) === 'x\uD83D\uDE80y' // true
上面代碼中,如果String.fromCodePoint方法有多個參數,則它們會被合並成一個字符串返回。
注意,fromCodePoint方法定義在String對象上,而codePointAt方法定義在字符串的實例對象上。
3、ES6為字符串添加了遍歷器接口,使得字符串可以被for...of循環遍歷。這個遍歷器最大的優點是可以識別大於0xFFFF的碼點,傳統的for循環無法識別這樣的碼點。
var text = String.fromCodePoint(0x20BB7); for (let i = 0; i < text.length; i++) { console.log(text[i]); } // " " // " " for (let i of text) { console.log(i); } // "𠮷"
上面代碼中,字符串text只有一個字符,但是for循環會認為它包含兩個字符(都不可打印),而for...of循環會正確識別出這一個字符。
4、ES6提供字符串實例的normalize()方法,用來將字符的不同表示方法統一為同樣的形式,這稱為Unicode正規化。
5、傳統上,JavaScript只有indexOf方法,可以用來確定一個字符串是否包含在另一個字符串中。ES6又提供了三種新方法。
- includes():返回布爾值,表示是否找到了參數字符串。
- startsWith():返回布爾值,表示參數字符串是否在源字符串的頭部。
- endsWith():返回布爾值,表示參數字符串是否在源字符串的尾部。
6、repeat方法返回一個新字符串,表示將原字符串重復n次。如果repeat的參數是負數或者Infinity,會報錯。
7、ES2017 引入了字符串補全長度的功能。如果某個字符串不夠指定長度,會在頭部或尾部補全。padStart()用於頭部補全,padEnd()用於尾部補全。padStart的常見用途是為數值補全指定位數。下面代碼生成10位的數值字符串。
'1'.padStart(10, '0') // "0000000001" '12'.padStart(10, '0') // "0000000012" '123456'.padStart(10, '0') // "0000123456"
另一個用途是提示字符串格式。
'12'.padStart(10, 'YYYY-MM-DD') // "YYYY-MM-12" '09-12'.padStart(10, 'YYYY-MM-DD') // "YYYY-09-12"
8、模板字符串(template string)是增強版的字符串,用反引號(`)標識。它可以當作普通字符串使用,也可以用來定義多行字符串,或者在字符串中嵌入變量。
// 字符串中嵌入變量 var name = "Bob", time = "today"; `Hello ${name}, how are you ${time}?`
如果使用模板字符串表示多行字符串,所有的空格和縮進都會被保留在輸出之中。
