點擊下載
本文文檔

當前位置：首頁 - 科技 - 知識百科 - 正文

ES6中字符串的使用方法擴展

來源：懂視網責編：小采時間：2020-11-27 21:55:35

ES6中字符串的使用方法擴展

ES6中字符串的使用方法擴展:字符的Unicode表示法 JavaScript允許采用\uxxxx形式表示一個字符，其中xxxx表示字符的碼點。 \u0061 // a 但是，這種表示法只限于\u0000——\uFFFF之間的字符。超出這個范圍的字符，必須用兩個雙字節(jié)的形式表達。 \uD842\uDFB7

推薦度：

點擊下載本文 文檔為doc格式

導讀ES6中字符串的使用方法擴展:字符的Unicode表示法 JavaScript允許采用\uxxxx形式表示一個字符，其中xxxx表示字符的碼點。 \u0061 // a 但是，這種表示法只限于\u0000——\uFFFF之間的字符。超出這個范圍的字符，必須用兩個雙字節(jié)的形式表達。 \uD842\uDFB7

字符的Unicode表示法

JavaScript允許采用\uxxxx形式表示一個字符，其中“xxxx”表示字符的碼點。

"\u0061"
// "a"

但是，這種表示法只限于\u0000——\uFFFF之間的字符。超出這個范圍的字符，必須用兩個雙字節(jié)的形式表達。

"\uD842\uDFB7"
// "𠮷"
"\u20BB7"
// " 7"

上面代碼表示，如果直接在\u后面跟上超過0xFFFF的數(shù)值（比如\u20BB7），JavaScript會理解成\u20BB+7。由于\u20BB是一個不可打印字符，所以只會顯示一個空格，后面跟著一個7。

ES6 對這一點做出了改進，只要將碼點放入大括號，就能正確解讀該字符。

下面代碼中，最后一個例子表明，大括號表示法與四字節(jié)的UTF-16編碼是等價的。

"\u{20BB7}"
// "𠮷"
"\u{41}\u{42}\u{43}"
// "ABC"
let hello = 123;
hell\u{6F} // 123
'\u{1F680}' === '\uD83D\uDE80'
// true

有了上述表示法之后，JavaScript共有6種方法可以表示一個字符。

'\z' === 'z' // true
'\172' === 'z' // true
'\x7A' === 'z' // true
'\u007A' === 'z' // true
'\u{7A}' === 'z' // true

codePointAt()

ES6提供了codePointAt方法，能夠正確處理4個字節(jié)儲存的字符，返回一個字符的碼點。

var s = '𠮷a';
s.codePointAt(0) // 134071
s.codePointAt(1) // 57271
s.codePointAt(2) // 97

codePointAt方法的參數(shù)，是字符在字符串中的位置（從0開始）。上面代碼中，JavaScript將“𠮷a”視為三個字符，codePointAt方法在第一個字符上，正確地識別了“𠮷”，返回了它的十進制碼點134071（即十六進制的20BB7）。在第二個字符（即“𠮷”的后兩個字節(jié)）和第三個字符“a”上，codePointAt方法的結果與charCodeAt方法相同。

codePointAt方法返回的是碼點的十進制值，如果想要十六進制的值，可以使用toString方法轉換一下。

var s = '𠮷a';
s.codePointAt(0).toString(16) // "20bb7"
s.codePointAt(2).toString(16) // "61"

實際上codePointAt方法的參數(shù)，仍然是不正確的。上面代碼中，字符a在字符串s的正確位置序號應該是1，但是必須向codePointAt方法傳入2。解決這個問題的一個辦法是使用for...of循環(huán)，因為它會正確識別32位的UTF-16字符。

var s = '𠮷a';
for (let ch of s) {
 console.log(ch.codePointAt(0).toString(16));
}
// 20bb7
// 61

String.fromCodePoint()

ES5提供String.fromCharCode方法，用于從碼點返回對應字符，但是這個方法不能識別32位的UTF-16字符（Unicode編號大于0xFFFF）。

下面代碼中，String.fromCharCode不能識別大于0xFFFF的碼點，所以0x20BB7就發(fā)生了溢出，最高位2被舍棄了，最后返回碼點U+0BB7對應的字符，而不是碼點U+20BB7對應的字符。

String.fromCharCode(0x20BB7)
// "ஷ"

ES6提供了String.fromCodePoint方法，可以識別0xFFFF的字符，彌補了String.fromCharCode方法的不足。在作用上，正好與codePointAt方法相反。

String.fromCodePoint(0x20BB7)
// "𠮷"
String.fromCodePoint(0x78, 0x1f680, 0x79) === 'x\uD83D\uDE80y'
// true

上面代碼中，如果String.fromCodePoint方法有多個參數(shù)，則它們會被合并成一個字符串返回。

注意，fromCodePoint方法定義在String對象上，而codePointAt方法定義在字符串的實例對象上。

字符串的遍歷器接口

ES6為字符串添加了遍歷器接口（詳見《Iterator》一章），使得字符串可以被for...of循環(huán)遍歷。

for (let codePoint of 'foo') {
 console.log(codePoint)
}
// "f"
// "o"
// "o"

at()

目前，ES6有一個提案，提出字符串實例的at方法，可以識別Unicode編號大于0xFFFF的字符，返回正確的字符。

'abc'.at(0) // "a"
'𠮷'.at(0) // "𠮷"

normalize()

許多歐洲語言有語調符號和重音符號。為了表示它們，Unicode提供了兩種方法。一種是直接提供帶重音符號的字符，比如Ǒ（\u01D1）。另一種是提供合成符號（combining character），即原字符與重音符號的合成，兩個字符合成一個字符，比如O（\u004F）和ˇ（\u030C）合成Ǒ（\u004F\u030C）。
這兩種表示方法，在視覺和語義上都等價，但是JavaScript不能識別。

'\u01D1'==='\u004F\u030C' //false
'\u01D1'.length // 1
'\u004F\u030C'.length // 2

上面代碼表示，JavaScript將合成字符視為兩個字符，導致兩種表示方法不相等。

ES6提供字符串實例的normalize()方法，用來將字符的不同表示方法統(tǒng)一為同樣的形式，這稱為Unicode正規(guī)化。

'\u01D1'.normalize() === '\u004F\u030C'.normalize()
// true

normalize方法可以接受一個參數(shù)來指定normalize的方式，參數(shù)的四個可選值如下。

NFC，默認參數(shù)，表示“標準等價合成”（Normalization Form Canonical Composition），返回多個簡單字符的合成字符。所謂“標準等價”指的是視覺和語義上的等價。

NFD，表示“標準等價分解”（Normalization Form Canonical Decomposition），即在標準等價的前提下，返回合成字符分解的多個簡單字符。

NFKC，表示“兼容等價合成”（Normalization Form Compatibility Composition），返回合成字符。所謂“兼容等價”指的是語義上存在等價，但視覺上不等價，比如“囍”和“喜喜”。（這只是用來舉例，normalize方法不能識別中文。）

NFKD，表示“兼容等價分解”（Normalization Form Compatibility Decomposition），即在兼容等價的前提下，返回合成字符分解的多個簡單字符。

下面代碼表示，NFC參數(shù)返回字符的合成形式，NFD參數(shù)返回字符的分解形式。
不過，normalize方法目前不能識別三個或三個以上字符的合成。這種情況下，還是只能使用正則表達式，通過Unicode編號區(qū)間判斷。

'\u004F\u030C'.normalize('NFC').length // 1
'\u004F\u030C'.normalize('NFD').length // 2

includes(), startsWith(), endsWith()

傳統(tǒng)上，JavaScript只有indexOf方法，可以用來確定一個字符串是否包含在另一個字符串中。ES6又提供了三種新方法。

includes()：返回布爾值，表示是否找到了參數(shù)字符串。
startsWith()：返回布爾值，表示參數(shù)字符串是否在源字符串的頭部。
endsWith()：返回布爾值，表示參數(shù)字符串是否在源字符串的尾部。

var s = 'Hello world!';
s.startsWith('Hello') // true
s.endsWith('!') // true
s.includes('o') // true

這三個方法都支持第二個參數(shù)，表示開始搜索的位置。

下面代碼表示，使用第二個參數(shù)n時，endsWith的行為與其他兩個方法有所不同。它針對前n個字符，而其他兩個方法針對從第n個位置直到字符串結束。

var s = 'Hello world!';
s.startsWith('world', 6) // true
s.endsWith('Hello', 5) // true
s.includes('Hello', 6) // false

repeat()

repeat方法返回一個新字符串，表示將原字符串重復n次。

參數(shù)如果是小數(shù)，會被取整。

如果repeat的參數(shù)是負數(shù)或者Infinity，會報錯。

'x'.repeat(3) // "xxx"
'hello'.repeat(2) // "hellohello"
'na'.repeat(0) // ""
'na'.repeat(2.9) // "nana"
'na'.repeat(Infinity)
// RangeError
'na'.repeat(-1)
// RangeError

padStart()，padEnd()

ES7推出了字符串補全長度的功能。如果某個字符串不夠指定長度，會在頭部或尾部補全。padStart用于頭部補全，padEnd用于尾部補全。

'x'.padStart(5, 'ab') // 'ababx'
'x'.padStart(4, 'ab') // 'abax'
'x'.padEnd(5, 'ab') // 'xabab'
'x'.padEnd(4, 'ab') // 'xaba'

上面代碼中，padStart和padEnd一共接受兩個參數(shù)，第一個參數(shù)用來指定字符串的最小長度，第二個參數(shù)是用來補全的字符串。

模板字符串

模板字符串（template string）是增強版的字符串，用反引號（`）標識。它可以當作普通字符串使用，也可以用來定義多行字符串，或者在字符串中嵌入變量。

$('#result').append(`
 There are <b>${basket.count}</b> items
 in your basket, <em>${basket.onSale}</em>
 are on sale!
`);

總結

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯(lián)系，我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

ES6中字符串的使用方法擴展

推薦度：

點擊下載本文 文檔為doc格式

標簽：方法使用方法擴展

熱門焦點

ES6中字符串的使用方法擴展

ES6中字符串的使用方法擴展

ES6中字符串的使用方法擴展

最新推薦

猜你喜歡

熱門推薦