閱讀(5.7k) 書簽贊(0) 我要糾錯

Unicode 格式控制字符

2018-06-16 14:14 更新

Unicode 格式控制字符（即，Unicode 字符數據庫中“Cf”分類里的字符，如“左至右符號 (left-to-right mark)”或“右至左符號 (left-to-right mark)”）是用來控制被更高層級協(xié)議（如標記語言）忽略的文本范圍的格式的控制代碼。

允許在源文本中出現控制字符是有用的，以方便編輯和顯示。所有格式控制字符可寫入到注釋，字符串字面量，正則表達式字面量中。

在某些語言中和控制字符用于創(chuàng)建必要的的分隔符分割詞或短語。在 ECMAScript 源文本里，和還可以用在一個標識符后的第一個字符。

控制字符主要出現的文本的開頭，標記它是 Unicode，并允許檢測文本的編碼和字節(jié)順序。用于這一目的字符，有時也可能出現在文本開始的后面，例如，一個合并的文件。字符被視為空白字符（見 [7.2]）。

表 1 總結了一些在注釋，字符串字面量，正則表達式字面量之外被特殊對待的格式控制字符。

表-——控制字符的使用

字符編碼值	名稱	正式名稱	用途
\u200C	零寬非連接符	<ZWNJ>	IdentifierPart
\u200D	零寬連接符	<ZWJ>	IdentifierPart
\uFEFF	位序掩碼	<BOM>	Whitespace

以上內容是否對您有幫助：

寫筆記

我要補充