Unicode 格式控制字符

2018-06-16 14:14 更新

Unicode 格式控制字符(即,Unicode 字符數據庫中“Cf”分類里的字符,如“左至右符號 (left-to-right mark)”或“右至左符號 (left-to-right mark)”)是用來控制被更高層級協(xié)議(如標記語言)忽略的文本范圍的格式的控制代碼。


允許在源文本中出現控制字符是有用的,以方便編輯和顯示。所有格式控制字符可寫入到注釋,字符串字面量,正則表達式字面量中。


在某些語言中和控制字符用于創(chuàng)建必要的的分隔符分割詞或短語。在 ECMAScript 源文本里,和還可以用在一個標識符后的第一個字符。


控制字符主要出現的文本的開頭,標記它是 Unicode,并允許檢測文本的編碼和字節(jié)順序。用于這一目的字符,有時也可能出現在文本開始的后面,例如,一個合并的文件。字符被視為空白字符(見 [7.2])。


表 1 總結了一些在注釋,字符串字面量,正則表達式字面量之外被特殊對待的格式控制字符。


表-——控制字符的使用
字符編碼值名稱正式名稱用途
\u200C零寬非連接符<ZWNJ>IdentifierPart
\u200D零寬連接符<ZWJ>IdentifierPart
\uFEFF位序掩碼<BOM>Whitespace


以上內容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號