基本漢字補充區探秘

Unicode version 1.1 (June, 1993),定義了現在我們絕大部份所用到的簡繁漢字,即cjk基本區,它的編碼範圍是4E00~9FA5。

擴展A區是unicode version 3.0 (September, 1999),編碼範圍3400~4DB5。

則基本區當時遺留了9FA6~9FFF的空位,擴A後面遺留了4DB6~4DFF的空位。

表格說明unicode擴展史

版本 年代 擴展 補充
1.1 1993·6 cjk
3.0 1999·9 ext-A
3.1 2001·3 ext-B
4.0 2003·4 4DC0~4DFF
4.1 2005.3 9FA6~9FBB
5.1 2008·3 9FBC~9FC3
5.2 2009·10 ext-C 9FC4~9FCB
6.0 2010·10 ext-D
6.1 2012·1 9FCC
8.0 2015·6 ext-E 9FCD~9FD5
10.0 2017·6 ext-F 9FD6~9FEA
11.0 2018·6 9FEB~9FEF
13.0 2020·3 ext-G 9FF0~9FFC, 4DB6~4DBF
14.0 2021·9 9FFD~9FFF
15.0 2022·9 ext-H

評論

由此可見,UNICODE的擴展史,是極為混亂的。同是4字節的字,但是編碼卻不是同一個時期,像雞尾酒一樣,前後二十八年才把坑填平。

Leave a Comment