Unicode version 1.1 (June, 1993),定義了現在我們絕大部份所用到的簡繁漢字,即cjk基本區,它的編碼範圍是4E00~9FA5。
擴展A區是unicode version 3.0 (September, 1999),編碼範圍3400~4DB5。
則基本區當時遺留了9FA6~9FFF的空位,擴A後面遺留了4DB6~4DFF的空位。
表格說明unicode擴展史
版本 | 年代 | 擴展 | 補充 |
---|---|---|---|
1.1 | 1993·6 | cjk | |
3.0 | 1999·9 | ext-A | |
3.1 | 2001·3 | ext-B | |
4.0 | 2003·4 | 4DC0~4DFF | |
4.1 | 2005.3 | 9FA6~9FBB | |
5.1 | 2008·3 | 9FBC~9FC3 | |
5.2 | 2009·10 | ext-C | 9FC4~9FCB |
6.0 | 2010·10 | ext-D | |
6.1 | 2012·1 | 9FCC | |
8.0 | 2015·6 | ext-E | 9FCD~9FD5 |
10.0 | 2017·6 | ext-F | 9FD6~9FEA |
11.0 | 2018·6 | 9FEB~9FEF | |
13.0 | 2020·3 | ext-G | 9FF0~9FFC, 4DB6~4DBF |
14.0 | 2021·9 | 9FFD~9FFF | |
15.0 | 2022·9 | ext-H |
評論
由此可見,UNICODE的擴展史,是極為混亂的。同是4字節的字,但是編碼卻不是同一個時期,像雞尾酒一樣,前後二十八年才把坑填平。