如果把倉頡的五碼改成四碼之後,重碼不會增加太多,那我就立即改用四碼倉頡。
秉持著這個思路,我開始了本次小實驗。
首先統計了尹倉目前的不定長分布:
- 33
- 550
- 2865
- 10665
- 6789
那麼本次實驗,就是要把碼長為五的6789個字中,去掉它的第四碼(也就是字身也只取兩碼)。之後來看看它到底會增加多少重碼。
為了把之前已有的重碼排除掉,則先統計原有的重碼:
碼長為四的重碼數量統計 | 碼長為五的重碼數量統計 | 退五為四,與四合併之後的重碼數量統計 |
|
|
|
排除原有重碼之後,新增1228組重碼。重碼統計結果文本:multiple_ejcin_20230916i5-4
結論
當去掉碼長為五的第四碼之後,諸如「料粹、謗訪」等常用字都會成為重碼。倉頡將退化為比五筆、鄭碼更難用的「四碼形碼」。
原本倉頡(尹倉)是基本無重的,配上尹末去重則是絕對無重。改五為四會增加大量的重碼,因此我仍然打算繼續使用原版倉頡。
實際上,碼長為五仍然是一個合理的碼長。同時,倉頡是不定長,並不是每一個字的碼長都是五。平均下來,大概是3.2左右。因此倉頡的碼長其實是不長的。
發明研製一個形碼輸入法,並不是一件簡單輕鬆的事。任何改變原版取碼規則的做法,一定會帶來諸多問題。
歡迎下載
文檔名 | |
大小 | |