【小實驗】四碼倉頡到底會增加多少重碼

如果把倉頡的五碼改成四碼之後,重碼不會增加太多,那我就立即改用四碼倉頡。

秉持著這個思路,我開始了本次小實驗。

首先統計了尹倉目前的不定長分布

  1. 33
  2. 550
  3. 2865
  4. 10665
  5. 6789

那麼本次實驗,就是要把碼長為五的6789個字中,去掉它的第四碼(也就是字身也只取兩碼)。之後來看看它到底會增加多少重碼。

為了把之前已有的重碼排除掉,則先統計原有的重碼:

碼長為四的重碼數量統計 碼長為五的重碼數量統計 退五為四,與四合併之後的重碼數量統計
  • 2:606
  • 3:30
  • 4:10
  • 5:1
  • 2:220
  • 3:23
  • 4:7
  • 5:0
  • 6:1
  • 2:1646
  • 3:272
  • 4:76
  • 5:19
  • 6:3
  • 7:2
  • 8:1

 

排除原有重碼之後,新增1228組重碼。重碼統計結果文本:multiple_ejcin_20230916i5-4

結論

當去掉碼長為五的第四碼之後,諸如「料粹、謗訪」等常用字都會成為重碼。倉頡將退化為比五筆、鄭碼更難用的「四碼形碼」。

原本倉頡(尹倉)是基本無重的,配上尹末去重則是絕對無重。改五為四會增加大量的重碼,因此我仍然打算繼續使用原版倉頡。

實際上,碼長為五仍然是一個合理的碼長。同時,倉頡是不定長,並不是每一個字的碼長都是五。平均下來,大概是3.2左右。因此倉頡的碼長其實是不長的。

發明研製一個形碼輸入法,並不是一件簡單輕鬆的事。任何改變原版取碼規則的做法,一定會帶來諸多問題。

歡迎下載

文檔名
大小

Leave a Comment