維基倉教第五章「取碼原則」中的「字形特徵原則」的分則一是「區塊分則」,它的原文是:
取碼時,優先以「區塊」的方式,在字根的相接處分割,避免字根互相跨越。
維基倉教只要是講不清楚的概念,就會用引號括起来。比如他們講不清何為「區塊」,就直接把「區塊」包入引號之後扔出来,結果讀者根本搞不懂甚麼是「區塊」。
在圖示中,他們似乎想表達的是,只要能畫進一個橢圓圈圈內,它就是一個「區塊」。
問題是,我們如何知道這個圈圈到底要畫多大?
結果他們就在「缶」字上出現了問題:
那為何不把圈圈畫成:
還有更多的字例,如「㔾」為何不圈成覆匡覆匡仰鉤仰鉤?「千」為何不圈成側人側人十十?例子不勝枚舉。
曾經,「區塊分則」還摻夾著「剪刀原則」(見本站文章:💣維基倉教💨剪刀原則鬧劇始末),雖然剪刀原則因為過於荒唐而下架,但是至今它的「思想」還殘留在上面。比如「向」字的一撇也是一個區塊,它可能是通過「剪刀原則」剪下来的。
如果一撇也是一個「區塊」,那還有甚麼不是「區塊」?倉頡無處不區塊,連體字不如叫作「區塊鏈」。
完整原則講的是連體字的取碼,想不到區塊分則還能用在分體字!請看以下圖例:
連中間的「口」也是因為「區塊分則」才取到的?對此他們說:
有些字根會埋在其他字根的凹陷位置,如「喪」字在「土」的凹陷處有「口」;「巫」字在「工」的凹陷處有「人」;「业」字在「並立」的凹陷處有「」字根;甚至像「匚」、「冂」、「凵」這類外框更專門在內部收藏其他字根。由於「土」、「工」、「並立」等形狀並未與其他字根互相跨越,因而也都符合區塊分則。
……我想請問,它們不是已經分離了嗎?我們只要按正常順序取碼即可,還有何必要去用甚麼區塊分則?
ceku是「區塊分則」的始作俑者,按他的敍述,「區塊」很可能指的是「交叉特徵」,也就是「丈」横截為「十乂」,「聿」横截為「肀奉下」。
「乂」當初不分割可能是為了保留「交叉」的字形特徵,及按區塊原則避免字根互相跨越。
無論是所謂的區塊原則或剪刀原則,它們的意思都只是「優先選擇字根不互相交錯的取碼方式」,並沒有所謂橫向剪開比較優先之類的意思。
然而,「保留交叉字形特徵」只是横截的其中一個情況,無法解釋所有的横截情況。結果ceku産生了以下疑問:
何以「𢦏」取「十戈」而非按先繁後簡原則取「土戈」?——一說是引入「優先選取不截斷筆畫的取碼方式」的規則,但此說未見於官方手冊,且難以解釋何以「巳」不取「尸山」而取「口山」。
這樣一来,對於「段叚官巳」等字,既無法用「區塊分則」来解釋,連ceku自己也不知道作何解釋了!
最終,ceku因為「區塊分則」過於模糊不清,無法解釋所有横截現象,他說:
整體來說,倉頡輸入法有個頗大的先天問題是它其實就是「先射箭再畫靶」,所有取碼規則可說都是為了把常用部件的取碼平均分配而歸納(或說硬湊?)出來的,因此往往為了平均和降低重碼的需求調整既有規則,但調整東就忽略了西,導致很多內在矛盾,五代後期和六代的許多新規則尤其明顯……。
是你自己的「區塊分則」沒有寫好,怎麼能說是倉頡原版官方規則的問題?
總結
- 「區塊」概念模糊不清,人們不知道這個圈圈到底要畫多大才算是一個「區塊」。
- 它是ceku的原創理論,然而連ceku自己也存在很多疑慮。
- ichirou跟cj6還試圖摻入「剪刀原則」,最終由於ceku的反對而下架。
- 如果「區塊」指的是「保留交叉字形特徵」,它就沒有包含所有的横截情況,因此無法用来解釋「段叚官巳」的取碼。
1 thought on “【吐槽維基倉教】何為區塊?”