葦手入力法解


打鍵取得法

 葦手入力の打鍵は、字形を機械的に分析することで、一意に打鍵が定まることを指向した。漢字の種類は膨大であるから、例外が多いと、字形から自由に文字を打てなくなる。完全に規則に従わせることで、あらゆる漢字が、初めて目にする字でも入力できるようになる。全ての漢字が、この規則に従って分析され、打鍵が導き出される。

結構

 それぞれの文字に与えられる打鍵は最長五字母で、その打鍵字母は、文字を規則的に分析し、特定の位置にある字素を抽出して字母に置き換えることで決定される。抽出する字素の位置は、その文字の結構によって決定される。文字の結構は、文字を二分したときの組み合わさり方で決定する。規定された結構の種類は次の通り。

並び    - 左右結構地:-土,也超:-走,召
重なり/上下結構宇:/宀,于懲:/徵,心
覆ひ^全包囲上左右包囲
上左下包囲上右包囲
國:^囗,或閏:^門,王匣:^匚,甲戒:^戈,廾
被さり~上左包囲病:~疒,丙釐:~𠩺,里魔:~麻,鬼
掬い_左下包囲左右下包囲進:_隹,辵1幽:_𢆶,山臿:_干,臼
横挟みb横挟み衢:b行,瞿
縦挟み
(同「重なり」)
c上下結構褒:c衣,保
添ひ.添い犬:.大0,丶0刅:.刃,一1米:.丷0,木0
割り"割り夾:"大,|人,人東:"木,日繭:/艸1,"巾0,-糸,虫
交わり+交わり1交わり2內:+冂,入牽:/+玄,冖0,牛
接合&接合&亠0,DPH亦:&亠0,"SPSG,八0戉:&戈,𠄌

分析手順

打鍵は全て視覚上の字形を規則的に分析することで得られる。

分析規則

  1. 文字の字素への分析は、文字の形を二分することを重ねていくことで、成立する。
  2. 文字の二分する箇所は、より前方(より上側・より左側・より外側)に位置する、より分かれた箇所(次項参照)から二分する。
    【鴻:(氵)(工鳥)】→シエイツ
    【喜:(士)( (口)(サ口) )】→セロサロ
    【喜:(士)( (口)(サ加) )】→セロサロ
    【率:(玄エ)(十)】→ユエキ
    【磨:(广)(林石)】→ラホホロ
    【乃:(ラ)(丿)】→ラノ
  3. 交叉する点画偏旁どうしよりも、接合する点画偏旁どうしを先に分ち、接合する点画偏旁どうしよりも、離れた点画偏旁どうしを先に分つ。
    【再:(一)(冉)】→ヘワセ
    【更:(一)(曰乂)】→ヘヨメ
    【吏:(ナ囗)(乀)】→ナコヘ
    【拝:(扌)( (一)(三丨) )】→オヘミシ
    【兼:(サ)( (ヨ刂)(八) )】→サヨリハ
  4. 前方から括っていって字素に一致するものがあればひとまとめとする。
    【丙:(一人)(冂)】(一人:ス)→スワ
    【合:(亼)(口)】(亼:ケ)→ケロ
    【浅:(氵)(三セ)】(三:ミ)→シミセ
  5. 偏旁につく肩の点は無視する。
    【戈:(オ)(丶)】→オン(「戈」単字) 【戒:(オ)(廾)】→オサ(「戈」偏旁)
    【犬:(大)(丶)】→スン(「犬」単字) 【伏:(亻)(大)】→イス(「犬」偏旁)
    【甫:(十月)(丶)】→キタン(「甫」単字) 【浦:(氵)(十月)】→シキタ(「甫」偏旁)
  6. 三畳字は、切断可能な部分に関わらず各要素を一括りとして分析する。
    【馫:(香)(香香)】→ノヨノヨヨ……(禾)(日香香)とはしない。
  7. 打鍵分別の都合上、形が他の字と類似する為に打鍵を特別に設定する字や、単字と偏旁とで打鍵の異なる字は個別に規定する。(別掲:「特殊分析字」)
  8. 被さり結構の垂れ偏旁は、表示字形に関わらず偏旁個別に分析方法を規定する。(別掲:「結構固定偏旁」)
  9. 横挟み結構の横挟む偏旁は、表示字形に関わらず偏旁個別に規定する。(別掲:「横挟み偏旁」)

分別打鍵

 同打鍵に異なる字が重複して当たっている場合、それぞれの打鍵の末に固有の符号(分別子)を加えることで一意に入力することができる。分別子は「ァ・ィ・ゥ・ェ・ォ・ャ・ュ・ョ」とし、JIS第一水準・第二水準字表順、CJK統合漢字表順の次第で、「ァ」から順に割り振られる。

京:ユロツァ 訓:ユロツィ
嘉:セロサロァ 喜:セロサロィ
仕:イセァ 代:イセィ 仓:イセゥ 坓:イセェ
全:イモァ 任:イモィ 仛:イモゥ 仺:イモェ 仼:イモォ

特殊分析字

 基本的な文字で、互いに形が酷似して、通常の分析では打鍵の分別ができないものについては、原則を大きく外れない限りで、特別な分析方法を個別に適用する。文字によつて、単字と偏旁とで分析方法が異なるものと同じものとがある。

 なお、分析規則第五条にある通り、「尤」「弋」「戈」「朮」「求」「犬」「犮」「甫」といった肩に点のある来る字は、単字の時は点を含み、偏旁にあるときは点を無視する。

単字と偏旁同じもの

キイ【+HHS,人0】
ヘホ【+一,木】
コキ【^囗,十】
ワセ【+SHZ,土】
ワキ【+SHZ,HHS】
ヨシ【+曰0,丨0】
イヨヘツ
【&&&PS,HZHH,一,^HZG,灬00】
イコヘツ
【&&&PS,HZH1,一,^HZG,灬0】

単字と偏旁とで異なるもの(普通の文字)

単字偏旁
ヘノ【&一0,亅0】
ヘレ【+一0,㇄0】
ヘナ【&一0,HSG】
ニリ【+二0,SPS】
ノヘ【&丿0,乀0】
フノ【&HZG,丿0】
キヘ【&十0,一0】
チヘ【&千0,一0】
ノハ【"亅0,八】
コノ【&HZH1,丿0】
シコ【_丨0,凵0】
ノシシ【-SP,-丨0,丨0】
フヘレ【&HZ,&一0,乚0】コレ
フヒ【&HZ,匕0】コレ
ワシ【+冂,丨】
廿サヘ【&卄0,一0】
コヘ【^口1,一0】
ワニ【^SPHZG,二0】
テヘ【&干0,一0】

単字と偏旁とで異なるもの(偏旁等)

丄(シヘ:ユ) 丅(ヘシ:マ) 丆(ヘノ:フ) 丌(ヘリ:サ) 丩(シレ:ヲ) 个(イシ:ケ) 丫(ソシ:ア) 丬(シン:ヲ) 乇(ノセ:モ) 冂(シフ:ワ) 凵(レシ:コ) 匚(ヘレ:ヒ) 匸(ヘレ:ヒ) 卩(フシ:ア) 厂(ヘノ:フ) 屮(コノ:ヲ) 巛(レレレ:ツ) 广(ユノ:ラ) 彡(ノノノ:ミ) 朩(ナハ:ホ) 艹(キキ:サ)

結構固定偏旁

 「麻」「辰」などに従い、この下に偏旁がくる字などは、同じ字でも垂れの長さがフォントによって異なるために、上下結構に見えたり、外内結構に見えたりと字形解釈に揺れが生じる。よって、予めこれらの偏旁に従う字の結構を規定しおいて、打鍵時の混乱を解消する。

(被さり)【~厭,■】=【~厂,/猒,■】
鹿(被さり)【~鹿,■】=【~广,/コリ,/比,■】
(被さり)【~麻,■】=【~广,/林,■ 】
(重なり)【/辰,■】

横挟み偏旁

 左右で中を挟む形となる横挟み結構を構成する特定の偏旁を、横挟み偏旁とする。横挟み偏旁は、左右対称形のものを基本とする。また、分別の都合上、左右対称でないが左右が強く結びついたものでも横挟み結構偏旁とするものがある。
 横挟み偏旁に従う字は、中の偏旁の方が文字の分別に関わるものであるから、並び結構の連続として分析すると、打鍵の分別が困難になる。たとえば、もし並び結構とすると「興」「與」「輿」はすべて「モヨス」となってしまう。
 左右対称でないのに横挟み偏旁としている「月卂」は、嬴羸驘鸁贏蠃など、この形に従う字の重複を避けるためである。

衍:ノテシ 椼:ホノテシ
樊:ホメス 鬱:ホコワヲミ
ヒコ兜:ヒヨル
興:モロス
嚻:ロロフコハ
𢆶樂:レヨホ
轡:レヨロ
弼:コクフヨ 鬻:コホヘロマ
彘:レユヒヒス
斑:モモユメ
燮:ソロヌ
燕:サヲロツ
辨:ユキリ
讟:ユロセコハ
讎:イヘユニロ
疈:ヘキリ
月卂羸:ユレロタキ 贏:ユレロタハ

登録字形について(新字・旧字の打鍵、CJK互換漢字)

 コンピューターにおいて文字は、電気信号として処理できる符号によって処置されている(ラテン字母や仮名を表すモールス信号によく似ている)。この符号をやりとりし、符号に対応する文字の像を機器の側で実際の視覚情報として提示することで、人間がコンピューター上で文字を扱えるようになっている。この文字符号は、文字の種類や大体の字体に対応するにすぎず、細かい字形については規定していない。そのため、同じ文字表示環境によつてフォントが異なると、違う形として見えることがある。
 同じ文字符号でありながら違う形として見えることは、日本・中国・香港・台湾・朝鮮のフォントの違いや、日本のフォントでもフォントが作られるときに参照された時期のJIS規格の例示字形の違いによって現れてくる。
 詳しい理由の説明は省略するが、CJK統合漢字では、日本で旧字字形・新字字形の差となる「增」(U+589E)と「増」(U+5897)とはそれぞれ異なる文字符号に配置されていて形が符号によって分かれているのに対して、「僧」の旧字字形・新字字形は異なる符号に当てられておらず、同じU+50E7という符号の中に包摂されていて、日本のフォントで表示するか中国や台湾などのフォントで表示するかによって実際の形が変わる仕組みである。(本来なら、どちらかの方式に統一されるのが理想であったようだが、事情でそうならなかった。)
 葦手入力では、「增」「増」のような場合はそれぞれの形にそれぞれの分析を施した打鍵を与えてあるが、「僧」のような場合は、この文字符号ひとつに対して、それぞれの字形の分析による打鍵を同時に与えてある。つまり「增・増」の場合は、旧字の打鍵ならU+589E(增)、新字の打鍵ならU+5897(増)の字が入力されるが、「僧」の場合は旧字の打鍵でも新字の打鍵でも、入力されるのは同じU+50E7(僧)である。そのため、旧字の打鍵で入力したのに新字の形でしか出ない、という場合があるが、それはフォントの問題であって、技術上やむを得ない。むしろ、一つの符号に同時に異なる字形の打鍵を与えたというのは包摂対象となる複数の字形に幅広く対応できるようにするための工夫である。(異体字選択子など、これを入力側でどうにかする方法もないわけではないが、技術的問題が多い。)
 なお、中には「隆・塚・神・福・僧」のように違う符号に旧字体の字があるはずなのに旧字体の打鍵に新字体の符号が当たっている、というように見える字もあるが、これらの字は、古い規格との互換性を保つための「CJK互換漢字」という補助的な文字集合の中の字である。現在の規格では「隆・塚・神・福・僧」の符号に包摂されており、いわば、引っ越しした後の古い住所のようなものであるから、現在のコンピューターではもはや使わないことが望ましく、これらの字形の違いは符号の違いでなくフォント側の表示分けで対応されるべきである。それゆえ、むやみに濫用されるのを防ぐためにこれらの字は葦手入力には登録してない。
 また、日本文用のフォントは、工業製品の規格のJIS漢字コード表の例示字形(規範ではない)の変更を受けて、何度か字形に変化がある(74JIS・83JIS・90JIS・04JIS)。その変更をうけた文字は、新字旧字と同様に同一符号に異なる字形があたっているが、よってそれらの字にも、それぞれの例示字形の違いに対応して複数の打鍵を付与してある。


首頁