葦手入力の打鍵は、字形を機械的に分析することで、一意に打鍵が定まることを指向した。漢字の種類は膨大であるから、例外が多いと、字形から自由に文字を打てなくなる。完全に規則に従わせることで、あらゆる漢字が、初めて目にする字でも入力できるようになる。全ての漢字が、この規則に従って分析され、打鍵が導き出される。
それぞれの文字に与えられる打鍵は最長五字母で、その打鍵字母は、文字を規則的に分析し、特定の位置にある字素を抽出して字母に置き換えることで決定される。抽出する字素の位置は、その文字の結構によって決定される。文字の結構は、文字を二分したときの組み合わさり方で決定する。規定された結構の種類は次の通り。
| 並び | - | 地:-土,也 | 超:-走,召 | |||
| 重なり | / | 宇:/宀,于 | 懲:/徵,心 | |||
| 覆ひ | ^ | 國:^囗,或 | 閏:^門,王 | 匣:^匚,甲 | 戒:^戈,廾 | |
| 被さり | ~ | 病:~疒,丙 | 釐:~𠩺,里 | 魔:~麻,鬼 | ||
| 掬い | _ | 進:_隹,辵1 | 幽:_𢆶,山 | 臿:_干,臼 | ||
| 横挟み | b | 衢:b行,瞿 | ||||
| 縦挟み (同「重なり」) | c | 褒:c衣,保 | ||||
| 添ひ | . | 犬:.大0,丶0 | 刅:.刃,一1 | 米:.丷0,木0 | ||
| 割り | " | 夾:"大,|人,人 | 東:"木,日 | 繭:/艸1,"巾0,-糸,虫 | ||
| 交わり | + | 內:+冂,入 | 牽:/+玄,冖0,牛 | |||
| 接合 | & | &亠0,DPH | 亦:&亠0,"SPSG,八0 | 戉:&戈,𠄌 |
打鍵は全て視覚上の字形を規則的に分析することで得られる。
同打鍵に異なる字が重複して当たっている場合、それぞれの打鍵の末に固有の符号(分別子)を加えることで一意に入力することができる。分別子は「ァ・ィ・ゥ・ェ・ォ・ャ・ュ・ョ」とし、JIS第一水準・第二水準字表順、CJK統合漢字表順の次第で、「ァ」から順に割り振られる。
基本的な文字で、互いに形が酷似して、通常の分析では打鍵の分別ができないものについては、原則を大きく外れない限りで、特別な分析方法を個別に適用する。文字によつて、単字と偏旁とで分析方法が異なるものと同じものとがある。
なお、分析規則第五条にある通り、「尤」「弋」「戈」「朮」「求」「犬」「犮」「甫」といった肩に点のある来る字は、単字の時は点を含み、偏旁にあるときは点を無視する。
| 未 | キイ【+HHS,人0】 |
| 末 | ヘホ【+一,木】 |
| 田 | コキ【^囗,十】 |
| 由 | ワセ【+SHZ,土】 |
| 甲 | ワキ【+SHZ,HHS】 |
| 申 | ヨシ【+曰0,丨0】 |
| 鳥 | イヨヘツ 【&&&PS,HZHH,一,^HZG,灬00】 |
| 烏 | イコヘツ 【&&&PS,HZH1,一,^HZG,灬0】 |
| 単字 | 偏旁 | |
|---|---|---|
| 丁 | ヘノ【&一0,亅0】 | マ |
| 七 | ヘレ【+一0,㇄0】 | セ |
| 于 | ヘナ【&一0,HSG】 | テ |
| 井 | ニリ【+二0,SPS】 | イ |
| 入 | ノヘ【&丿0,乀0】 | イ |
| 刀 | フノ【&HZG,丿0】 | ア |
| 士 | キヘ【&十0,一0】 | セ |
| 壬 | チヘ【&千0,一0】 | モ |
| 小 | ノハ【"亅0,八】 | ツ |
| 尸 | コノ【&HZH1,丿0】 | ア |
| 山 | シコ【_丨0,凵0】 | ヲ |
| 川 | ノシシ【-SP,-丨0,丨0】 | ツ |
| 己 | フヘレ【&HZ,&一0,乚0】 | コレ |
| 已 | フヒ【&HZ,匕0】 | コレ |
| 巾 | ワシ【+冂,丨】 | ヤ |
| 廿 | サヘ【&卄0,一0】 | サ |
| 曰 | コヘ【^口1,一0】 | ヨ |
| 月 | ワニ【^SPHZG,二0】 | タ |
| 王 | テヘ【&干0,一0】 | モ |
「麻」「辰」などに従い、この下に偏旁がくる字などは、同じ字でも垂れの長さがフォントによって異なるために、上下結構に見えたり、外内結構に見えたりと字形解釈に揺れが生じる。よって、予めこれらの偏旁に従う字の結構を規定しおいて、打鍵時の混乱を解消する。
| 厭 | (被さり) | 【~厭,■】=【~厂,/猒,■】 |
| 鹿 | (被さり) | 【~鹿,■】=【~广,/コリ,/比,■】 |
| 麻 | (被さり) | 【~麻,■】=【~广,/林,■ 】 |
| 辰 | (重なり) | 【/辰,■】 |
左右で中を挟む形となる横挟み結構を構成する特定の偏旁を、横挟み偏旁とする。横挟み偏旁は、左右対称形のものを基本とする。また、分別の都合上、左右対称でないが左右が強く結びついたものでも横挟み結構偏旁とするものがある。
横挟み偏旁に従う字は、中の偏旁の方が文字の分別に関わるものであるから、並び結構の連続として分析すると、打鍵の分別が困難になる。たとえば、もし並び結構とすると「興」「與」「輿」はすべて「モヨス」となってしまう。
左右対称でないのに横挟み偏旁としている「月卂」は、嬴羸驘鸁贏蠃など、この形に従う字の重複を避けるためである。
| 行 | 衍:ノテシ 椼:ホノテシ |
| 林 | 樊:ホメス 鬱:ホコワヲミ |
| ヒコ | 兜:ヒヨル |
| 臼 | 興:モロス |
| 㗊 | 嚻:ロロフコハ |
| 𢆶 | 樂:レヨホ |
| 絲 | 轡:レヨロ |
| 弜 | 弼:コクフヨ 鬻:コホヘロマ |
| 比 | 彘:レユヒヒス |
| 玨 | 斑:モモユメ |
| 炏 | 燮:ソロヌ |
| 北 | 燕:サヲロツ |
| 辡 | 辨:ユキリ |
| 誩 | 讟:ユロセコハ |
| 雔 | 讎:イヘユニロ |
| 㽬 | 疈:ヘキリ |
| 月卂 | 羸:ユレロタキ 贏:ユレロタハ |
コンピューターにおいて文字は、電気信号として処理できる符号によって処置されている(ラテン字母や仮名を表すモールス信号によく似ている)。この符号をやりとりし、符号に対応する文字の像を機器の側で実際の視覚情報として提示することで、人間がコンピューター上で文字を扱えるようになっている。この文字符号は、文字の種類や大体の字体に対応するにすぎず、細かい字形については規定していない。そのため、同じ文字表示環境によつてフォントが異なると、違う形として見えることがある。
同じ文字符号でありながら違う形として見えることは、日本・中国・香港・台湾・朝鮮のフォントの違いや、日本のフォントでもフォントが作られるときに参照された時期のJIS規格の例示字形の違いによって現れてくる。
詳しい理由の説明は省略するが、CJK統合漢字では、日本で旧字字形・新字字形の差となる「增」(U+589E)と「増」(U+5897)とはそれぞれ異なる文字符号に配置されていて形が符号によって分かれているのに対して、「僧」の旧字字形・新字字形は異なる符号に当てられておらず、同じU+50E7という符号の中に包摂されていて、日本のフォントで表示するか中国や台湾などのフォントで表示するかによって実際の形が変わる仕組みである。(本来なら、どちらかの方式に統一されるのが理想であったようだが、事情でそうならなかった。)
葦手入力では、「增」「増」のような場合はそれぞれの形にそれぞれの分析を施した打鍵を与えてあるが、「僧」のような場合は、この文字符号ひとつに対して、それぞれの字形の分析による打鍵を同時に与えてある。つまり「增・増」の場合は、旧字の打鍵ならU+589E(增)、新字の打鍵ならU+5897(増)の字が入力されるが、「僧」の場合は旧字の打鍵でも新字の打鍵でも、入力されるのは同じU+50E7(僧)である。そのため、旧字の打鍵で入力したのに新字の形でしか出ない、という場合があるが、それはフォントの問題であって、技術上やむを得ない。むしろ、一つの符号に同時に異なる字形の打鍵を与えたというのは包摂対象となる複数の字形に幅広く対応できるようにするための工夫である。(異体字選択子など、これを入力側でどうにかする方法もないわけではないが、技術的問題が多い。)
なお、中には「隆・塚・神・福・僧」のように違う符号に旧字体の字があるはずなのに旧字体の打鍵に新字体の符号が当たっている、というように見える字もあるが、これらの字は、古い規格との互換性を保つための「CJK互換漢字」という補助的な文字集合の中の字である。現在の規格では「隆・塚・神・福・僧」の符号に包摂されており、いわば、引っ越しした後の古い住所のようなものであるから、現在のコンピューターではもはや使わないことが望ましく、これらの字形の違いは符号の違いでなくフォント側の表示分けで対応されるべきである。それゆえ、むやみに濫用されるのを防ぐためにこれらの字は葦手入力には登録してない。
また、日本文用のフォントは、工業製品の規格のJIS漢字コード表の例示字形(規範ではない)の変更を受けて、何度か字形に変化がある(74JIS・83JIS・90JIS・04JIS)。その変更をうけた文字は、新字旧字と同様に同一符号に異なる字形があたっているが、よってそれらの字にも、それぞれの例示字形の違いに対応して複数の打鍵を付与してある。