第三章  国際文字コードとしての漢字

 

欧米の人口をしのぐ漢字文化圏

 初期のコンピュータの多くは印刷電信のコードを流用していた。

 ただ、それはABC順・アイウエオ順ではなく、文字の使用頻度順にコードをふっていたため、単語辞書の検索が著しく困難だった。動詞を「書かない、書きます、書く、書けば、書こう」のように活用させる場合も、アイウエオ順なら簡単な足し算で活用語尾がえられるが、頻度順では複雑な処理をへなければならない。

 ABC順・アイウエオ順の必要性を痛感していた和田 弘氏は、欧米のコンピュータ研究者もそれと同じ考えであることを知ると、印刷電信コードから脱出すべき時に来ているという確信を深めた。

 そして、1960年に情報処理学会が誕生。

 当時の技術によりキーボードの配列は文字コード配列に依存していた。アイウエオ順のコードに変われば、キーボードもそれに変えねばならず、現場に近い技術者には非現実的な話に思えたという。

 

 和田氏は1969年に漢字コードの委員会を設けて漢字コードの開発に着手していた。

 漢字を矛盾なくコード化できるような構造にするための提案書を送ったり、中国と日本の人口をあわせると欧米をしのぐ点をあげたりして、漢字コードの必要性を訴えていた。

 そして翌年、後にISO2022となる拡張法の骨子がまとまり、数千規模の文字コードをつくる条件が整った。

 

 残りの課題は「コード化すべき漢字の選定」と「漢字の配列の決定」の2点。

 それについては畑違いの分野であったため和田氏は国立研究所日本語教育部長だった、林氏に依頼。

 漢字以外の文字や記号、外字のために開けておく部分を勘案すると、最大で8000字余の漢字を収録可能とし、1971年漢字コード委員会は「標準コード用漢字表」を情報処理学会に提出。

 

 JIS漢字コードに向けて

 情報処理学会漢字コード委員会は1971年から休暇に入るも、その理由は日中共同漢字コード構想にあった。

 しかし、当時中国との国交がなかったためその交渉の機会を待ちつづけることに。

 その間も漢字処理の研究は続く。

 漢字は種類が多いだけでなく必要な範囲に明確な基準がないこともあって、メーカー間で文字セットが異なっていた。

 一日も早い標準となる漢字コードが欲しいという点だけが一致。

 

 そして、使用頻度の高い「第一水準漢字」と低い「第二水準漢字」に二分することとなった。

 その振り分けは漢字表の調査を目安にした。37の漢字表を集め、いくつの漢字表に収録されているかを点数化。重みづけのために、収集した漢字表から重複する字を削り、異なり字一覧表も作った。

 最大の重みとなった漢字には予想外の漢字も混じっていて、第一水準漢字については重み28以上の漢字1972字の他に、当用漢字、人名用漢字別表などを重みにかかわらず追加。こうして第一水準漢字2965字、第二水準漢字3383字、合計6348字が決定した。

 その大半は日下部重太郎の「実用漢字等級表」由来のものが多い。

 

 文字概念と例示字形

 委員会は1976年「情報交換のための漢字符号の標準化に関する調査報告書」をまとめた。

 巻末の符号にはGLGR、区点の三種類がある。

 GLGRはコンピュータのための符号で、0〜127ないし0〜255のうち文字に使ってよい範囲の番号で表すが、句点は人間のための符号で、94×94の升目の何行目、何列に置かれているかで表す。

 符号表には漢字だけではなく、記号類、数字などの非漢字も入っている。

 字形の揺れをある程度許容するために、「文字概念」という点を打ち出した。これを共通の特徴で区分し、一つの符号でくくることにした。

文字概念とは「社会的に確立した」文字同定の範囲を示すものであって、単語の概念ではない。