ATOK11用の自作辞書・ツール・データ

ここでは、ATOK11の新機能「単語コメント」を使った辞書やツール、そのほかのデータを公開しています。

Last modified: Mon Jul 16 15:51:19 2001


辞書

 ここには、ATOK11テキスト形式の辞書を置いています。「ATOK11専用」と書いていない辞書の場合は、他社のIMEでも使用することができると思います。

揚げ足取り辞書 (ATOK11専用)

「的を得る」(「的を射る」が正しい)などの間違いを指摘し、正しい候補を表示します。 といっても、実はまだ間違いデータがあまり入っていません。これから増やしていく予定です。なお、辞書はテキスト形式なので、辞書ユーティリティを使って一括登録する必要があります。

使用法
  1. 揚げ足取り辞書(ageashi.txt)(1KB以下)を適当なディレクトリにセーブする(ここでは、"c:\just\atok11"にセーブしたとします)
  2. 辞書ユーティリティを起動し、「一括処理」−「単語コメント一括処理」を選択する
  3. 「ATOK辞書(J)」には通常使っている辞書(普通は「標準辞書」です)を指定する
  4. 「単語ファイル(T)」には揚げ足取り辞書を設定(例では、"c:\just\atok11\ageashi.txt")
  5. 「出力ファイル(F)」は空欄のままで問題ありません
  6. 「単語登録・削除も行う(W)」をチェックする
  7. 「登録(A)」をクリックする
  8. 登録処理が完了したら辞書ユーティリティを終了させてください

似非倍角辞書 [NEW]

 元ネタは三ツ矢浩之さんのホームページ中のエセ倍角の館で、DOS時代の一太郎でいう横倍角風の単語を集めた辞書です。 100単語もありませんが、以下のような単語が入っています(単語がかなり偏ってます(^^;)。
 これは!という似非倍角ができたら、力野にメールしていただけると幸いです。

  ネ兄彳卸糸吉女昏 (祝御結婚)
  ネしイ義を矢口らない (礼儀を知らない)
  糸内其月が小布い (納期が怖い)
  口虚 (嘘)
  小青幸反夂几王里 (情報処理)

使用法:似非倍角辞書(baikaku.txt)(3KB)をダウンロードし、辞書ユーティリティで一括登録してください。

 ところで、似非倍角を作成する際は、MS-IME97の手書き文字認識がなかなか便利です。ATOKにもぜひ欲しい機能ですね。


ツール

 ここに登録してあるツールは、ATOK11のシステム辞書のデータを元にそれを加工した単語ファイルを作成するものです。

はじめに

 ここに置いてあるツールを使う場合、まず以下の準備を行ってください。

・ツール用作業フォルダを作る
ATOK11フォルダ(通常"c:\just\atok11")の下に"dictools"フォルダを作成してください。

・ATOK11システム辞書の単語一覧ファイルを作成する
  1. ATOK辞書ユーティリティを起動し、「一覧出力」−「単語出力」を選択
  2. 「ATOK辞書(J)」には「標準辞書」を指定する
  3. 「単語ファイル(T)」には"ツール用作業フォルダ\atok11.txt"を設定(例では、"c:\just\atok11\dictools\atok11.txt")
  4. 「開始読み(B), 終了読み(E)」は空欄のまま
  5. 「種類(K)」は「システム単語」だけを指定
  6. 「実行」を選択する。使用しているパソコンの性能にもよりますが、10分前後の時間がかかります。また、単語出力中に「詳細の表示をする(D)」のチェックをはずせば処理速度がかなり速くなります。

    ・jperlをインストールする
     ツールの実行にはjperlというプログラムが必要になります (動作確認は、主にjperl4.0 for win32で行いました)。 jperlを持っていない方は、jperl入手・インストール方法のページを参考にしてください。

町村名入力支援辞書作成ツール

 町や村の名前を入力する場合、正式な読みが「〜ちょう」「〜まち」のどちらかわからない場合がよくあります。 ATOKの辞書を見たところ、どちらか片方(おそらく正式な読み)でしか登録されていないようです。

 たとえば「はるえちょう」の読みで「春江町」が登録されていますが、「はるえまち」の読みでは登録されていません。 「まち」の学習状態によっては、「はるえまち」→「春江待ち」などと変換されてしまいます。

 このツールではどちらの読みでも一発で変換できるように、ATOKシステム辞書中の町村名をチェックして、もう一方(正式でない方)の読みをもつ町村名の単語ファイルを作成します。 また、正式でない読みを入力した場合にはATOK11の単語コメント機能を使って、正しい読みを表示します。

使用法
  1. はじめにを参照して、作業フォルダとATOKシステム辞書一覧の作成、jperlの準備をする
  2. 町村名重力支援辞書作成ツール(timei.pl, 2KB)を、ツール用作業フォルダ(例では"c:\just\atok11\dictools\)にダウンロードする
  3. 「MS-DOSプロンプト」を実行し、カレントディレクトリを作業フォルダにする("cd c:\just\atok11\dictools")
  4. "jperl timei.pl < atok11.txt > timei.txt"と入力し、ツールを実行する(timei.txtが作成されます)。 処理が終了したら"exit"と入力し、MS-DOSプロンプトを終了させる
  5. 辞書ユーティリティを起動し、「一括処理」−「単語コメント一括処理」を選択する
  6. 「ATOK辞書(J)」には通常使っている辞書(普通は「標準辞書」です)を指定する
  7. 「単語ファイル(T)」には"作業フォルダ\timei.txt"を指定する(例では、"c:\just\atok11\dictools\timei.txt")
  8. 「出力ファイル(F)」は空欄のままで問題ありません
  9. 「単語登録・削除も行う(W)」をチェックする
  10. 「登録(A)」をクリックする
  11. 登録処理が完了したら辞書ユーティリティを終了させてください


その他データ

JIS準拠のローマ字カスタマイズデータ

 現在、JIS規格の「仮名漢字変換システムにおけるローマ字入力方式」の公開レビューが行われています。 規格をみたところ、ATOKでは以下のローマ字定義が足りませんでした。

aiueo
wy     
lk, xk   
wh うぃ うぇうぉ
qくぁくぃ  くぇくぉ
kw くぃ  くぇくぉ
vy  ヴゅ  

 ATOKのローマ字カスタマイズ機能を使えば、これらの足りない定義を追加して、ローマ字入力をJIS準拠にすることができます。 カスタマイズした結果を jisroma.txt (ATOK11用, 3.5KB)にファイル出力したので使ってください。
...といいたいところなのですが、ローマ字定義のファイル出力はできても逆(ファイルからローマ字定義を登録)はできないようです。 何のためのファイル出力機能なのでしょうか??


[トップページ]

Copyright 1998 力野 健(Ken Tikarano)