■パソコンdeベトナム語

 ベトナム語はローマ字表記。でも、声調記号が必要なので、通常の状態では、ベトナム語を扱うことができません。そのために様々な問題が発生します。このコーナーではベトナム語学習者のために、様々なTipsを紹介していきたいと思います。今回はUnicode Converterのご紹介です。


★従来のベトナム語フォントの文書をUnicodeに楽々変換!
 〜Unicode Converterの導入と使用方法(Windows XPの場合)〜

 Windows 2000/XPがUnicodeのベトナム語を標準搭載するまで、ベトナム語のフォントとしては、TCVNやVNIなどが使用されていました。ですので、今でもベトナム語の文書の中には従来のベトナム語フォントで記録されている文書があって、それをどうしてもUnicodeに変換したい!というときがあるはずです。また、従来のベトナム語フォントで送られてくる文書もありますので、それを読むためのフォントがみつからない!Unicodeに変換したいというときもあるはずです。

 そんなときには、Unicode Converterが便利です。

 Unicode Converterはフリーのソフトウェアです。ただし、OSを問わないJava言語で作成されていますので、Unicode Converterを単体で導入しても、そのままでは動きません。必ずJava Runtimeを導入してから使用ください。Java RuntimeとUnicode Converterの導入方法は、Windows XPの場合、以下の通りです。

1) Java Runtimeのダウンロード

  1. http://www.java.com/ja/にブラウザでアクセス。

  2. 「Javaソフトウェアの無料ダウンロード」のページで[Download NOW!]とある下矢印をクリック。
  3. 現在使用しているコンピュータのOSを自動判別して「デスクトップ用Javaソフトウェア」というページが開きます。「ダウンロードの開始」とある黄色いボタンをクリック。
  4. 「Java ソフトウェアのインストール状況の確認」というページが開きますので、「インストールの確認」という黄色いボタンをクリック。
  5. 「Java ソフトウェアのインストール状況の確認」というページが開き、すでにインストール済みの場合は、「最新バージョンのJavaソフトウェアがインストールされています。」と表示が出るので、その場合はインストールが不要です。
  6. インストールされていなければ、「ファイルのダウンロード」というダイアローグが開くので、「保存」ボタンをクリックし、デスクトップにインストールプログラムを保存します。
  7. いったんブラウザを閉じて、デスクトップのインストールプログラムをダブルクリックして実行。自動的にインストールが開始されるので、あとはプログラムの指示にしたがってインストールを完了させます。
  8. 「スタート」→「コントロールパネル」と開くと、中にJavaとかかれたアイコンができる。クリックするとJavaコントロールパネルが開くが、設定は変更する必要はありません。

2) Unicode Converterのダウンロード

  1. http://unicodeconvert.sourceforge.net/にブラウザでアクセス。

  2. 左端の[Download]を選択してクリック。
  3. Unicode ConverterのSummeryのページが開きますので、そのページの[Download Unicode Converter] とある緑のボタンをクリック。
  4. Fileのページが開くので、そこからunicodeconverterとある行の[Download]の緑ボタンをクリック。(2006/3/30現在、リリースバージョンは1.3-Javaです)
  5. 次にUnicodeConverterの最新のパッケージが表示されるので、[UnicodeConverter-1.3.zip]とあるところをクリックして開きます。[UnicodeConverter-1.3-src.zip]とあるのはソースコードのみで、本体ではないので間違ってダウンロードしないよう注意してください。
  6. ダウンロードのミラーサイト一覧が表示されるので、日本からなら、Keihanna, Japanか、Ishikawa, Japanとある行の[Download]をクリックします。
  7. すると自動的にファイルのダウンロードが表示されるので、保存ボタンをクリックし、デスクトップにファイルを保存します。(IE6.0をブラウザに使用し、セキュリティを中以上に設定すると、ブラウザ上部に警告が出るので、それをクリックし、「ファイルのダウンロード」を選択してください)
  8. ここまでくるのに失敗したら、以下の直リンクをクリックしてファイルをダウンロードすることもできます。
  9. http://keihanna.dl.sourceforge.net/sourceforge/unicodeconvert/UnicodeConverter-1.3.zip

    http://jaist.dl.sourceforge.net/sourceforge/unicodeconvert/UnicodeConverter-1.3.zip

    (但し、このURLは変更される場合があるので、リンク切れの場合はこの文書の冒頭からたどってください。)

  10. いったん、ブラウザは終了させ、デスクトップを見ると、UnicodeConverter-1.3.zipというファイルができるはずです。保存したファイルはzipで圧縮されていますので、ファイルを選択し、右クリックでメニューの中から「すべて展開」を選択します。(Windows Me/XPの場合)
  11. 展開ウィザードが開くので、「次へ」→「次へ」→「完了」と押します。
  12. デスクトップにUnicodeConverter-1.3というフォルダができるので、このフォルダをProgram Fileフォルダに移動させ、フォルダを開きます。
  13. UnicodeConveter.jarとあるファイルをクリックすると、Java Runtimeが正しくインストールされていれば、プログラムが起動します。「このファイルを開けません」というダイアローグがでる場合は、「一覧からプログラムを選択する」のラジオボタンをクリックし、Java(TM) 2 Platform Standard Edition binaryを選択、「この種類のファイルを開くときは、選択したプログラムをいつも使う」にチェックをいれ、「OK」を押すと、プログラムが正常に起動するはずです。ここではいったん[Close]ボタンを押して終了させます。
<使用方法>

  1. UnicodeConverter.jarとあるファイルをクリックし、起動させます。

  2. 変換元のファイルのキャラクターセットをドロップダウンリストから選択します。キャラクターセットが不明の場合は、北部で比較的多く使用されているTCVN(ABC)、南部で使用されているVNI、VPSを順に選んで実行してみてください。なお、変換元として可能なキャラクターセット/エンコーディングは、ISC, NCR, TCVN3, Unicode Composite, VIQR, VISCII, VNI, VPSの8種類。
  3. 次に[Select File}もしくは[Select Directory]のボタンを押して、変換元のファイルもしくはフォルダを選択。複数の文書をフォルダ毎変換したい場合は、[Entire directory, including sub]というところにチェックをいれると、[Select File]というボタンが[Select Directory]にかわります。変換元のファイルの形式は、テキスト(.txt)、リッチテキスト(.rtf)、ワード文書(.doc)、エクセル文書(.xls)です。
     変換のこつは、変換元の文書をたとえひとつでも適当な名称のフォルダにいれて、デスクトップなどおいておき、それをフォルダ毎選んで変換することです。ここでは「変換元フォルダ」という名称にして、中に変換元のファイルをいれて準備しておきます。表示されたフォルダから「変換元フォルダ」というフォルダを選択し、右下の[Convert]ボタンをクリックします。
  4. [Conversion Status]というウィンドウが立ち上がり、変換が開始されます。--Beginning of task--の文字の下に、変換元ファイルのルートディレクトリが表示され、変換が終了すると、--End of task--という表示がされます。
  5. デスクトップに変換元のフォルダをおいておくと、変換先のフォルダが<元フォルダ名>_Unicodeという名称になって新しくつくられます。そのフォルダを開くと中に変換後の文書がはいっいるはずです。
  6. 変換後の文書を開くと、明朝やゴシックですと文字化けしていますが、文書のフォントを、Arial、Times New RomanなどUnicode対応のフォントに換えてみると、印刷しても画面でみてもきれいな表示になります。
  7. MS UI GothicなどはUnicode対応のフォントのはずですが、文字が一部汚くなります。またMS標準の明朝やゴシックは文字化けするのに、サードパーティの日本語フォント(例えばワードに標準でついてくるリコーHGフォントなど)がUnicode対応でベトナム語を表示できるものも多いようです。
  8. またワード文書のワードアートで作られた文字などは変換できないようです。
  9. .html文書も変換できるとHelpにありますが、何度も試してみましたが、なぜか変換すると文字化けが残ります。
新妻東一 2006/04/22

【参考】
 ベトナム語のフォント、入力方法(インプット・メソッド)などについて以下のサイトを参考にしました。

■Vietnamic Life ベトナム的生活
 http://www1.ocn.ne.jp/~watazo/
 ベトナムの中部の海浜リゾート・ニャチャンに住むWatazoさんのサイト。「PCでベトナム語入力」と題してたいへん詳しい解説を載せていらっしゃいます。
■ASCII24【絵でわかるキーワード】Unicode(ゆにこーど)
 http://review.ascii24.com/db/review/soft/web/2003/08/10/645434-000.html
■Vietnamese Unicode FAQs
 http://vietunicode.sourceforge.net/
■東アジアの文字集合の概要: ベトナム語
 http://www.asahi-net.or.jp/~ez3k-msym/charsets/cjk-v.htm
■Trung Tam Tu Dien Hoc: "Tieng Viet 'giau' nhung co con 'dep' tren mang thong tin toan cau"
 http://www.vietlex.com/vietnamese/tvOnInternet.html


<< home
Copyright 2002-2006 Niizuma, Toichi. All rights reserved.