トップページへ

   
私がViaVoiceを使うわけ
whyvv9.htm

                                                            
iindex

私がViaVoiceを使うわけ
ViaVoiceはローマ字入力より33%速い
ViaVoiceは学習するのでエライ!
ViaVoiceはちょっとしたコツが要る
公平に見て、欠点もある
                                                               
                                                   
私が ViaVoice を使うわけ                                                                        
ワープロソフトを使っている人の中で、一本指で打っている人は例外として、英文タイプの経験がある人はもちろん、経験のない人も、アルファベット26文字を使う、ローマ字入力が圧倒的に多いそうです。やはり、英文を打ち込むのも便利ですから、汎用性(はんようせい)があるということでしょうか。

ところが、ワープロ検定を受験して、一定の資格取得を目指している人は、入力スピードが4級、3級と上がってくるにつれて、だんだん焦りが出てくると聞きました。初めから、ひらがな入力を覚えた人との入力スピードの差は歴然としているわけです。単純に考えて、かな入力のほうが倍、速いと言えます。だから、3級ぐらいからひらがな入力を一から勉強し直す人もいるそうです。

私が英文タイプを専門学校で習ったのが、20歳のころです。それ以来47年間、ひたすらローマ字入力です。ひらがな入力が速いことがわかっていても、今更、切り替える気力もありませんし、その必要性も感じていません。しかし、録音素材を文章に起こす限り、やはり速く入力したいという願望は人一倍あります。

そこで、IBM社の ViaVoice の話になりますが、「みんなの広場」のホームページで、その存在を知りました。外に知る方法がなかったかと言えば、そうではないでしょう。PCを扱う店でViaVoice を知ることができたと思います。でも、人であれ、物であれ、「出会い」は人と人との人間的な営みがあるところ、必ずあると思います。
                                                               
ViaVoiceはローマ字入力より33%速い                   戻る                      (原稿を読み上げる場合)
ViaVoice を買ったのが2001年11月下旬です。使い始めて2週間ぐらいたったころの一つのデータをご紹介しましょう。ローマ字入力より音声入力のほうが、33%ほど速く入力できました。例えばローマ字入力で30分かかる文書を ViaVoice を使えば20分ですみます。(もっとも、このデータは、絶対的なものではなく、相対的なものです。つまり、私個人のデータです。いくら、ViaVoice が速いと言っても、ViaVoice は変換ミスをしますので、実際ローマ字入力や仮名入力のベテランは、ViaVoiceより速いと思います。ここは誤解のないようにお願いします。

そういうことですから、私もテープ起こしにもっと慣れてきますと、案外ViaVoiceを使わない方が速くなる可能性もあります。その逆もまた、しかり、でしょう。つまり、ViaVoiceの方は、ソフトや機器のことですから、更に、発展する可能性を秘めているわけです。人間はとても追いつけない性能になるかもしれません。楽しみですね。)

ということは、単純計算しますと、キーボード入力で6時間かかるものが、2時間速く、つまり4時間でできることになります。今のところ、当然、私のローマ字入力にもミスがあり、ViaVoiceにも変換ミスがありますが、修正をする時間を含めた時間です。ViaVoice の方が少しミスが多いでしょうか。

しかし、実際のテープ起こしは、耳で聞いた音声を口から音声入力するわけですから、その場合はどうなるかという資料ではありませんので、不満に感じている人もあると思いますが、私は楽観しています。一度に耳で聞いて、できるだけ長く記憶にとどめる力が、私の場合だんだんついてきているので、そのように感じます。
ViaVoice は学習するのでエライ!                                  戻る
ViaVoice は WORD でも一太郎でも入力できますが、Speakpad というViaVoice についている専用の特別 sheet で入力すると、最も効率よく学習するように作られているのです。ただし一つの段落か、複数の段落ごとに変換ミスがあればその都度、キーボードでミスを修正してやるほうがいいでしょう。このミス修正のステップを踏まないと、ViaVoiceは学習しないのです。これは非常に大切なことです。

最終的には、入力した原稿を保存する段階で、必ず文書と音声を一緒に保存します。これがその次に大事なことです。そうすると、保存されている間に、ViaVoice は修正された原稿と音声を照らしあわせながら、さらにもう一歩深く学習するように作られているのです。

音声ファイルのサイズはテキストファイルと比べて大きいので、ハードディスクの容量が少ないときはかなり負担になります。適当に保存したファイルを読み込んで、すぐまた音声無しで、テキストファイルで保存してやるとサイズは小さくなります。このこまめな管理の繰り返しがViaVoice をより賢く、確実に変換効率を高めていくコツだそうです。
トップページへ                         
ViaVoiceはちょっとしたコツが要る 
   
戻る
エンロールというのは英語で、enroll(ment) です。「会などへの登録」という意味です。ここでは、あなたの声の特徴やしゃべる時の癖や口調を ViaVoice の音声認識エンジンに覚えさせる、という作業のことを言います。

全部で4つほどのジャンルの違う文章があって、それぞれがかなり長く、読むのに14,5分かかります。自分の好きな文章を選択し、それを読んでいくのです。そのとき大切なことは「自然に、普通の速さで、リラックスして、できるだけ発音をはっきりと」ということです。読む前に強調されます。あまりそのことを強調されるので、かえって、堅くなり、緊張します。

緊張すると、例えば、「効用」や「公用」や「紅葉」をどうしても、「コウヨウ」とまるで辞書の見出しのように正しく発音しようとします。ところが、一般的に人はリラックスした普通の、自然な状態ではどうしても、「コーヨー」になってしまいますので、困ります。これが悪いのではなく、反対にこの発音のほうがいいのです。NHKのアナウンサーでも「コウヨウ」とは読まないでしょう。そんな発音はかえって、不自然なのです。

「普段どおりに、できるだけ自然に・・・」ということですから、
  • 紅葉→コーヨー             ×  コウヨウ
  • 効果→コーカ               ×  コウカ
  • 定員→テーイン             ×  テイイン
  • 好評→コーヒョー             ×  コウヒョウ
  • 糖尿病→トーニョービョー        ×  トウニョウビョウ
のように発音するのがコツです。×印のついた発音はいけません。スピードも、「ゆっくり」は返って変換ミスの原因になることもあります。アナウンサー並みに速く発音しても大丈夫です。
 その外、はっきり強調して発音しなければいけない場合もあります。
  •     「キョー
        「ギョー
  •     「シュッキン
        「シュッピン
など、それぞれよく似た発音の場合、ViaVoice は一番苦手のようです。似ている音を、少し強調的に、少し強めに、メリハリをつけて、明確に発音すると変換してくれます。だけど、あまり意地になって音声入力にこだわると、しんどいこともあるので、あっさりキーボードで入力したほうが効率的な場合もあります。
 
ViaVoice も、一太郎のように前後の文脈から判断して変換するようになれば、性能はぐっと上がるだろうと思います。ViaVoice と一太郎の組み合わせが、一番将来性があるのではないでしょうか。その計画はあるのではないでしょうか。「Voice ATOK 14」を買ったとき、その中に ViaVoice Ver.8 がパックされていたことから、案外その計画はあると思います。Just System と IBM はかなり接近していますので、それほど遠くない時期に ViaVoice はすばらしく進歩するに違いないとみているのですが・・・ (ごく最近のニュースとして、IBMとJust Systemが提携して、非常に安定感のある軽いViaVoice を発表したそうです。ATOK は15で、変換効率が良く、ViaVoice は200MBほどの軽量級ということです。無駄は削り取って、軽くし、安定性重視の製品で、おそらくテープ起こしをしている人たちのことも、念頭において製品開発したものだろうと、推察します。ちょうどこの原稿を書いている2002年3月ごろに発表されました。製品名は、ViaVoice with ATOK15です。これについてもっと詳しく知りたい方は、次のホームページを参照してください。
http://www.ibm.com/jp/voiceland/  
トップページへ                                 戻る
公平に見て、欠点もある
(Windows OS のリソースメータにいつも気をつけよう)
Windows XPは関係ありません。XPにリソースメーターがありません。、
ViaVoice のいいことばっかり書きましたので、責任を感じています。ここで、音声入力しながらホームページの原稿を作っているときに起こった不思議な現象を、公表する義務を感じています。企業は体面があるので、製品の欠点やバグをパッケージに書いたりはしないでしょう。バグ等を修正できたときは、(「こっそり」と言っていいかもしれないですが)修正プログラムをホームページで公開します。私はあまりそういう関係のホームページは見ませんので、たいていそのような恩恵に浴することはありません。

これが、一般的に言えば、企業の体質です。営利を目的にしているものは、全てそうではないでしょうか。IBMには、いろいろソフトで世話になったり、フリーコールの電話サポートで世話になりましたが、それとこれはやはり違うな、という思いがあります・・・

ViaVoice の音声入力は、一太郎やWORD などにも、直接入力できます。特に、WORDとIBMがこれまでのいきさつから、強力な関係があって、WORDを使った音声入力にかなり力を入れています。私が最初に使ったのが、Voice ATOK 14という製品にパックされていたViaVoice Ver.8 でしたが、WORDとの相性をかなりよくした認識エンジンを乗せていました。

しかし、一太郎との相性は今のところそれほど良くないのです。これの最も大きな原因は、一太郎とViaVoiceの両方のサイズの大きさです。両方とも重たすぎることのようです。入力中に画面がフワフワと踊るように浮いた感じになりますし、これは、ViaVoice 用として専用に作られている
Speakpad の安定感とは大違いの印象です。ところで、そのフワフワ踊るように浮く状態になる、一太郎11に音声入力中に起こったこととは・・・、
  • A4サイズの用紙に3分の2ほど、入力し終わったころ、何かの拍子に、カーソルが用紙のトップの方へ逆走し始めたのです。それまで入力した原稿を次々と消去していくのです。私はなすべもなく、ただあ然と見ていました。10分ほどかけて入力した原稿が、またたく間に、消えてしまったのです。ところが、Windows Me がバックアップを取っていてくれたんですね。これには思ず、カシコイ!と叫んでしまいました。
  • 早速、IBM社に電話しました。サポート嬢は、そのようなことが起こることを認めました。そして、一太郎で ViaVoice を使うときは、10,15分ぐらいで1回は保存して、また新しく作ってほしいと言っていました。
サポート嬢に何を言っても、「どうもすみません」になりましたから、それ以上は無駄な話です。企業というのは、人の命に危害を加える車でさえ、致命的な欠陥を隠そうとします。年々ひどくなります。マイナーな企業ほどそうです。最近の某社の、リコール届けを怠った事件はひどいものがあります。某**会社の話よりひどい感じがします。私の場合は、たかがソフトの話ですから、それほど深刻ではありませんが、何かトラブルが発生すれば、そのトラブルには万全の対応をしなくては信用をなくしてしまうでしょう。

ほめすぎた Speakpad にも、欠陥というか、かなり問題が発生しました。一番信頼が置ける
Speakpadにも、同じような現象(カーソルが凍ってしまう、固まってしまう、freezed  の状態)が発生したのです。120分テープが2本、オーダーが入って忙しいときに、こんな状況になれば、私もかなり落ち込みましたが、IBMの男性のサポートの人が私の気持ちを十分わかってくれて、対応は気持ちがいいほど手際よかったです。彼が指示してくれたことは次の2点でした。指示の内容は簡単ですが、電話で要した時間は40分ほどかかりました。


Windows の一番下の、タスクバーに収まっている右側の常駐プログラム(時計の時刻表示の左)をはずせる限り、はずしてしまうこと。(私は、ATOK と WORD 以外はみなはずしました。スピーカーのアイコンまではずしました)
  • スタート→設定→コントロールパネル→IBMのViaVoice のオプション(ダブルクリック)
    →(たくさんあるパネルから)コマンドセットをクリック→コマンドの中のチェック(レ印)を
    (ディクテーションとテキスト編集以外)全てはずす。
結局、ViaVoice は音声ファイルで重たくなり、たくさんある常駐コマンドで重たくなり、音声ファイルを保存することで、さらに重たくなる状況だったのです。この処置で、ウソのように軽く動くようになりました。しかし、今のところ、モニター画面1ページ分以上は一度に入力はしないことにしています。

それから、もう一つそのサポートマンが教えてくれたことで、ありがたいと思ったのは、
Speakpadへ入力したテキストをWORDなり、一太郎にコピーするときに、よくやる「編集」から入って、「切り取り(コピー)」、「貼り付け」の方法はやらないこと、また、Speakpadについているツール(「転送先」)も使わないこと、でした。要するに、よくやる方法では、たくさんメモリを使ってViaVoiceに 負担になるということでした。特に入力量が増えてくると、だんだん重たくなって、貼り付けなどをやっているときに、よく事故が起こると言ってました。そういえばViaVoice を使っているとき、別に音声入力に限らず、コピーがすんなり1回でうまくいかないこと、よくありませんか。
男性サポートの推奨の方法は・・・
  • (キーボードを使って)全てを選択(Ctrl+A)→切り取り/コピー(Ctrl+X / Ctrl+C)→
    コピー先の希望する位置にカーソルを持っていき、クリック、点滅を確認後→貼り付け(Ctrlt+V)
この方法が、一番確実で、負担がかからないということでした。もっとも、WORD や一太郎など、普通のワープロの場合は、自分で慣れた方式でいいのであって、とくに ViaVoiceを使うときの話です。固まってしまったが、キーボードは使えるというようなときは、緊急避難できるいい方法になるかもしれませんね。(^_^)
今回ViaVoiceで入力中、またまた事故が起こりました。もう事故には慣れましたが、4月19日に納品する分ですから、少しあせりました。Speakpad という特別な編集画面で、18のファイルを作成した時点で気がついたのですが、7つが中身が空だったのです。この率は40%です。おなじみの電気屋に、かなりベテランの店員さんがいて、調べてくれたのです。7つが蛻の殻(もぬけのから)でした。IBMのサポートいわく、「PCのOSのリソースメーターの値が極端に低くなっています」

このリソースメータの値とはどういうものか、まず、表示してみましょう。
スタート(左下にある)から出発して、プログラム→アクセサリ→システムツール→リソースメータと順番にクリックしていってください。(念のために、私のWindowsは、Meです。Windowsによって、違うかもしれませんので、あしからず)最後に、リソースメーターのダイアログが開きます。そこにあるコメントを読んで見ましょう。この意味が一回読んでわかる人はかなりのベテランか、ひょっとしてプロでしょう。私にはチンプンカンプンですので、安心してください。

メッセージいわく、「リソースメーターは、プログラムが使用するシステムリソースを監視
します。外のプログラムと同様に、リソースメーターも実行中は、システムリソースを利用します。これにより、コンピュータの処理速度が遅くなることがあります」。なんのことか、わかりますか。そしてこの画面でOKをクリックすると、Windowsのタスクバー(画面の一番下、右側、時計のあるところ)に、先ほど説明したレターケースのようなアイコンが、表示されます。今度は全部緑色です。4段になっていませんか。

このメーターにマウスのポインターを近づけますと、細長い帯状のメッセージが出てきませ
んか。(これがまた、なかなか出てこないのです)「システム:68%、ユーザー:68%、GDI:76%」というような%であらわす数値です。この数値がだいたい70以上あれば、安心らしいです。ところが、Windows をたくさん表示して、重ねて使ったり、メモリを沢山食うようなソフトを稼動させたりしていると、どんどん下がってくるのです。これは、メモリをいくら増やしても、回復しないそうです。私のメモリは 512MB もあるのですが、こういう状態に陥るのです。いわば、これは、Me の欠陥といっていいでしょう。これがすべてのソフトを不安定にしていたと言えるのでは・・・

こういった症状は、WindowsXPでは、出てこないといいますから、いかにMeがやっつけ仕事の、未完成の製品として、市場に出てきたか、お分かりになったでしょう。私が「私のプロフ
ィール」のところで「嫌いな人間」の一人に、Microsoft  の社長を名指しで挙げているわけが、お分かりいただけたかもしれませんね。Windows 95、98、・・・とその寿命を考えてみてください。Me ガ一番短いのです。市場に出て、1年も経たないうちにXPがでてきましたから、その反省振りも伺いしれますね。

結局、IBMのサポートは、ViaVoiceの「事故からの緊急避難法」として、次のように指示しています。
  • 右下のリソースメーターを常に気をつけて、数値が下がってきたかな、と思えると、保
    存をすること。ViaVoice の変換率が悪くなりますし、カーソルの動きが悪くなりますので多分分かるでしょう。(モニター画面、1ページ分ぐらいで、保存するように努力する)
  • 右下の、時計の左にある常駐プログラムをできるだけ外す。(これは、一太郎やWORDの、何とかパレット?でよく隠れていますので、注意が要ります。)
  • 当分、必要でないソフト、たとえば、一太郎を使って、WORDが要らないのであれば、アプリケーションの追加と削除を使って削除する。その他不要なソフトも同じように処理します。
  • 下のスタートの右にある、クイックスタートも削除する。クリックが1回か、2回かの違いですからたいしたことありません。
  • (どこかでも書いていますが)ViaVoice の、自分が使わないコマンドをできるだけ削除
    する。WORDを使って入力する人は、「WORDのディクテーション」だけ残して、外は皆外してもよい。
  • デスクトップも不要なものを整理しましょう。
  • (最後の手段、XPに変えましょう。しかし、これは周辺機器との相性の問題があります
    ので、全ての人にお勧めというわけにはいきません)
  • 最後の私の提案、テープ起こしをずっとサイドビジネスとして続け、しかもViaVoiceを使いたいと思っている人は、ご自分のPCを、それ専用に、特化して使われることをご提案します。今度私は、XPに変えるとき、不要なソフトはできるだけインストールしないようにしようと思っています。
トップページへ                                               戻る