当研究所の技術のご紹介


◇高精度・高速文字認識ライブラリ◇

当研究所の学習・識別理論の研究成果による高精度・高速な文字認識ライブラリです。

●特長

高い認識率 … 手書き数字の認識率99.1%(公開されているデータを用いた測定結果)
高速処理  … 1000文字/秒以上
頑健性   … ノイズ、途切れ、傾き等にも頑健です。

・お客様の実際の帳票を使って学習することが可能です。

・各種用途に合わせた認識プログラムを柔軟に作成可能


◇カテゴリー相関分析技術◇

大量のデータを持つ多数のカテゴリー間の相関(類似性)を高速に分析する技術です。

例えば:
(1) 商品A〜A10000は互いにどの商品と関係が深いかを分析したい
(2) 多数のカテゴリーからなる集合をクラスタリングしたい

(1)のような場合、共起確率による分析がよく知られていますが対象によっては大雑把な結果しか得ることができません。また(2)の場合では、まず何らかのカテゴリー間の距離尺度を導入しなければなりませんがこれは自明ではありません。当研究所では独自研究による高速な学習識別理論を用いて、信頼性の高い分析を高速に行うことが可能です。

例として、日本語活字の全文字種(約6800文字)について、文字パターンのデータベースを使って形が似ている度合いを分析した結果の一部を示します。きわめて自然に字形の似ている順番に類似文字が並んでいることがわかります。







(この分析結果データをご希望の方はご連絡ください。)