BIRDS文字パターンデータベースとは
株式会社バーズ情報科学研究所によって収集された、手書き文字(数字、記号、アルファベット、カタカナ)、印刷活字各種フォント(日本語JIS第1・第2、英字)の画像を格納したデーベースです。
利用条件
このデータベースのご利用に当たっては添付されている使用許諾条件をお読みください。
ダウンロード
BIRDS−1: BIRDS-1.zip (手書き文字英数カナ, 178,000 patterns, 15,461,258 bytes)
BIRDS−2: BIRDS-2.zip (手書き文字数字, 202,958 patterns, 19,287,880 bytes)
BIRDS−3: BIRDS-3.zip (印刷文字日本語, 992,593 patterns, 101,544,721 bytes)
BIRDS−4: BIRDS-4.zip (印刷文字欧文, 324,494 patterns, 13,311,227 bytes)
ファイルフォーマット
CDB形式フォーマット (*.cdb)
[type] [name] [size] [説明] 1 byte[3] code 3 bytes ASCIIコード (例: 'A','\0','\0')(※) 2 int16 x_pixel 2 bytes X方向ピクセル数 3 int16 y_pixel 2 bytes Y方向ピクセル数 4 uint16[ ] image (x_pixel+15)/16 * y_pixel *2 bytes イメージデータ ... 繰り返し (※)最大3文字までのつながった文字パターンの表現に対応する。(例: 'f','f','i')
JDB形式フォーマット (*.jdb)
[type] [name] [size] [説明] 1 uint16 code 2 bytes SHIFT-JISコード 2 int16 x_pixel 2 bytes X方向ピクセル数 3 int16 y_pixel 2 bytes Y方向ピクセル数 4 uint16[ ] image (x_pixel+15)/16 * y_pixel *2 bytes イメージデータ ... 繰り返し
各値は little endian 形式で格納されている。イメージデータは 1bit が 1pixel に対応する。0を背景、1を前景とする。座標は左上オリジンとする。座標 (j, i) は image[(x_pixel+15)/16*i+j/16] の 第j%16ビットに対応する。右側余白部分のビットは必ず 0 が格納される。
サンプルコード
ファイルを読み込むプログラムのサンプルコードです。 sample1.c
補足事項
連絡先
リンク