BIRDS character pattern database (English page)


BIRDS文字パターンデータベース

BIRDS文字パターンデータベースとは

株式会社バーズ情報科学研究所によって収集された、手書き文字(数字、記号、アルファベット、カタカナ)、印刷活字各種フォント(日本語JIS第1・第2、英字)の画像を格納したデーベースです。

利用条件

このデータベースのご利用に当たっては添付されている使用許諾条件をお読みください。

ダウンロード

BIRDS−1: BIRDS-1.zip (手書き文字英数カナ, 178,000 patterns, 15,461,258 bytes)

BIRDS−2: BIRDS-2.zip (手書き文字数字, 202,958 patterns, 19,287,880 bytes)

BIRDS−3: BIRDS-3.zip (印刷文字日本語, 992,593 patterns, 101,544,721 bytes)

BIRDS−4: BIRDS-4.zip (印刷文字欧文, 324,494 patterns, 13,311,227 bytes)

ファイルフォーマット

CDB形式フォーマット (*.cdb)

   [type]     [name]    [size]                              [説明]
1  byte[3]    code     3 bytes                             ASCIIコード (例: 'A','\0','\0')(※)
2  int16      x_pixel  2 bytes                             X方向ピクセル数
3  int16      y_pixel  2 bytes                             Y方向ピクセル数
4  uint16[ ]  image    (x_pixel+15)/16 * y_pixel *2 bytes イメージデータ
... 繰り返し

(※)最大3文字までのつながった文字パターンの表現に対応する。(例: 'f','f','i')

JDB形式フォーマット (*.jdb)

   [type]     [name]    [size]                              [説明]
1  uint16     code     2 bytes                             SHIFT-JISコード
2  int16      x_pixel  2 bytes                             X方向ピクセル数
3  int16      y_pixel  2 bytes                             Y方向ピクセル数
4  uint16[ ]  image    (x_pixel+15)/16 * y_pixel *2 bytes  イメージデータ
... 繰り返し

各値は little endian 形式で格納されている。イメージデータは 1bit が 1pixel に対応する。0を背景、1を前景とする。座標は左上オリジンとする。座標 (j, i) は image[(x_pixel+15)/16*i+j/16] の 第j%16ビットに対応する。右側余白部分のビットは必ず 0 が格納される。

サンプルコード

ファイルを読み込むプログラムのサンプルコードです。 sample1.c

補足事項

連絡先

リンク