JISで規格化された情報交換用符号系コードの名称.
JISコードでは,数字,英文字,カタカナ,各種記号,機能文字など256種類が8bitコードとしてJIS X 0201で決められている.
漢字コードについては,情報交換用漢字符号系としてJIS X 0208で制定されており,第一水準として漢字2965文字,ひらがな83文字,カタカナ86文字,数字10文字,英字52文字,特殊記号147文字,ギリシャ文字48文字,ロシア文字66文字,罫線文字32文字の合計3489字,第二水準として部首字形を含めた3388文字,このほか補助漢字として5801文字が決められている.
拡張UNIXコード.主にUNIXシステムでのアジア言語サポートとして採用されているコードセット.
MS-DOSなどの日本語環境で広く利用されている日本語文字コード系の通称. MS-DOSを日本語化する際に考案されたといわれており,MS漢字コードなどと呼ばれることもある.それまでのJIS漢字コード(JIS X0208コード)では,1byteで表現されるアルファベットや数字と2byteで表現される漢字などの文字とを違う文字セットとしており,文字セットの切替のために特別なシフトコード(俗称漢字イン,漢字アウト)を必要とする.この方法では,文字セットの切り替えが頻繁に起こる場合には無駄が多くなる.また,文字列途中のある文字が漢字かどうかを判断するためには,文字列の先頭からスキャンしてシフト状態を正確に把握する必要があり,文字列操作が繁雑になるという欠点がある.特に,当時のコンピュータ環境は16bit CPUへの切り替え時期でもあり,非力なコンピュータを実用化するために余計なオーバーヘッドを極力避けたいという希望もあったと思われる. そこでShift JISコードでは,JIS X0208コード体系(いわゆる1byteコード)のすき間を利用して,本来JIS X0208コードで未使用となっている領域のコード(特定のbitがセットされたbyteデータ)があったときには,そのbyteデータと次のbyteデータを2bytesコードとして処理できるように,JIS X0208のコードマッピングをそのままシフトしている.この結果,シフト状態という概念を排除し,文字の1byte目のデータを見るだけで1byteコードと2bytes漢字コードとの区別ができるようになった. また,MS-DOSなどでは固定幅フォントを長く使用しており,このフォントでは漢字などの2bytesキャラクタは1byte文字の2倍の横幅を持つように設定されていた.そのため,Shift JISコードでこうしたフォントを使用した場合には文字列のバイト数を数えるだけでキャラクタ画面のカラム数を知ることができるという副次的効果が生まれ,プログラムでの文字列操作がより簡単になった.こうしたメリットがあったために,Shift JISは標準的な日本語コード系としてパーソナルコンピュータ市場で中心的に使用されてきたが,2bytesコードの1byte目を特別なコードに限定するというトリッキーな仕様のせいもあってコードスペースを拡張することはほとんど不可能である.このためWindows NTなどでは新しい国際化2bytesコード系であるUnicodeが採用されている.
単一の2bytesの文字コードによって世界の文字の多くを表現しようとする文字コードシステム.中国語でも日本語でも,同一とみなしうる漢字には同じコードを割り当てるなどのUnificationを行なっている.
Windows NTでは,国際化に対応するため,標準でUnicodeサポートが追加されている.またWindows 95で採用されたLongFilename FATでは,ロングファイル名の保存にこのUnicodeを使用している.