|
メーラー |
電子メールを送受信したり画面に表示したりするソフトです。
例えば アウトルック とか ユードラ とかいろいろあります。 |
|
|
|
ビット |
1ビットは「オン」と「オフ」の状態のみもてるデジタル情報の最小単位です。
これを集めてたくさんの情報を表現できます。 |
|
|
|
バイト |
8ビットを一まとめにしたものです。256通りの状態を表現できます。
電子メールで英文をやり取りする時の1文字は1バイトになります。
しかし、過去からのしがらみ(*1)で8ビットのうち7ビット分のみ使用する事が取り決められています。
ということで電子メールでは1文字1バイトといっても256の半分の128通りの状態しか使いません。
でもこれだけあれば、数字、アルファベットの大文字小文字、何種類かの記号、といった表示できる文字(95個)と
「行送り」などを表わす制御用のコード(33個)を表現する事ができます。
日本のプロバイダでは8ビット全て通すようになっているところがほとんどだと思いますが、
確認したわけでは有りません。 |
|
|
|
2バイト文字 |
日本語の文字(特に漢字)を表現する場合、6000文字以上の漢字を表現できなければ行けません。
ところが1バイトでは6000もの文字を表現できないので2バイトでこれを表現しています。
当然この2バイトは隣同士にいなければいけません。 |
|
|
全角
と
半角 |
2バイト文字で漢字が扱えるようになったのは良いのですが、 日本語の文字の中にも1バイトの文字を使いたいので、2バイト文字の置き方を工夫して、
両方の文字が混在してもこんがらがらないような規格を定義しています。
俗称として、2バイト文字を「全角」1バイト文字を「半角」と呼ぶ事が多いようです。
(ワープロに「全角」「半角」ボタンがあったのを思い出した人もいるでしょうね)
数字やアルファベットは2バイト文字にもあるので、
2バイト文字の 12345ABC と
1バイト文字の 123456ABC とを日本人は使い分けているわけですね。
そして、英語(1バイト文字)で書かれたメールが送られてきても読む事が出来るわけです。
本来は印刷に使う活字の大きさから来ている言葉らしいのですが、コンピュータ上でも便利な言葉として 使われています。本ページでも使っています。 |
|
|
|
JISコード |
日本語の文字をいかに2バイトで表現するかを決めています。
過去からのしがらみに対応していて、2バイトの両方のバイトは7ビットづつしか使っていません。
電子メールでやり取りされる漢字情報は主にこのコードを使っています。
このJISコードというのも実はあいまいな言葉で複数の規格の総称になるのでしょう。
「ISO-2022-JP」が代表となる規格名だと思います。 |
|
|
|
シフトJIS |
日本語の文字で2バイトで表現するための別の方法です。
Windowsは従来からこの方式を日本語文字列の格納用に使っていました。
8ビット全部を使って効率よくデータを扱えるようにしました。 したがって、このコードを使って電子メールとしてPCから送り出すと、中継システムが上手く中継できない場合があり文字化けになります。
このため、通常Windowsのメールソフトの場合、プログラムの中でシフトJISからJISコードへの変換が自動的に行われます。 |
|
|
|
EUC |
日本語の文字で2バイトで表現するための別の方法です。
このコードにて日本語文字列を格納しているコンピュータが有ります。
これも8ビット全部使っています。 |
|
|
ユニコード
(UNICODE) |
これは全世界の文字を表現しようとしているコード体系です。
このコード体系の中に日本の漢字も含まれています。 |
|
|
|
エスケープシーケンス |
JISコードで半角と全角が混在する場合に互いの切り替わるところで、「ここから全角」「ここから半角」 という意味の特別なコードを挟みます。このコードは3バイト程度のもので「ここから中国語」といったようなものも表現するため、たくさんの種類が
有りますが、これをエスケープシーケンスと呼びます。日本語のメールに限ってしまえば多くありません。 詳しくは漢字コードの話(配島誠様作成)を参照してください。
先頭の1バイトがESCという制御用のコード(33個の中の一つ)なのでこのように呼ばれているようです。 シフトJISとEUCは半角で使用していない8ビット目を使っているのでエスケープシーケンスは必要ありません。 |
|
|
|
MIME |
「マイム」と読みます。電子メールの中に画像だとか、MP3だとかを添付する方法の一つです。
表示可能な文字(95個)だけを使って画像等のファイルを表現します。(したがってもとのデータサイズよりも長くなります)
最近のメーラーは確実に対応しているので送る時もMIME指定を「オン」にした方が良いでしょう。
あまり文字化けがひどいのなら、日本語のテキストファイルを添付して送るというのも手です。 |
|
|
|
UTF−8 UTF−7 |
ユニコードと半角の混在ができるようにする方法の一つです。
UTF−8はユニコードの部分を表わすために1バイトの8ビット目を使用しているためメールにこれを用いるのは適当ではありません。
しかし、マイクロソフトのアウトルックエクスプレスではUTF-8のフォーマットでメールが送出できるため、 文字化けメールが発生する理由の一つにもなっています。
UTF−7は1バイトの8ビット目を使用しないようにしていますので、原理的に文字化けは起きないとおもわれますが、これに対応していないメイラにこの形式で送り付けると、受け側は文字化けになってしまいます。
漢字コードにはユニコードを使うので人気がなくマイナーな存在になっています。 |
|
|
|
半角のカナ |
8ビットで表現できる256文字のうち、128文字しか使わないと書きましたが、JISの8ビットのコード体系では、残りの128文字を使って主にカタカナを定義しています。Windowsでも使用可能です。
この部分、ヨーロッパなどでは、最初の128文字にない、ウムラウトの付いた文字など各国独自の文字を定義しています。 |
|
|
|
Base64 |
MIMEで採用されました、バイナリの情報をメールに載せる時に使用されるコード変換方式です。
日本語をメールのタイトルに使った場合、漢字の部分がこのBase64という形に変換されてしまう場合が有ります。 |
|
|