next up previous contents index
: 参考: 正規表現 : 文字コード : 参考: 漢字コードと ISO2022   目次   索引

全角文字と¥記号

メモ帳などのエディタで 1 をそのまま入力した場合と, 1 を入力したあとかな漢字変換してでてくる 1 では 異なることがわかるであろうか?

1 1
上で, 前者の 1 が半角の 1, 後者の 1 が全角の 1 である.

練習 4.6   半角の 1, 後者の 1 が全角の 1 を Emacs で入力してみて, Emacs の上でカーソルを移動していくと, 点滅している カーソルの大きさが全角と半角で異なることをたしかめよ. また全角の 1 は半角の 1 の 2 倍の文字幅をもつことをたしかめよ.

半角の 1 と全角の 1 はことなる文字であり, 対応する文字コードは 半角 1 に対してはアスキーコードの 31H, 全角 1 には JIS 漢字コードの 23H 31H が 対応している. なお, 23H 31H はEUC コードでは A3H B1H, Shift JIS コードでは 82H 50H である. アスキーコード表にある英数字や多くの特殊記号には対応する文字の 全角版が JIS 漢字コードに存在している. これらは対応するアスキー文字とはことなるものである. したがってたとえば, 電子メールアドレス hoge@math.kobe-u.ac.jp を全角文字で hoge@math.kobe−u.ac.jp と書くとアドレスエラーになるし, プログラムを全角文字でかくともちろんエラーになる. 空白文字にも半角空白 (アスキーコードの 20H) と 全角空白 (JIS コードの 21H 21H) があり時々 トラブルの原因になる.

JIS X0201 規格は日本の文字コードの基本である. LR 領域に対応する方はアスキーコードとほぼ同一であるが, アスキーコードの $\backslash$ が JIS X0201 では ¥ 記号に なっている. C 言語や TeX の教科書で同じものに対して, $\backslash$ と ¥ 両方の書き方があるのはそのせいである.



Nobuki Takayama 平成15年12月5日