全角文字と￥記号

: 参考: 正規表現 : 文字コード : 参考: 漢字コードと ISO2022 目次索引

全角文字と￥記号

メモ帳などのエディタで 1 をそのまま入力した場合と, 1 を入力したあとかな漢字変換してでてくる１では異なることがわかるであろうか？

1 １

上で, 前者の 1 が半角の 1, 後者の１が全角の 1 である.

練習 4.6 半角の 1, 後者の１が全角の 1 を Emacs で入力してみて, Emacs の上でカーソルを移動していくと, 点滅しているカーソルの大きさが全角と半角で異なることをたしかめよ. また全角の 1 は半角の 1 の 2 倍の文字幅をもつことをたしかめよ.

半角の 1 と全角の 1 はことなる文字であり, 対応する文字コードは半角 1 に対してはアスキーコードの 31H, 全角 1 には JIS 漢字コードの 23H 31H が対応している. なお, 23H 31H はEUC コードでは A3H B1H, Shift JIS コードでは 82H 50H である. アスキーコード表にある英数字や多くの特殊記号には対応する文字の全角版が JIS 漢字コードに存在している. これらは対応するアスキー文字とはことなるものである. したがってたとえば, 電子メールアドレス hoge@math.kobe-u.ac.jp を全角文字でｈｏｇｅ＠ｍａｔｈ．ｋｏｂｅ－ｕ．ａｃ．ｊｐと書くとアドレスエラーになるし, プログラムを全角文字でかくともちろんエラーになる. 空白文字にも半角空白 (アスキーコードの 20H) と全角空白 (JIS コードの 21H 21H) があり時々トラブルの原因になる.

JIS X0201 規格は日本の文字コードの基本である. LR 領域に対応する方はアスキーコードとほぼ同一であるが, アスキーコードの $\backslash$ が JIS X0201 では￥記号になっている. C 言語や TeX の教科書で同じものに対して, $\backslash$ と￥両方の書き方があるのはそのせいである.

Nobuki Takayama 平成15年12月5日