文字コード
コンピューターの内部は0と1のみで表現されているのにもかかわらず、文字を扱うことが出来るのは文字の一つ一つに「文字コード」という特定の2進数が割り当てらているためです。
代表的な文字コード
文字コードには「シフトJIS」「ASCIIコード」「ECUコード」などの様々な種類がある。
ASCIIコード
「American Standard Code for Information Interchange」ANSI(米国標準規格協会)で定められ、7ビットと検査用冗長ビット1ビットで表す。
ASCIIコードは米国標準で英字、数字、特殊文字および制御文字
EBCDIC
「Extended Binary Coded Decimal Interchange Code」8ビットからなる文字コード
EBCDICはIBM社が開発し汎用機を中心に普及
JISコード
「Japan Industrial Standard」日本工業規格。ローマ字用7単位符号やローマ字・片仮名用8単位符号やJIS漢字コードがある。
JISコードはひらがなや漢字は1文字を2バイトで表現
シフトJISコード
JIS漢字コードを変換したもので、1バイト目で漢字かどうかを判別し、英数字・カナなどと混同が可能。
シフトJISコードは日本のパソコンの標準文字コードで1バイト文字と2バイト文字の混在が可能
ECU
「Extended Unix Code」UNIXにおける多言語対応の一環として制定された。
ECUは拡張UNIXコードでUNIX上で漢字が扱える
UNICODE
各国の言語のデータ交換が円滑に出来る様に制定された。