Unicode

多国語対応文字セットとして業界団体からなるユニコードコンソーシアムから提案された21ビット(0x0000 ~ 0x10FFFF、U+0000~U+10FFFF と記述する)の文字集合。Unicodeそのままが使われることはなく、UTF-7,UTF-8などでエンコードされて使用される。

Unicode 1.0の16ビットの領域であるU+0000~U+FFFFは、Unicode 2.0以降では基本多言語面(BMP=Basic Multilingual Plane)と呼ばれる。

UCS2

ISO/IEC10646で定められた16bit(0x0000~0xFFFF)の文字集合。紆余曲折があったが、現在はUnicodeはBMPと同一のものになっている。Unicodeと同様、UTF-7,UTF-8などでエンコードされて使用される。

UCS4

ISO/IEC10646で定められた31bit(0x0000~0x7FFFFFFF)の文字集合。紆余曲折があったが、Unicodeで使用できない0x110000以降のコードは、永遠に使用されないと定義され、現在はUnicodeと同一のものになっている。Unicodeと同様、UTF-7,UTF-8などでエンコードされて使用される。

Unicode表を表示