日本で一般的に使用される1バイト文字集合。正式名称は「7ビット及び8ビットの情報交換用符号化文字集合」。俗称、半角文字。
ASCII文字集合をベースにしたラテン文字用図形文字集合と片仮名用図形文字集合のふたつの文字集合で構成される。ラテン文字用図形文字集合はISO/IEC 646のJP版と一致する。
8ビット符号(8bit encoding)では0x21から0x7Eにラテン文字を、0xA1から0xFEに片仮名を割り当てる。7ビット符号(7bit encoding)では0x21から0x7Eの領域を、SHIFT-INと SHIFT-OUTでラテン文字と片仮名を切り替えながら使用する。
また、一般的な実装では、JIS X 0211(ISO/IEC 6429) 制御文字集合の中の0x00~0x1F,0x20,0x7Fと組み合わせて使われる。(※0x20のスペースはJIS X 0201には含まれていない)
8bit encodingとJIS X 0211との組合せによる一般的な実装
0x | 1x | 2x | 3x | 4x | 5x | 6x | 7x | 8x | 9x | Ax | Bx | Cx | Dx | Ex | Fx | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | NUL | DLE | SPC | 0 | @ | P | ` | p | 未使用 | ー | タ | ミ | 未使用 | |||
x1 | SOH | DC1 | ! | 1 | A | Q | a | q | 。 | ア | チ | ム | ||||
x2 | STX | DC2 | " | 2 | B | R | b | r | 「 | イ | ツ | メ | ||||
x3 | ETX | DC3 | # | 3 | C | S | c | s | 」 | ウ | テ | モ | ||||
x4 | EOT | DC4 | $ | 4 | D | T | d | t | 、 | エ | ト | ヤ | ||||
x5 | ENQ | NAK | % | 5 | E | U | e | u | ・ | オ | ナ | ユ | ||||
x6 | ACK | SYN | & | 6 | F | V | f | v | ヲ | カ | ニ | ヨ | ||||
x7 | BEL | ETB | ' | 7 | G | W | g | w | ァ | キ | ヌ | ラ | ||||
x8 | BS | CAN | ( | 8 | H | X | h | x | ィ | ク | ネ | リ | ||||
x9 | HT | EM | ) | 9 | I | Y | i | y | ゥ | ケ | ノ | ル | ||||
xA | LF | SUB | * | : | J | Z | j | z | ェ | コ | ハ | レ | ||||
xB | VT | ESC | + | ; | K | [ | k | { | ォ | サ | ヒ | ロ | ||||
xC | FF | FS | , | < | L | \ | l | | | ャ | シ | フ | ワ | ||||
xD | CR | GS | - | = | M | ] | m | } | ュ | ス | ヘ | ン | ||||
xE | SO | RS | . | > | N | ^ | n | ~ | ョ | セ | ホ | ゙ | ||||
xF | SI | US | / | ? | O | _ | o | DEL | ッ | ソ | マ | ゚ |