基本ラテン文字 (Unicodeのブロック)
基本ラテン文字 | |
---|---|
C0 Controls and Basic Latin | |
範囲 |
U+0000..U+007F (128 個の符号位置) |
面 | 基本多言語面 |
用字 |
ラテン文字(52文字) Common(76文字) |
記号集合 |
アラビア数字 約物 |
主な言語・文字体系 |
英語 フランス語 スペイン語 ドイツ語 ベトナム語 |
割当済 |
128 個の符号位置 33 個の制御文字または書式文字 |
未使用 | 0 個の保留 |
元となった標準規格 | ISO/IEC 8859, ISO 646 |
Unicodeのバージョン履歴 | |
1.0.0 | 128 (+128) |
公式ページ | |
コード表 ∣ ウェブページ | |
備考: [1][2] |
基本ラテン文字(きほんラテンもじ、英語: Basic Latin)は、Unicodeの1つ目のブロックである。ASCII文字コードの全ての文字(基本ラテン文字と制御文字)が、同じ順番・同じコードで収録されている。C0制御文字及び基本ラテン文字(C0 Controls and Basic Latin)ともいう。UTF-8において、収録されたキャラクタが1バイトで表現できる唯一のブロックである。
基本ラテン文字ブロックはUnicode バージョン1.0.0から最新のバージョンまでの全てに含まれ、その間文字の追加・変更が行われていない[3]。
収録文字
[編集]コード | 文字 | 文字名(英語) | 説明 | 略号 |
---|---|---|---|---|
C0制御文字 | ||||
U+0000 | Null character | ヌル文字 | NUL | |
U+0001 | Start of Heading | ヘッディング開始 | SOH | |
U+0002 | Start of Text | テキスト開始 | STX | |
U+0003 | End-of-text character | テキスト終結 | ETX | |
U+0004 | End-of-transmission character | 伝送終了 | EOT | |
U+0005 | Enquiry character | 問い合わせ文字 | ENQ | |
U+0006 | Acknowledge character | 肯定応答文字 | ACK | |
U+0007 | Bell character | ベル文字 | BEL | |
U+0008 | Backspace | 後退 | BS | |
U+0009 | Horizontal tab | 水平タブ | HT | |
U+000A | Line feed | 改行 | LF | |
U+000B | Vertical tab | 垂直タブ | VT | |
U+000C | Form feed | 書式送り | FF | |
U+000D | Carriage return | 復帰 | CR | |
U+000E | Shift Out | シフトアウト | SO | |
U+000F | Shift In | シフトイン | SI | |
U+0010 | Data Link Escape | 伝送制御拡張 | DLE | |
U+0011 | Device Control 1 | 装置制御1 | DC1 | |
U+0012 | Device Control 2 | 装置制御2 | DC2 | |
U+0013 | Device Control 3 | 装置制御3 | DC3 | |
U+0014 | Device Control 4 | 装置制御4 | DC4 | |
U+0015 | Negative-acknowledge character | 否定応答 | NAK | |
U+0016 | Synchronous Idle | 同期文字 | SYN | |
U+0017 | End of Transmission Block | 伝送ブロック終結 | ETB | |
U+0018 | Cancel character | キャンセル文字 | CAN | |
U+0019 | End of Medium | 媒体終結 | EM | |
U+001A | Substitute character | 置換文字 | SUB | |
U+001B | Escape character | エスケープ文字 | ESC | |
U+001C | File Separator | ファイル分離文字 | FS | |
U+001D | Group Separator | グループ分離文字 | GS | |
U+001E | Record Separator | レコード分離文字 | RS | |
U+001F | Unit Separator | ユニット分離文字 | US | |
ASCIIの約物と記号 | ||||
U+0020 | Space | スペース | SP | |
U+0021 | ! | Exclamation mark | 感嘆符 | |
U+0022 | " | Quotation mark | 引用符 | |
U+0023 | # | Number sign | 番号記号 | |
U+0024 | $ | Dollar sign | ドル記号 | |
U+0025 | % | Percent sign | パーセント記号 | |
U+0026 | & | Ampersand | アンパサンド | |
U+0027 | ' | Apostrophe | アポストロフィー | |
U+0028 | ( | Left parenthesis | 開き丸括弧 | |
U+0029 | ) | Right parenthesis | 閉じ丸括弧 | |
U+002A | * | Asterisk | アスタリスク | |
U+002B | + | Plus sign | プラス記号 | |
U+002C | , | Comma | コンマ | |
U+002D | - | Hyphen-minus | ハイフンマイナス | |
U+002E | . | Full stop or period | 終止符 | |
U+002F | / | Solidus or Slash | スラッシュ | |
ASCIIの数字 | ||||
U+0030 | 0 | Digit Zero | 0 | |
U+0031 | 1 | Digit One | 1 | |
U+0032 | 2 | Digit Two | 2 | |
U+0033 | 3 | Digit Three | 3 | |
U+0034 | 4 | Digit Four | 4 | |
U+0035 | 5 | Digit Five | 5 | |
U+0036 | 6 | Digit Six | 6 | |
U+0037 | 7 | Digit Seven | 7 | |
U+0038 | 8 | Digit Eight | 8 | |
U+0039 | 9 | Digit Nine | 9 | |
ASCIIの約物と記号 | ||||
U+003A | : | Colon | コロン | |
U+003B | ; | Semicolon | セミコロン | |
U+003C | < | Less-than sign | 不等号(より小) | |
U+003D | = | Equal sign | 等号 | |
U+003E | > | Greater-than sign | 不等号(より大) | |
U+003F | ? | Question mark | 疑問符 | |
U+0040 | @ | At sign or Commercial at | 単価記号 | |
大文字のラテン文字 | ||||
U+0041 | A | Latin Capital letter A | ラテン文字の大文字のA | |
U+0042 | B | Latin Capital letter B | ラテン文字の大文字のB | |
U+0043 | C | Latin Capital letter C | ラテン文字の大文字のC | |
U+0044 | D | Latin Capital letter D | ラテン文字の大文字のD | |
U+0045 | E | Latin Capital letter E | ラテン文字の大文字のE | |
U+0046 | F | Latin Capital letter F | ラテン文字の大文字のF | |
U+0047 | G | Latin Capital letter G | ラテン文字の大文字のG | |
U+0048 | H | Latin Capital letter H | ラテン文字の大文字のH | |
U+0049 | I | Latin Capital letter I | ラテン文字の大文字のI | |
U+004A | J | Latin Capital letter J | ラテン文字の大文字のJ | |
U+004B | K | Latin Capital letter K | ラテン文字の大文字のK | |
U+004C | L | Latin Capital letter L | ラテン文字の大文字のL | |
U+004D | M | Latin Capital letter M | ラテン文字の大文字のM | |
U+004E | N | Latin Capital letter N | ラテン文字の大文字のN | |
U+004F | O | Latin Capital letter O | ラテン文字の大文字のO | |
U+0050 | P | Latin Capital letter P | ラテン文字の大文字のP | |
U+0051 | Q | Latin Capital letter Q | ラテン文字の大文字のQ | |
U+0052 | R | Latin Capital letter R | ラテン文字の大文字のR | |
U+0053 | S | Latin Capital letter S | ラテン文字の大文字のS | |
U+0054 | T | Latin Capital letter T | ラテン文字の大文字のT | |
U+0055 | U | Latin Capital letter U | ラテン文字の大文字のU | |
U+0056 | V | Latin Capital letter V | ラテン文字の大文字のV | |
U+0057 | W | Latin Capital letter W | ラテン文字の大文字のW | |
U+0058 | X | Latin Capital letter X | ラテン文字の大文字のX | |
U+0059 | Y | Latin Capital letter Y | ラテン文字の大文字のY | |
U+005A | Z | Latin Capital letter Z | ラテン文字の大文字のZ | |
ASCIIの約物と記号 | ||||
U+005B | [ | Left Square Bracket | 開き角括弧 | |
U+005C | \ | Backslash | バックスラッシュ [A] | |
U+005D | ] | Right Square Bracket | 閉じき角括弧 | |
U+005E | ^ | Circumflex accent | サーカムフレックス | |
U+005F | _ | Low line | アンダースコア | |
U+0060 | ` | Grave accent | グレイヴ・アクセント | |
小文字のラテン文字 | ||||
U+0061 | a | Latin Small Letter A | ラテン文字の小文字のA | |
U+0062 | b | Latin Small Letter B | ラテン文字の小文字のB | |
U+0063 | c | Latin Small Letter C | ラテン文字の小文字のC | |
U+0064 | d | Latin Small Letter D | ラテン文字の小文字のD | |
U+0065 | e | Latin Small Letter E | ラテン文字の小文字のE | |
U+0066 | f | Latin Small Letter F | ラテン文字の小文字のF | |
U+0067 | g | Latin Small Letter G | ラテン文字の小文字のG | |
U+0068 | h | Latin Small Letter H | ラテン文字の小文字のH | |
U+0069 | i | Latin Small Letter I | ラテン文字の小文字のI | |
U+006A | j | Latin Small Letter J | ラテン文字の小文字のJ | |
U+006B | k | Latin Small Letter K | ラテン文字の小文字のK | |
U+006C | l | Latin Small Letter L | ラテン文字の小文字のL | |
U+006D | m | Latin Small Letter M | ラテン文字の小文字のM | |
U+006E | n | Latin Small Letter N | ラテン文字の小文字のN | |
U+006F | o | Latin Small Letter O | ラテン文字の小文字のO | |
U+0070 | p | Latin Small Letter P | ラテン文字の小文字のP | |
U+0071 | q | Latin Small Letter Q | ラテン文字の小文字のQ | |
U+0072 | r | Latin Small Letter R | ラテン文字の小文字のR | |
U+0073 | s | Latin Small Letter S | ラテン文字の小文字のS | |
U+0074 | t | Latin Small Letter T | ラテン文字の小文字のT | |
U+0075 | u | Latin Small Letter U | ラテン文字の小文字のU | |
U+0076 | v | Latin Small Letter V | ラテン文字の小文字のV | |
U+0077 | w | Latin Small Letter W | ラテン文字の小文字のW | |
U+0078 | x | Latin Small Letter X | ラテン文字の小文字のX | |
U+0079 | y | Latin Small Letter Y | ラテン文字の小文字のY | |
U+007A | z | Latin Small Letter Z | ラテン文字の小文字のZ | |
ASCIIの約物と記号 | ||||
U+007B | { | Left Curly Bracket | 開き中括弧 | |
U+007C | | | Vertical bar | バーティカルバー | |
U+007D | } | Right Curly Bracket | 閉じ中括弧 | |
U+007E | ~ | Tilde | チルダ | |
制御文字 | ||||
U+007F | Delete | 削除文字 | DEL |
小分類
[編集]このブロックには6つの小分類(subheading)がある[5] 。
C0制御文字
[編集]C0制御文字は、Unicodeバージョン1.0では「C0 ASCII制御文字(C0 ASCII control codes)」と呼ばれ、ASCIIや他の7ビット・8ビット文字コードから継承されている。英語の文字名はISO/IEC 6429:1992から取られている[5]。
ASCIIの約物と記号
[編集]この小分類には、英文における標準的な約物、単純な数学記号、ドル記号・パーセント・アンパサンド・アンダースコア・パイプなどの記号が含まれている[5]。
ASCIIの数字
[編集]この小分類には、1-9および0のアラビア数字が含まれている[5]。
大文字のラテン文字
[編集]この小分類には、標準的な26文字のアクセントのない大文字のラテン文字が含まれている[5]。
小文字のラテン文字
[編集]この小分類には、標準的な26文字のアクセントのない小文字のラテン文字が含まれている[5]。
制御文字
[編集]「制御文字」小分類には削除文字(DEL)のみが含まれている[5]。
文字コード表
[編集]C0制御文字及び基本ラテン文字(C0 Controls and Basic Latin)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+000x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
U+001x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
U+002x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
U+003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U+004x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
U+005x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
U+006x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
U+007x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
備考
|
絵文字
[編集]基本ラテン文字ブロックには、U+0023, U+002A, U+0030–U+0039の12文字の絵文字が含まれている[6][7]。これらは、U+20E3 ⃣ combining enclosing keycapと組み合わせて電話機の押しボタンを表す(例: #️⃣ (U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP) )
この12文字に対し2種類の異体字セレクタ、絵文字表示(U+FE0F VS16)かテキスト表示(U+FE0E VS15)が適用できる。いずれも、デフォルトはテキスト表示である[8]。
U+ | 0023 | 002A | 0030 | 0031 | 0032 | 0033 | 0034 | 0035 | 0036 | 0037 | 0038 | 0039 |
base code point | # | * | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
base+VS15 (text) | #︎ | *︎ | 0︎ | 1︎ | 2︎ | 3︎ | 4︎ | 5︎ | 6︎ | 7︎ | 8︎ | 9︎ |
base+VS16 (emoji) | #️ | *️ | 0️ | 1️ | 2️ | 3️ | 4️ | 5️ | 6️ | 7️ | 8️ | 9️ |
履歴
[編集]以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン | コードポイント[a] | 文字数 | L2 ID | WG2 ID | ドキュメント |
---|---|---|---|---|---|
1.0.0 | U+0000..007F | 128 | (to be determined) | ||
L2/04-145 | Starner, David (2004-04-30), C with stroke character examples from BAE report 1884 (Dorsey) | ||||
L2/04-202 | Anderson, Deborah (2004-06-07), Slashed C Feedback | ||||
L2/11-043 | Freytag, Asmus; Karlsson, Kent (2011-02-02), Proposal to correct mistakes and inconsistencies in certain property assignments for super and subscripted letters | ||||
L2/11-160 | PRI #181 Changing General Category of Twelve Characters, (2011-05-02) | ||||
L2/11-438[b][c] | N4182 | Edberg, Peter (2011-12-22), Emoji Variation Sequences (Revision of L2/11-429) | |||
L2/15-268 | Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30), Proposal to Represent the Slashed Zero Variant of Empty Set | ||||
L2/15-301[d][c] | Pournader, Roozbeh (2015-11-01), A proposal for 278 standardized variation sequences for emoji | ||||
関連項目
[編集]出典
[編集]- ^ “Unicode character database”. The Unicode Standard. 2016年7月9日閲覧。
- ^ “Enumerated Versions of The Unicode Standard”. The Unicode Standard. 2016年7月9日閲覧。
- ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc.. (1990). ISBN 0-201-56788-1
- ^ Sorting it all Out : When is a backslash not a backslash?
- ^ a b c d e f g “Unicode 6.2 code charts”. The Unicode Standard. 1 April 2013閲覧。
- ^ “UTR #51: Unicode Emoji”. Unicode Consortium (2016年11月22日). 2016年12月16日閲覧。
- ^ “UCD: Emoji Data for UTR #51”. Unicode Consortium (2016年11月14日). 2016年12月16日閲覧。
- ^ “Unicode Character Database: Standardized Variation Sequences”. The Unicode Consortium. 2016年12月16日閲覧。