情報に関する理論(全53問中20問目)

UTF-8の説明に関する記述として,適切なものはどれか。

出典:平成29年秋期 問 4

  • 1文字を1バイトから4バイト(又は6バイト)までの可変長で表現しており,ASCIIと上位互換性がある。
  • 2バイトで表現する領域に収まらない文字は,上位サロゲートと下位サロゲートを組み合わせて4バイトで表現する。
  • ASCII文字だけを使用することが前提の電子メールで利用するために,7ビットで表現する。
  • 各符号位置が4バイトの固定長で表現される符号化形式である。
正解 問題へ
分野:テクノロジ系
中分類:基礎理論
小分類:情報に関する理論
解説
UTF-8は、ASCIIと同じ文字は1バイト、その他の文字については2~6バイトを用いて世界中の文字を表現する文字符号化形式です。ASCIIの上位互換であるため、従来のシステムとの親和性が高く、またASCII主体のテキストであればデータ量をそれほど増加させずに多言語対応の恩恵を受けられる利点があります。UTF-8は世界中で使用されていますが、特にWebページを記述する際の文字コードとしてはスタンダードと呼ばれるほど普及しています。
UTF-8は可変長なので先頭のビット"1"が連続する個数で、その文字のバイト数がわかるようになっています。なお漢字を含む日本語の文字は3バイトで表現されます。
  • 正しい。UTF-8の説明です。
  • 1文字を2バイトで符号化するUTF-16(UCS-2)の説明です。
  • UTF-7の説明です。
  • 1文字を4バイトで符号化するUTF-32(UCS-4)の説明です。

Pagetop