平成31年春期試験問題 午前問29

平成31年春期試験問題　午前問29

ビッグデータのデータ貯蔵場所であるデータレイクの特徴として，適切なものはどれか。

あらゆるデータをそのままの形式や構造で格納しておく。
データ量を抑えるために，データの記述情報であるメタデータは格納しない。
データを格納する前にデータ利用方法を設計し，それに沿ってスキーマをあらかじめ定義しておく。
テキストファイルやバイナリデータなど，格納するデータの形式に応じてリポジトリを使い分ける。

分野：テクノロジ系
中分類：データベース
小分類：データベース応用

解説

データレイク(Data Lake)とは、川の流れのように絶えず流れ込んでくる多種多様な生データを、その規模にかかわらず、本来のフォーマットのまま蓄積しておく巨大な"貯水湖"です。蓄積するデータの生成元には、Webサイトやソーシャルメディア、モバイルアプリ及びIoTデバイスなどを含みます。
蓄積されたデータは、機械学習、予測分析、データ検出、プロファイリングなどに役立てられますが、どのように使用するかは基本的に利用者に任せられています。収集する範囲を決めずにそのままのデータが一元的に管理されているため、分析の際に求めるデータが不足したり、他システムから寄せ集めたりといった問題がなくなります。

正しい。データレイクは、規模や種類にかかわらず、どのようなデータでもそのまま保存できるリポジトリです。
本来のフォーマットのまま保存します。
事前に用途や目的が決まっているわけではないので、データモデルは定義しません。
多種多様なデータが単一のデータレイクに混在して保存されます。

平成31年春期試験問題 午前問29

前の問題次の問題

平成31年春期試験問題　午前問29