令和3年春期試験問題 午前問31
問31解説へ
データレイクの特徴はどれか。
- 大量のデータを分析し,単なる検索だけでは分からない隠れた規則や相関関係を見つけ出す。
- データウェアハウスに格納されたデータから特定の用途に必要なデータだけを取り出し,構築する。
- データウェアハウスやデータマートからデータを取り出し,多次元分析を行う。
- 必要に応じて加工するために,データを発生したままの形で格納する。
広告
解説
データレイク(Data Lake)とは、川の流れのように絶えず流れ込んでくる多種多様な生データを、その規模にかかわらず、本来のフォーマットのまま蓄積しておく巨大な"貯水湖"です。蓄積するデータの生成元には、Webサイトやソーシャルメディア、モバイルアプリ及びIoTデバイスなどを含みます。
蓄積されたデータは、機械学習、予測分析、データ検出、プロファイリングなどに役立てられますが、どのように使用するかは基本的に利用者に任せられています。収集する範囲を決めずにそのままのデータが一元的に管理されているため、分析の際に求めるデータが不足したり、他システムから寄せ集めたりといった問題がなくなります。
蓄積されたデータは、機械学習、予測分析、データ検出、プロファイリングなどに役立てられますが、どのように使用するかは基本的に利用者に任せられています。収集する範囲を決めずにそのままのデータが一元的に管理されているため、分析の際に求めるデータが不足したり、他システムから寄せ集めたりといった問題がなくなります。
- データマイニングの説明です。
- データマートの説明です。
- OLAP(Online Analytical Processing)の説明です。
- 正しい。データレイクの説明です。
広告