データベース応用(全24問中18問目)
No.18解説へ
データウェアハウスを構築するために,業務システムごとに異なっているデータ属性やコード体系を統一する処理はどれか。
出典:平成22年秋期 問28
- ダイス
- データクレンジング
- ドリルダウン
- ロールアップ
広告
解説
データウェアハウスを構築する際に使用される元データは、仕様の異なる様々なシステムに蓄積されていた形式がバラバラなデータ群であり、このままではデータマイニングなどの解析で使用することができません。
この生データを解析で使用できるようにするために行われるのが、データクレンジング(=洗浄)です。データクレンジングの作業で、データ形式の統一、欠損値の補完、単位の統一、異常値の処理などの処理をされたデータによってデータウェアハウスは構築されます。
※多次元データベースとは、エンドユーザーが直接にデータベースを検索加工して問題発見をしたり問題解決をする分析を主とする利用目的のために適しているとされるデータベース。例えば月別・商品別の売上データを横に月,縦に商品をとれば2次元の表になります。月別・商品別に支店別を加えた売上データは3次元の表になります。さらに月別・商品別・支店別で売上,原価,利益のような会計区分を加えれば4次元になるというように表の次元は増大する。このような表の形式にしたものを多次元データベースといいます。
参考リンク
この生データを解析で使用できるようにするために行われるのが、データクレンジング(=洗浄)です。データクレンジングの作業で、データ形式の統一、欠損値の補完、単位の統一、異常値の処理などの処理をされたデータによってデータウェアハウスは構築されます。
- ダイスとはサイコロのことで、多次元データベースの中から縦軸と横軸を指定して2次元の表にする操作を指します。3次元であるサイコロを振ると見えている面が変わるように、縦横の項目を変えて多次元データのまったく違う面を表にする機能のことです。
- 正しい。
- 多次元データベースにおいて、詳細に展開する操作を指します。(例 :四半期集計データから月集計データに移ること)
逆に集計レベルを高く(広く)する操作をドリルアップといいます。 - 多次元データベースにおいて、集計レベルを高くする操作を指します。(例 :集計単位を1カ月→1年)
ドリルダウンの反対なので、ドリルアップとも呼ばれます。
※多次元データベースとは、エンドユーザーが直接にデータベースを検索加工して問題発見をしたり問題解決をする分析を主とする利用目的のために適しているとされるデータベース。例えば月別・商品別の売上データを横に月,縦に商品をとれば2次元の表になります。月別・商品別に支店別を加えた売上データは3次元の表になります。さらに月別・商品別・支店別で売上,原価,利益のような会計区分を加えれば4次元になるというように表の次元は増大する。このような表の形式にしたものを多次元データベースといいます。
参考リンク
広告