OLAPとは

備忘録のため。

OLAP(online analytical processing) − @IT情報マネジメント用語事典
オーラップ / オンライン分析処理 / 多次元分析処理
 膨大なデータを分析して何らかの問題点や因果関係を発見しようというとき、エンドユーザーでも対話的に試行錯誤をしながらデータベースを直接的に操作できるよう、多次元データベース構成とした分析型情報システムのこと。

 SQLなどのデータベース問い合わせ言語の知識を持たないユーザーが、コンピュータに蓄積されているデータを使って、自身のニーズに合わせた自由な分析を行うには、ユーザーにも分かりやすく、快適に操作できる環境が必要である。そのためにデータを多次元構造の形で用意し、大容量のデータでもスムーズにハンドリングできるよう、各種の仕掛けを凝らしたシステムがOLAPである。専用の多次元データベースを持つMOLAP(Multi-dimensional OLAP)と、リレーショナル・データベースで擬似的に多次元データベースを表現するROLAP(Relational OLAP)に大別される。

 OLAPによる多次元分析は、例えばある会社の販売実績であるならば、「地域別」「製品別」「月別」などの軸を設定し、“地域ごとの製品販売実績”“製品ごとの地域別販売実績”というように軸を入れ替えて比較する(ダイス)、「地域別」「製品別」を固定して「月別」の推移を比較する(スライス)、ある地域におけるある商品の販売を月別ではなく、さらに細かな日別のデータを表示する(ドリルダウン)などの操作を繰り返すことで行われる。

 多次元分析は、統計パッケージやExcelのピボットテーブルなどで可能だが、商用のOLAP製品を利用することで販売管理や在庫管理などのソースとなるデータベースを逐次参照しながら設定した分析手法を再利用できるので、ある程度の分析・リポーティングの自動化が行える。また、分析作業量が多い場合はソース・データベースへの負荷を提言するためにOLAP用のデータウェアハウス/データマートを立ち上げることが推奨される。

 OLAPの概念は、1993年にIBMサンノゼ研究所のエドガー・F・コッド(Edgar Frank Codd)博士が「Providing OLAP - On-Line Analytical Processing - to User Analysts: An IT Mandate」(共著)という論文で示した「12のルール」に基づいている(その後の追加により、最新版は18のルールになっている)。