現代は企業のDX化が推進されており、さまざまなツールやデータベースを活用している企業も多いのではないでしょうか。
しかし「データが点在していて、管理が大変」「データ分析をしたくても、集約するのが困難」といった声も耳にします。
そのような企業におすすめなのがDWH(データウェアハウス)です。システムを横断してデータを集約し、分析に役立てることができるツールです。
そこで本記事では、DWHの概要を解説し、おすすめのDWHを5製品紹介します。それぞれ特徴を比較するので、自社に合ったDWHを選定する際の参考にしてください。
DWHとは
DWHとは「Data Ware House(データウェアハウス)」の略で、直訳すると「データの倉庫」という意味になります。
企業活動で扱うデータは、膨大な量であり、かつ複数の種類があります。そのため、部署やデータの種類によって、管理するためのツールが異なる場合がほとんどです。
たとえば、以下のようにデータ管理をしている企業も多いでしょう。
- 経理部門は会計システムと請求システム
- 人事部門は人事管理システムと採用管理システム
- マーケティング部門はMA(マーケティングオートメーション)
- 営業部門はSFA(営業支援システム)やCRMツール(顧客関係管理)
- 生産部門は在庫管理システムやERP(企業資源計画)
このようにデータが点在している状況では、社内のデータ活用や情報共有が進みません。
そこで、これらのデータを1つに統合して一元管理することができるツールがDWHです。DWHは、時系列でデータを並べたり、サブジェクト(テーマ)に沿ってデータを整理したりすることが得意です。
DWHとよく似たツールとの比較
DWHと混同されやすいツールは、以下のものがあります。それぞれの特徴を比較するので、違いを理解しましょう。
ETL
ETLとは、以下3つの頭文字から名付けられています。
- Extract(抽出)
- Transform(変換)
- Load(書き出し)
そのため、ETLとはデータを書き出す一連のプロセス、およびそのプロセスを実現するためのツールを指します。
具体的には、以下の流れがETLです。
- 複数のシステムやデータベースに保存されたデータの中から必要なデータを抽出
- 分析しやすいフォーマットに変換
- そのデータを別のシステム(DWHなど)に書き出し
一般的には、DWHの前処理である「データ収集」の段階でETLが用いられます。DWHはあくまでもデータを保存する場所としての役割なので、データ保存前にETLによってデータを整える必要があるからです。
ETLは専用のツールを活用することで実行できますが、DWHの中にはETLの機能が搭載されているものもあります。
BI
BIとは「Business Intelligence(ビジネスインテリジェンス)」の略で、複数のシステムやデータベースから統合されたデータを分析することに主軸が置かれたツールです。
DWHはデータの統合・蓄積に焦点が当たっていることに対し、BIツールは統合されたデータの分析・活用がメインである点に違いがあります。
そのため、DWHとBIを連携して、DWHで統合されたデータをBIに同期して分析するという使い方がされます。
とはいえ、BIツールのような分析機能が搭載されたDWHや、DWHのようにデータの統合・抽出の機能が搭載されているBIツールもあります。
DB
DBとは「Database(データベース)」の略で、膨大な量のデータを1カ所に集約・保存する、データ活用の基盤となるものです。 データを保存して整理できるという点ではDWHと同じです。
ただし、データベースは「顧客データベース」「売上データベース」というように特定のソースから取得されたデータを格納することに対し、DWHは複数のソースからデータを取得して保存できます。DWHのソースにはデータベースも含まれるため、たとえば「顧客データベース」と「売上データベース」など複数のデータベースからデータを統合・一元管理できます。
また、DWHは膨大な量のデータを扱うためストレージ(容量)が非常に大きいことに対し、データベースは特定のサブジェクトのみ扱うためDWHほどストレージを必要としません。
【比較】代表的なDWH5選
さまざまなDWHが提供されていますが、ここでは代表的な5製品を比較して紹介します。
Amazon Redshift
「Amazon Redshift」は、AWSが提供するクラウド型DWHです。
機械学習が搭載されているため、高度なデータ処理が可能です。
また、他のAWSサービスとの連携により、ETLやBIなどの機能を付与することができ、データ分析が効率化するでしょう。
料金プラン
- dc2.large 0.25USD (1時間あたり)
- dc2.8xlarge 4.80USD (1時間あたり)
- ra3.xlplus 1.086USD(1時間あたり)
- ra3.4xlarge 3.26USD (1時間あたり)
- ra3.16xlarge 13.04USD (1時間あたり)
※現行世代の料金プラン
BigQuery
「BigQuery」は、Googleが提供するGoogle CloudシリーズのDWHです。
データの保存・抽出だけでなく、リアルタイム分析や予測分析などの分析機能が充実しています。また、Googleスプレッドシートのインターフェースで利用できるため、使い慣れたツールで分析作業を進められます。
料金プラン
- ストレージ GBあたり$0.02/月 ※長期保存の場合はGBあたり$0.01/月
- ストリーミング挿入 200 MB あたり $0.01
- ※従量課金制、定額制プランもあり
AnalyticMart
三菱電機インフォメーションネットワーク株式会社が提供する「AnalyticMart」は、1億件を3秒で処理できる高性能データベースエンジンを搭載しています。
専用の導入支援ツールとETLツールが標準・オプションで提供されており、外部のBIツールとの連携も可能なので、データ分析のプロセスが高速化します。
料金プラン
お問い合わせください。
SOFIT Super REALISM
「SOFIT Super REALISM」は日本ソフト開発株式会社が提供する、超高速なデータ処理を実現できるDWHです。
普段からExcelを利用している人であれば2時間程度の学習で使えるようになるため、運用の手間も少なく、定着に結び付きやすくなるでしょう。
料金プラン
プラン名 | スタンドアロン版 | OS小規模版 | 中規模版 | 大規模版 | 巨大規模版 |
---|---|---|---|---|---|
標準価格 | 400万円 | 1,200万円 | 3,500万円 | 8,000万円 | 要問い合わせ |
YDC SONAR
株式会社ワイ・ディ・シーが提供する「YDC SONAR」は、製造業向けのDWHです。生産プロセスでの異常検知や、日報の自動作成など、現場が便利な機能が充実しています。
また、導入ユーザー向けのトレーニングのサポートを活用すると製品の特徴を理解できるため、社内での運用定着を促進できます。
料金プラン
お問い合わせください。
DWHの正しい選び方
新しくDWHを導入しようと思っても、初めてだとどのようなツールがよいのかわからないという方も多いのではないでしょうか。
そこでDWHの選び方を紹介します。
クラウド型かオンプレミス型か
DWHの提供方法は、クラウド型とオンプレミス型に分かれます。
クラウド型は場所に左右されず利用できる点がメリットです。また、サーバー管理やシステム運用はベンダー(提供会社)が担当するため、運用の手間が少ない点も嬉しいポイントです。
一方のオンプレミス型は、自社でサーバーを管理するためセキュリティ性が高い点が特徴です。カスタマイズ性の高さもメリットとして挙げられます。
外部ツールと連携できるか
DWHは外部のツールやデータベースからデータを取り込むため、連携できる外部ツールは事前に確認しておく必要があります。
また、分析プロセスを効率化するためには、ETLツールやBIツールとの連携も重要です。もともとETL機能やBI機能が搭載されたDWHもありますが、そうでない場合は外部ツールと連携できるか確認しましょう。
操作性・視認性がよいか
社内でデータ活用を促すためには、DWHの操作性と視認性のよさも重要です。
使いにくかったり、見にくかったりするDWHだと、社内での運用が進みません。
導入前に無料トライアルを利用し、ツールの使いやすさを確認しておきましょう。
まとめ
DWHは、複数のシステムをまたいでデータを集約・統合できるツールなので、多くのシステムやデータベースを導入している企業におすすめです。
DWHに保存されたデータは分析に活用できるため、搭載されている分析機能を活用したりBIツールと連携したりすることで、よりデータ活用が促進するでしょう。
本記事で比較した5つのDWHを参考に、自社に最適なツールを選定してください。
また、当メディア「kyozon」ではデータ分析に役立つツールを多数紹介しています。資料のダウンロードも可能なので、ぜひお役立てください。
【SNSフォローのお願い】
kyozonは日常のビジネスをスマートにする情報を毎日お届けしています。
今回の記事が「役に立った!」という方はtwitterとfacebookもフォローいただければ幸いです。
twitter:https://twitter.com/kyozon_comix