コピー完了

記事TOP

データウェアハウス(DWH)とは | 定義・データベース(DB)・データマートとの違い

最終更新日:
データウェアハウスとは、各種データを時系列に保存すデータベースの利用形態の一つです。データウェアハウス(DWH)の意味や定義を詳しく解説し、データベース、データマート、データレイク、RDBなどとの違いについて解説します。

データウェアハウスとは

データウェアハウス(DWH = Data WareHouse)とは、業務で発生した各種情報を時系列に保管したデータベースのことを指します。ウェアハウスは「倉庫」という意味があることから、データウェアハウスとは、あらゆる情報をまとめたサーバーやソフトウェアであり、データベースの利用形態の一つです。


データウェアハウスの、実際に使用されているシステムは次の記事で紹介しています。概要理解にもつながるので、あわせてご覧ください。

データウェアハウス(DWH)とデータベースとの違い

データウェアハウス(DWH)とデータベースの違いは、データの使用状況や状態です。

データウェアハウス(DWH)とは、その名のとおり「倉庫」として情報を時系列に保管する役割を担っています。現在は使わないもの(過去のもの)を集約し、格納するのがデータウェアハウス(DWH)です。

一方データベースは、「現在進行中の状態」のデータを格納し、即座に取り出せる状態になっていることが多いです。容量の関係や処理速度の問題で、一定期間が過ぎたデータは削除されるという使い方をされていることが多いでしょう。日次、月次、年次などとデータ算出のサイクルがあらかじめ定められてい

データベースとは何か、さらに詳しく知りたい方はこちらの記事をご覧ください。

データウェアハウス(DWH)の定義

データウェアハウス(DWH)であるためには、4つの定義を満たさねばなりません。データウェアハウスの4つの条件を紹介していきます。

データが時系列である

過去のデータを保持している、ということがデータウェアハウス(DWH)の重要なポイント。各データに、いつ保存されたかという情報も付けられていて時間ごとに保存されていくため、過去の記録を残すことによって分析を容易にできるようになるメリットがあります。

たとえば、「現在の口座残高」がわかるだけではなくて、「過去の入出金履歴」がすべて記録されていることがデータウェアハウスにおいては重要です。こうして履歴が残っていれば、過去の状況把握も簡単でしょう。

サブジェクトごとに保管してある

データウェアハウスはデータを目的別ではなく、サブジェクト(内容)別に分類するという特徴があります。データウェアハウスは内容ごとに分類を決めている図書館のようなものです。

データを統合してある

データウェアハウス(DWH)はさまざまなデータを統合したデータベースの役割を持ちます。よって、部署や使っているデータベースごとで使われている名称にブレがある場合に、変換テーブルやデータウェアハウス用のIDを使うなどして、すべてのラベルが統一されていなければなりません。

たとえば、取引先会社名を示すラベル名が「顧客名」「取引先」などのように違っていると、それだけで別データと見られてしまったらデータウェアハウスの意味がなくなってしまうので注意しましょう。

データは消さない

データを多く保管することにより、過去のデータと現在のデータの比較といった分析や業務改善に活かすのがデータウェアハウス(DWH)の目的です。よって、原則として保管したデータを消すことはありません。過去のデータを記録するものなので、上書きしたり更新したりする必要もないでしょう。

しかし、データ容量や使用頻度に応じて、数年・数十年単位ではある程度の期間を経た一部データを消すこともあります。

データウェアハウス(DWH)の具体的な活用方法

データウェアハウスはBIツール(ビジネスインテリジェンス)ETLツールに代表される分析ツールを使う場面で活躍します。データウェアハウスではデータを項目別(サブジェクト)に分類する設定ができ、集積されるデータを仕分けることも可能です。

たとえば、CRMで顧客の購入履歴から傾向やニーズを分析する際、データウェアハウスなら前もって設定を行うと、内容に沿ってデータが集積されているため、後から手作業で仕分け、分類する必要がありません。

このようにデータ分析のツールを使用する際にデータ統合する手間を省ける業務効率化に役立ちます。

データウェアハウス(DWH)とデータマートの違い

データウェアハウス(DWH)と関連した考え方に、「データマート」があります。

データマートとは、データウェアハウスに保管された各データの中から、目的に合わせて必要なものだけを抜き出したデータベースのことです。即座に検索や集計ができため、細かい分析が容易にできます。

データウェアハウスとデータマートを組み合わせることで、これまでのビジネス情報を一元管理可能です。一方で、小規模な企業であれば、データマートがデータウェアハウスを兼ねることもあります。


データウェアハウスはBIとよく混同されます。こちらの記事では、その勘違いしやすいデータウェアハウスとBIを比較しているため、詳しくはこちらをご覧ください。

データウェアハウスとRDBの違い

データウェアハウスと関連した考え方に、「RDB」があります。Relational Data Base(リレーショナルデータベース)の略語で、日本語では関係データベースと訳されます。

データウェアハウスは列単位で処理をするのに対し、RDBでは行単位で入出力を行う処理をするという違いです。データウェアハウスは、必要な列のみ選択して処理していますが、RDBは行の全体を読み込む必要があります。

データウェアハウスとRDBは処理方法の違いにより、速度に差が生じます。そのため、大量のデータを分析するときはデータウェアハウスの方が高速処理が可能です。

ただ、データの追加や更新をするときは、列単位でデータを処理するのでデータウェアハウスは向いていません。データの追加・更新を頻繁に行う処理は、データウェアハウスよりもRDBが適しています。

データウェアハウスとデータレイクの違い

データレイクとは、ネットワークで収集される規則性を持たないデータ(非構造化データ)のことで、データの活用目的は決まっていないことがデータウェアハウスとの違いです。データレイクは、ストレージ容量を多く使い、膨大で複雑なデータを保管するため、ビッグデータの解析によく用いられます。

データレイクに格納されるデータで、代表的なものは次のとおりです。

  • テキスト
  • 画像
  • 動画
  • 音声
  • ログ
  • GPSデータ

データウェアハウス(DWH)システムのおすすめ

b→dash(ビーダッシュ) - 株式会社フロムスクラッチ

b→dash - 株式会社フロムスクラッチ 画像出典:b→dash公式サイト

  • すべてを統合して使えるデータセットを取得
  • クロスチャネルでのデータ活用
  • シンプルで簡単な操作

b→dashは、Webサイトやアプリ、広告、店舗、自社ビジネスデータなどをすべて統合し、マーケティング特化型DWHへ取得することで、マーケティングに活用できるデータセットを作成します。

収集されたビッグデータは、AIを活用することでクロスチャネル対応One to Oneコミュニケーションへの最適化が行われ、施策やオペレーションの自動化、収益予測までが可能となります。

trocco(トロッコ) - 株式会社primeNumber

trocco(トロッコ) - 株式会社primeNumber 画像出典:trocco(トロッコ)公式サイト

  • データ運用にかかる工数を90%削減
  • 専門知識は不要で最短5分から利用開始可能
  • 初期費用は0円で使った分だけの従量課金制

troccoは、日本発の分析基盤向けデータ統合自動化サービスです。面倒な環境構築やプログラミングは一切不要で、従来要してた開発工数を90%以上も削減が期待できます。運用・保守業務もtroccoが代わりに行うので、運用作業も月間5時間以内に抑えられます。また初期費用などは一切なく、月額費用+データ転送量の従量課金制なので運用コスト面も安心です。

Metaps Bridge - 株式会社メタップス

Metaps Bridge - 株式会社メタップス 画像出典: Metaps Bridge公式サイト

  • 分析からコンサルティングまで一貫して対応
  • プッシュ通知を中心に、施策の効果を細かく分析できる
  • アプリ内外のデータを統合し、より正確な投資判断に活用

Metaps Bridgeは、コンシューマー向けアプリの成長を支援するデータプラットフォームです。アプリ分析を通して、より深いユーザー理解に繋がるイベント取得の方法や、効果的なデータの取り方をサポートします。また複数のアプリを同一プラットフォームで管理することで、横断的にユーザー像を抽出。データ収集から活用提案まで一括で対応します。


また、こちらの記事ではBIツールのおすすめを紹介しています。あわせてご覧ください。

データウェアハウス活用を

データウェアハウスがビル・インモン氏により、初めて提言されたのは1990年のこと。近年耳にするようになったビッグデータと比較すると、データウェアハウスという概念はかなり昔からありました。

ビジネスシーンで利用するシステムに代表される基幹系業務システムなどは、今月の売上や現在の在庫、また今期の利益など現在の業務を行うためのものであり、過去のデータなど保存されないことが一般的です。

これに対してデータウェアハウスは過去のデータを順次記録していくので、時系列で保存できるという特徴があります。そのため基幹系業務システムなどでは見落としがちな、企業に対する重要なデータを見つけられる可能性があります。

データウェアハウスを活用し、自社のビジネスに活用していきましょう。

ボクシルとは

ボクシルとは、「コスト削減」「売上向上」につながる法人向けクラウドサービスを中心に、さまざまなサービスを掲載する日本最大級の法人向けサービス口コミ・比較サイトです。

「何かサービスを導入したいけど、どんなサービスがあるのかわからない。」
「同じようなサービスがあり、どのサービスが優れているのかわからない。」

そんな悩みを解消するのがボクシルです。

マーケティングに問題を抱えている法人企業は、ボクシルを活用することで効率的に見込み顧客を獲得できます!また、リード獲得支援だけでなくタイアップ記事広告の作成などさまざまなニーズにお答えします。

ボクシルボクシルマガジンの2軸を利用することで、掲載企業はリードジェネレーションやリードナーチャリングにおける手間を一挙に解消し、低コスト高効率最小限のリスクでリード獲得ができるようになります。ぜひご登録ください。

また、ボクシルでは掲載しているクラウドサービスの口コミを募集しています。使ったことのあるサービスの口コミを投稿することで、ITサービスの品質向上、利用者の導入判断基準の明確化につながります。ぜひ口コミを投稿してみてください。

この記事が良かったら、いいね!をしてください!最新情報をお届けします!
御社のサービスを
ボクシルに掲載しませんか?
掲載社数3,000
月間発生リード数30,000件以上
編集部のおすすめ記事
DWH(データウェアハウス)の最近更新された記事