データマイニングとは「ビッグデータの分析手法」
データマイニング「Data mining」とは、蓄積されたビッグデータの中からパターンや相関関係などを見い出し、問題解決に役立てるための分析手法です。
「mining」は日本語に訳すと「採掘」を意味します。まさに膨大なデータの山から有用な情報や価値を探しだすのが、データマイニングです。
元々は統計分析学から発展しましたが、分析にあたっては、分析統計学だけでなくAIやIoTなど、他のデジタル技術も利用して分析します。
マーケティングや営業で使われてきましたが、最近では幅広い分野で使われるようになりました。
データマイニングで不可欠な2つの要素
データマイニングをするにあたって必要不可欠となる、以下の2つの要素を解説します。
- ビッグデータ
- データウエアハウス(DWH)
順にみていきましょう。
ビッグデータ
ビッグデータは文字通り、膨大な情報量がある情報群で、以下の特徴があります。
- 膨大なデータ量
- 余分な情報を含む
- 形式がバラバラ
- 更新速度が速く、リアルタイム性がある
- データ量が加速度的に爆発的に増える
ビッグデータは容量が大きく、そのままでは利用しにくい状態です。データマイニングの各種分析を行う場合には、ビッグデータを整理するシステムや分析ツールを使って分析します。
マーケティングで利用される具体的なビッグデータの例は、以下の通りです。
- 検索履歴データ
- Web行動履歴データ
- ECサイトの購買履歴データ
- POSデータ、ID付POSデータ
- 生活者のSNSなどの書き込みデータ
- コールセンターへの問い合わせデータ
- クレジットカード決済履歴データ
- 広告配信データ
データウエアハウス(DWH)
データウエアハウス(DWH)はデータマイニングを行う上で、分析するデータの元となるビッグデータの保管倉庫のようなシステムです。
さまざまな形式の膨大な量の情報がデータ分析しやすい状態で整理され、保管されています。データウェアハウスは、必要なデータを素早く検索・表示できますので、データマイニングには欠かせないシステムです。
データマイニングが活用される理由を解説
データマイニングは、コンピューターやネットワークの飛躍的な進歩にともない、膨大なデータを処理できるようになったため、急激な発展を遂げました。
最近のテクノロジーとも相性がよいので、AIやIoTのようなデジタル技術と一緒に使われ、膨大な量のデータ分析が可能です。
データマイニングは、飽和しつつある現代の市場でも今までにない問題解決や課題発見につながるとされ、さまざまな分野で活用されています。
また、データマイニングが普及しはじめた大きな理由として、データマイニングの分析ツールが開発されたことで、専門的な知識を必要としなくなった点もあげられるでしょう。
【業界別】データマイニングの活用事例3選
それでは、実際にデータマイニングの活用事例を業界別にあげていきます。
取り上げる業界は、以下の3つです。
- 小売業|販促に活用
- 金融業|クレジットカードの不正利用の発見
- 製造業|製造設備のメンテナンスに活用
順にみていきましょう。
小売業|販促に活用
小売業界では、顧客の購買行動をデータマイニングで分析し、販促に活用しています。
POSやCRM(顧客管理データ)などからデータを抽出し、顧客が商品を購入する際、どのような行動・過程を経ているのか分析します。
たとえば、Web上の通販サイトで、ある商品を購入されたお客様に対しての販促を考えてみましょう。まず、Webサイトの利用だけでなく、スマートフォンアプリでの利用を提案・誘導します。
その上で、購買履歴に合わせたアプリでのプッシュ通知やダイレクトメールの配信、クーポンの提供など、具体的な施策が展開できるでしょう。
データマイニングは、顧客の購買行動によって異なる販促活動を展開するマーケティング施策に活用できます。
金融業|クレジットカードの不正利用の発見
金融業界では、クレジットカードの不正利用を発見するために活用されています。
クレジットカードの利用履歴は日々、膨大な量のデータを分析した上で、過去の不正利用と類似したパターンを探し出せば、クレジットカードの不正利用を早期に見つけ出せます。
たとえば、通常は月に数回、数万円までしかクレジットカードを使わない利用者がいたとしましょう。その利用者がある月だけ突然、一度に限度額いっぱいまで使った場合、他者の不正利用の可能性が考えられます。
システム上で、普段とは違う利用パターンかつ過去の不正利用のパターンと類似していると判断されると、不正利用の可能性として警告の表示がされます。
しかし、利用者がたまたま高額な商品を購入しただけのケースもあるため、システム上のデータだけでは判断できません。
AIを活用したデータマイニングの手法であれば、複数のデータをスピーディーに参照・分析するため、従来よりも早く異常を見つけるのに役立ちます。
製造業|製造設備のメンテナンスに活用
製造業では、工場の製造設備のメンテナンスでデータマイニングが活用されています。工場ではさまざまな機器や設備が稼働しており、稼働年数やメンテナンスの周期は様々です。
そして近年、IoTの技術の発展により、工場内のあらゆる機器からデータ収集が可能です。
日々、問題なく稼働しているように見える製造設備であっても、IoTのセンサーでは異常な動きや音が検知され、メンテナンスが必要になっている機器もあるかもしれません。
IoT機器が収集したデータをデータマイニングで分析し、故障の兆候を把握できれば、計画的なメンテナンスにより、手間やコスト削減になります。
データマイニングの実施手順
ここで、データマイニングの大まかな実施手順をみていきましょう。
データマイニングは、以下の手順で行われます。
- 目的や仮説の決定
- データの収集
- データクレンジング
- データの分析
- 効果検証
順に解説します。
目的や仮説の決定
最初に、データマイニングをはじめる前にデータ分析を行う目的や仮説を立てます。
データマイニング自体は先入観や偏った考え方を排除するため、仮説を立てないで分析する場合もありますが、ビジネスでは仮説や目的を決定してから行います。
目的や仮説の決定は、「解決したい課題は何なのか」「その原因や解決策は何か」を徹底的に考察するところから始めます。
今、起きている課題の背景や理由、実現を妨げている障害、解決策などを検討した上で、目的を明確にし、仮説を立てていきます。
ここで明確な目的や仮説を立てておくのは、その後に必要なデータ取集や適切な分析手法を選択するために重要です。
データの収集
次に、必要なデータを収集していきます。目的や検証した仮説に合わせた適切なデータを収集します。
たとえば、お客様が同時に購入される商品の組み合わせを知りたいときは、ECサイトの購買履歴データ、POSデータ、ID付POSデータが必要となるでしょう。
データクレンジング
そして、データクレンジングの作業に入ります。
データクレンジングとは、取得したデータから不要なデータ(ノイズ)を除去し、分析対象データを抽出した上でデータの整理・加工作業を行うことを指します。
データクレンジングは、最も労力がかかり、データマイニングが成功するか否かを左右する重要な作業です。
データの分析
必要なデータがそろったところで、実際にデータ分析をします。
データ分析にあたっての具体的な作業は、以下の通りです。
- データをグループ化する(顧客を年代別の属性別にグループ化)
- データの性質を知る(データの内容を理解する)
- データとデータの相関性を把握する(グループ化された顧客が同じような商品を購入する傾向があるか検証する)
データマイニングツールを使うのが一般的ですが、データ分析にはさまざまな手法があります。データ分析の手法は、目的や検証したい仮説に適したものを選択しましょう。
データがどのような内容や性質を持つものなのかを知るのが重要で、それが次の効果検証や実際のマーケティング施策につながっていきます。
効果検証
最後に、分析で得た結果や効果を検証します。分析の実施後、その分析結果が、そうなった結果の要因を特定します。
さらに検証結果を基にルールを作成し、それを実際のデータに当てはめ、検証・評価します。
データマイニングの分析結果を活用する注意点
データマイニングの分析結果を活用する上での注意点は次の2つです。
- 情報は適切に取り扱う
- 分析結果の解釈・活用は自分次第
順にみていきましょう。
情報は適切に取り扱う
収集したデータが間違っていたり質が低かったりすれば、データマイニングを活用して求める結果を出すのは難しくなるでしょう。
実際、ビッグデータには信頼性の薄いデータが数多く含まれています。
条件定義を適切に行い、情報を取捨選択するスキルがないと、いくらデータマイニングを行っても分析結果が偏り、正しい分析結果になりません。
情報を正しく扱うには、専門的な知識を持った人材の獲得やデータマイニングツールなどの利用を検討しましょう。
分析結果の解釈・活用は自分次第
データマイニングは、あくまでも分析手法であり、データマイニングツールは分析結果の解釈や意味付けができません。
結果の解釈は人の手で行う必要があり、さらに分析結果を元にしたマーケティング施策などの具体的な戦略や企画の立案も人の手で行います。
データマイニングをどのように実際のマーケティング施策に活かしていくのかは、分析者の力量にかかっているでしょう。
データマイニングの手法3選
最後に、データマイニングの代表的な手法3つをご紹介します。
- クラスタリング
- ロジスティック回帰
- マーケット・バスケット分析
順に解説します。
クラスタリング
クラスタリングとは、データを類似性に基づいて分類するための手法です。
顧客管理データをもとに同じような行動をとっている顧客をグループ化し、そのグループごとに異なるマーケティング施策を実施する場合に使われます。
ロジスティック回帰
ロジスティック回帰分析は、二者択一の選択の確率を予想するための手法です。
たとえば、キャンペーン実施時に、DMを送付した顧客が商品を購入するかどうかを予測する場合に使われます。
マーケット・バスケット分析
マーケット・バスケット分析は、アソシエーション分析の一種で、小売店のPOSデータから同時に買われることの多い商品を見つける際に使われる手法です。
関連性が薄いように見えて、実は同時に購入されることの多い商品や、逆に関連商品のように思えても、同時に購入されることが少ない商品を明確にできます。
セット販売で、最適な商品の組み合わせや売り場の商品の配置など、効果的な売り場作りに活用できるでしょう。
まとめ
データマイニングは課題解決のための分析手法であり、マーケティングや営業を中心に幅広い業界で活用されています。
データを適切に取り扱い、データマイニングツールを利用すれば、あまり専門的な知識がない人でもデータマイニングは可能です。
データマイニングをうまく活用できれば、課題解決のための新たな手法を見い出すのに役立ち、ビジネスチャンスが広がる可能性もあります。
マーケティングだけでなく、さまざまな課題解決のために、データマイニングへの知識をさらに深めていきましょう。