データマイニングとは、英語で「情報を発掘する(mining)」を意味します。人工知能や統計学の分析手法を用いて膨大なデータから有益な情報を抽出する技術です。

IT技術の発展によって各企業が扱うデータの量は大幅に増加しており、ビジネスでのデータマイニングの活用が注目されています。データマイニングを行うことで、膨大なデータから不要なノイズを取り除き、必要な情報を発見できます。

そこで本記事では、データマイニングの意味やできること、主な分析手法、小売をはじめとした業界別の活用事例について詳しく解説します。

目次
データマイニングとは?
データマイニングによって得られる知識
データマイニングでできること
 ・1. 結果の予測
 ・2. 情報の分類
 ・3. 関連するデータの発見

データマイニングとは?

データマイニングとは、人工知能や統計学の分析手法を用いて膨大なデータから有益な情報を探し出す技術です。役立つ可能性があるにもかかわらず今まで知られていなかった情報を、無秩序なデータから見つけ出すために利用します。

データマイニングは数あるデータ分析の中でも、コンピュータを用いる手法です。そのため、データマイニングはコンピュータの計算性能の向上やインターネットの発展とともに発達してきました。

2000年頃からはインターネットの普及が一気に進み、一般家庭や企業で扱うデータ量が加速度的に増加しました。それに伴い業務で扱うデータ量が増えたため、効率的にデータ分析を行う手法としてIT企業を中心にデータマイニングが導入し始めています。

データマイニングによって得られる知識

データマイニングによって得られる知識は次の4つに分類できます。

  1. データ(Data):整理される前の数値や文章、音声など
  2. 情報(Information):データを整理、分類して解釈できる状態にしたもの
  3. 知識(Knowledge):情報から得られるノウハウや傾向、知見
  4. 知恵(Wisdom):知識を利用して得られる問題解決能力や発想力

これら4つの頭文字をとって「DIKWモデル」と呼ばれています。

データ、情報、知識、知恵の順に有益度は増しますが、データマイニングで行えるのは知識を見出すことまでです。データマイニングによって得られた知識を知恵として活かすには、人の力が必要です。

データマイニングでできること

データマイニングでは次の3つのことを行えます。

  1. 結果の予測
  2. 情報の分類
  3. 関連するデータの発見

それぞれ詳しく解説します。

1. 結果の予測

データマイニングでは、収集した膨大なデータを分析して、特定の事象が起こる確率や可能性を予測できます。

例えば、マーケティングでデータマイニングを行う場合、収集するデータは商品データや顧客データ、購入データなどです。

収集したデータを分析して、商品が売れる時期や効果的な購買層などの予測を導き出す、これがデータマイニングの一例です。

2. 情報の分類

情報の分類もデータマイニングによってできることの一つです。膨大なデータに条件を設定することで、情報のグループ分けができます。

例えば、売り上げや利益、販売数などを設定することで商品を分類します。

データを分類し整理することで情報が扱いやすくなり、その後の施策を簡単にするのがメリットです。

3. 関連するデータの発見

データの関係性を発見するのも、データマイニングでできることの一つです。

例えば、気温や天気などの気象データと、商品販売数の増減の関連性を見つけだします。気温が上がることで、特定の商品の販売数が増加するという内容です。

また、それまでは関連がないと考えられていた商品に共通点を見つけ出す場合もあります。このように、人では気づきにくい、データ同士の関連性を発見することもデータマイニングの特徴です。