機械がもたらす「発見」「分析」の功罪とは?

皆さんは「テクノベート(Technovate)」という言葉をご存じだろうか。これは、テクノロジー(Technology)とイノベーション(Innovation)を組み合わせた言葉で、主にITに代表されるテクノロジーによって進化、あるいは変化していく新しい経営の在り方を指す言葉である。

そんなテクノベート時代には、当然テクノロジーへの理解も欠かせない。ビッグデータ、ブロックチェーン、RPA、MaaS……そんな必須の基本用語をわかりやすく解説して1冊にまとめた『テクノベートMBA 基本キーワード70』(PHP研究所)から、今回は「データマイニング」「プロファイリング」についての解説を一部抜粋して紹介する。

機械が人間にはできない「発見」をしてくれる

データマイニングとは、数多くのデータの中から、ビジネス上で有益となる示唆を導き出すことを指す言葉です(マイニングは「発掘」の意味)。データマイニングという言葉自体は昔からあり、実践もされてきました。しかし、近年はビッグデータが充実し、AIが進化したことにより、数万人の顧客の、項目が数百にも及ぶデータを、ものの数分で計算できる時代になりました。その結果、これまで以上に有益かつ人間が気づきにくいデータが見つかることが期待されています。

データマイニングの古典的成功事例としては、野球におけるセイバーメトリクスが挙げられます。これは、メジャーリーグの球団、オークランド・アスレチックスが「給料は安くても強い球団を作るにはどうしたらよいか」という問題に対して、「打率、打点、ホームラン数、盗塁数といった昔ながらの指標ではなく、別の指標で見た方が掘り出し物の選手を見つけられるのではないか」と考え、発展したものです。

実際にアスレチックスは試行錯誤の末、「OPS」(出塁率+長打率)という指標が得点能力と関係が深いこと、かつOPSが高いのにサラリーが安い選手が多数いることに気がつきました。そこでそうした選手をかき集めて、給料の総額は安いのに、強い球団を作り上げたのです(ちなみに、攻守走すべてに優れた数字を残している選手は、得点創出能力以上にサラリーが割高になることも発見したそうです)。
 

情報,嶋田毅
(画像=THE21オンライン)

人間が気づかない法則をAI が見出す

昨今のビジネスで、データマイニングが最も活用されているのはマーケティングの分野です。顧客の属性や行動をデータからきめ細やかに分析することで、それぞれの顧客に合わせて適切なアプローチを取ろうという企業が増えています。

最も古典的なデータマイニングからの発見は、アメリカのディスカウントショップにおける「ビールと使い捨ておむつは同時に購買されることが多い」という発見でしょう。これは、人間の直感ではなかなか気づきにくい発見です。

後講釈では、「使い捨ておむつを買いに来た父親が、ついでにあわせてビールを買う傾向があった」などと説明はできますが、ポテト系のおやつとビールのような組み合わせではなく、使い捨ておむつとビールという組み合わせは、なかなか人間には仮説が立てられませんし、発見もできません。これが機械の力とも言えるでしょう。

データマイニングは、「儲からない可能性の高い人間に来てほしくない業界」(例:保険会社)などでは、そうした顧客を避けるためのプロモーション(デマーケティング)にも活用されています。たとえば、データから「このタイプの顧客は事故を起こしやすい」と判断された顧客については、その保険会社を選ばなくするようなメッセージを含んだプロモーションなどを行うのです。

データの質と量を決めるのは、人間の課題

では、有用な知見の発見は、すべて機械に任せればいいのかというと、そういうわけでもありません。現時点では、機械の側から「このようなデータが欲しいから、このようなセンサーを作ってくれ」といった要求をすることはありません。

したがって、そこには相変わらず人間の知恵や洞察力が求められます。データの質を決めるのは人間なのです。

データの量についても、これからセンサーの低価格化が進めば、量も自ずと増えていくでしょうが、今は完璧とは言えない状況です。当面は費用対効果を高めるためにも、「どのようなデータを取れば有益な示唆が得られそうか」という方向性を、人間がしっかりと考える必要があるのです。

また、1つの会社があらゆるデータを集めようとしても、それは非効率です。どのような企業とパートナーシップを組むのがいいのかといった判断なども、データの質と量を上げる上では大事な課題となるでしょう。カード業界などでは古くから競合会社同士でも「ブラック顧客リスト」を共有したりしていましたが、同じように顧客データを共有することが、新たなWin-Winの関係をもたらすかもしれないのです。

大量のデータがあれば、どんな人物像も割り出せる

プロファイリングとは、元々の意味は犯罪捜査などにおいて、さまざまな証拠から犯人像(性別や体格、趣味や嗜好など)を推理すること。IT用語では、検索履歴や購買履歴などのウェブ上の行動データから、ユーザーのプロフィールを明らかにすることを指します。

ビッグデータやAIの進化がもたらしたのが、仮想空間上でのプロファイリングの精度向上です。今までコンピュータは、あるユーザーがどのような人物なのかを正確に割り出し、把握することはできませんでした。もちろん、ユーザー側から属性データを登録してもらうことは可能ですが、そこに書かれたことが正確な真実なのかどうかは不明です。

しかし、ウェブ上でさまざまな行動データを取ることで、ユーザーの人物像を推測できるようになりました。たとえば、

「この人は東京都内に住む、40代の既婚女性」
「職業はサービス業の管理職」
「世帯年収は○○○万円」
「子どもは1人、小学生の女の子」
「趣味はヨガと旅行とスイーツ」
「サッカーファンで、日本代表の試合は欠かさず見る」

といったレベルまで、ある程度正確に予測できてしまうのです。行動データの量が増えるほど、精度は増していきます。
 

情報,嶋田毅
(画像=THE21オンライン)

プロファイリングは企業行動を大きく変える

これは企業にとって非常に有用なデータになります。プロファイリングが完全にできていれば、購買などの行動に連動せずとも、レコメンデーション(特定の顧客のデータを分析して、その顧客が好みそうな製品・サービスを案内して購買を促すこと)が可能です。たとえば、前出の40代の女性で言えば、「中学受験予備校の案内」「中年女性向けのサプリや漢方薬の案内」「2022年のサッカーカタールW杯の旅行ツアー案内」などがタイムリーに届くのです。

プロファイリングが重要になる分野として、「企業の採用」があります。新卒、転職を問わず、入社希望者の情報について、AIなどがクローリング(ウェブ上の関連する情報を集めていくこと)することで、面接などを行わなくても、人となりや能力をかなりの精度で推察することができるでしょう。

昨今、就職活動を意識したSNSであるリンクトインなどのサービスがありますが、そこに書いてある情報以外も考慮した上で、企業側は採用活動を行うことができます。SNSに書いた不用意な一言で内定を取り消されたなどという話がしばしば話題になりますが、企業側からすると、そうした事前のリスク回避が、よりやりやすくなるわけです。

技術面ではなく、倫理面での課題も多い

ただ、プロファイリングには、技術的な問題を超えて、倫理的な問題も生じてきます。たとえば、レコメンデーションであれば、消費者はそれを買わなければ済むだけです。しかし、企業の採用のような、人生を左右しかねない大きなイベントにおいて、クローリングまでして集めたデータを活用することが、本当に許容されるべきなのでしょうか?

また、プロファイリングの技術がもっと進めば、匿名掲示板などにおける匿名の投稿なども、文体や書かれた内容から、本人をかなりの精度で特定できるようになると予測する専門家の声もあります。そうすると、たとえば目の前の入社希望者が、匿名の投稿でヘイト的な発言をしている可能性がほぼ100%の確率で分かったからといって、それを理由に入社を断ってもよいのでしょうか?

さらにこの傾向が進み、過去に何の犯罪歴もない人についても、「彼は通常の人物より高い確率である種の犯罪を起こしやすい」などと政府や企業が判断するような時代になったとしたら、どうでしょうか。それは、社会としてより良い方向に進んでいるのでしょうか。ウェブを通じて人間の情報はどんどんデータ化されていく時代ですが、一定の線引きを考えることも必要かもしれません。

文・嶋田毅(グロービス経営大学院教授)
(『THE21オンライン』2019年06月14日 公開)

提供元・THE21オンライン

【関連記事】
ミレニアル世代の6割が「仕事のストレスで眠れない」試してみたい7つの解消法
みんながやっている仕事のストレス解消方法1位は?2位は美食、3位は旅行……
職場で他人を一番イラつかせる行動トップ3
「ゴールドマン、Facebookなどから転身、成功した女性起業家6人
【初心者向け】ネット証券おすすめランキング(PR)