データドリブンなマーケティングを求められる現代において、多くのマーケティング担当者はデータから様々な相関関係を見つけ出そうと奮闘する。
どの指標が上昇するとCVが向上するのか?を常に探し続けているマーケティング担当者は多いはずだ。このCVの向上に強い影響を与える指標を発見することができれば、その指標を向上させる適切な施策を実施すれば、CVが向上すると考えられるからだ。
しかし、その相関関係を見つけてしまうと、殆どのマーケティング担当者は冷静さを忘れてしまう。その相関関係の発見に気持ちが高ぶり、その相関関係が本物かどうかの確認を怠ってしまうのだ。
例えば、おコメの消費量を増やすためのキャンペーンを考えるために、様々なデータを分析していたとしよう。その時、「家庭における茶碗の数」が見事に「おコメの消費量」と相関関係にあることを発見すると「おコメの消費量は茶碗の数によって決まる」という思い込みに陥ってしまうようなことがある。
しかし実際には、「家族の数」が増えれば「おコメの消費量」が上がり、「家族の数」が増えれば「茶碗の数」が上がるという現象が起きているだけである。つまり、「茶碗の数」が増えると「おコメの消費量」が上がるように見えるのは、どちらの指標も「家族の数」と強い相関関係にあるからなのである。

この第3の指標を見逃してしまうと、おコメの消費量を増やすためには「茶碗の数を増やせばいい」と考えてしまうかもしれない。最悪な場合、「各家庭に茶碗を無料で配るキャンペーン」を提案してしまうかもしれない。近年のデータ至上主義に偏ってしまうとこのようなミスをする可能性があると感じるのは私だけではないはずだ。
今回は、間違いに気付きやすい例で説明したが、現実の世界では、もっともらしい結果がデータ分析によって導き出されると、特に疑いもなく、プロジェクトを進めてしまうことはよくあることだ。
他にも、「フロリダ州では人口あたりで見ると結核で死ぬ人が全米で最も多い」というデータから「フロリダ州の気候は結核には最悪である」と結論づけてしまったことが過去にある。しかし、実際には「フロリダ州の気候が結核の療養に適しているので、全米中から多くの結核患者が引っ越してきている」ために、フロリダ州の結核患者の比率が高くなり、結果として結核で亡くなる人の比率が高くなっていただけなのである。
このように、データ分析を担当する人にもビジネスのセンスやビジネスの理解が必要であることが分かると思う。また、マーケティング担当者はデータ分析を依頼して、その結果をそのまま受け入れることの危険性も理解できると思う。基本的に、データ分析者はデータ分析のスペシャリストであり、あたなの会社のビジネスのことについては基本的なことしか知らない。そのような状態で、データ分析を実施すると上記のようなことは十分に起こるのだ。
マーケティング担当者は、データ分析者が作成したレポートを鵜呑みにせず、本当にこの結果はこの原因が引き起こしているのか?を実際のビジネスのシーンに当てはめてみて違和感がないかを慎重に確かめる必要があるのだ。以前の記事でも書いたが、データは不完全であり、全体の一部しか表現していないのであるから、データの意味を慎重に把握することが大切なのである。