膨大なデータを集計して傾向を見ることが「データ分析」だと思っているマーケティング担当者も多いと思います。時系列で並び替えてみたり、いろんな視点でデータを眺める作業をすることで何か面白い視点はないかと作業を続けるわけです。
しかし、多くの場合そのような集計レベルでは面白い示唆を得ることはありません。集計だけでも非常に大変な作業であり、重要ではあるのですが、その作業だけでは何も見つからないのだから、マーケティング担当者としては段々と嫌になってくるものです。
では、どうすればデータから有益な何かを見つけ出すことが出来るのでしょうか?集計レベルから一段階レベルアップするにはどうすれば良いのか?その一つのヒントは「多変量解析」であると私は考えています。多変量解析は、様々なデータから法則を見つけ出すような計算をするものであり、集計したグラフを見て眺めているだけでは見つけにくいものを見つけ出してくれる可能性があるからです。
もし、データドリブンなマーケティングを実施したいのであれば、やはり多変量解析の基本的な知識は習得しておいて損はしないでしょう。以前の記事で「重回帰分析」の説明をしたことがあるので、今回は「因子分析」について解決したいと思います。
因子分析とは、複数の変数の背後に、それらに共通して影響する構成概念(因子)を見つけ出そうとする分析です。何を言っているのか分からない人が多いことを前提に進めますので、とりあえず読み進めてください。
仮に、あなたが学校の先生だったとして、生徒のテストの結果から生徒の能力の傾向を知りたいと思ったとします。得意分野を知ることでその後の指導方法をより良いものに出来ると考えたわけです。
下記のようなテストデータを因子分析したとします。

そして、因子分析すると下記のような結果が反映されます。

このデータを見ると、第1因子の項目では「国語、社会、英語」の数値が高くなっており、第2因子の項目では「数学、理科」の数値が高くなっていることがわかります。
この結果からどのようなことが分かるでしょうか?説明するまでもないでしょう。数学、理科の成績が良いのは「理系の能力がある」と理解したり、国語、社会、英語の成績が良いのは「文系の能力がある」と理解することが出来ると思います。
上記で「因子分析とは、複数の変数の背後に、それらに共通して影響する構成概念(因子)を見つけ出そうとする分析です。」と言いましたが、つまりは、因子分析とは、テストの結果(=複数の変数)から、文系能力や理系能力といったもの(=構成概念(因子))を見つけ出そうとする分析というわけです。
実際のマーケティングの場面では、特定の商品のユーザーアンケートから、各メーカーブランドの購入選択時に重視する点について分析するときなどに使われます。ここでは、クロスマーケティング社の説明が分かりやすいので、見ておくことをおススメします。(参考URL:
https://www.cross-m.co.jp/solution/factor/ )
下記の図は、ユーザーにアンケートを実施し因子分析した結果です。この事例では因子は7つ用意されています。つまり、あるブランドを選択する理由は主に7つあることが仮定されているわけです。
因子1では、「サービスが良い」「販売員の対応が親切・丁寧」「販売員の専門知識が豊富」「相談が気軽にできる」といったスコアが高くなっており、この因子1は「サービス対応力」と説明することが出来ます。そして、各メーカーごとにまとめたのが下記のような図です。
こうすることで、どのメーカーがどの因子で高いスコアを示しているのかが分かるようになります。
因子分析は、主にアンケートへの回答データを使うことが多いですが、近年はアンケートだけでなくメールへのクリックやコンテンツの閲覧データを使っても分析することは可能になっています。多くのコンテンツがあることが前提となりますが、どのコンテンツを見ているのかを分析することで、お客様の大体の傾向をつかむことが可能です。
恐らく、現在でもどのようなコンテンツがどれだけ見られているのか?などは分析されていることでしょう。しかし、それらコンテンツ閲覧データから因子分析しているマーケティング担当者は少ないのではないでしょうか。単純に集計しているだけでは見えてこないものが多変量解析によって見えてきます。
あなたの会社には様々なデータがあるはずです。それらデータをどう分析すればどのような結果を導けるのかについて考えてみてはいかがでしょうか。その一つのやり方は因子分析ですが、多変量解析はその他にも多くの分析手法があります。ぜひ、基本的な概念をマスターし実践することをおススメします。
テクノロジーが進化した結果得られる恩恵とは、このような様々なデータを得られるようになったことです。だからこそ、そのデータを活用するための知識を身につけなければなりません。これまではデータを簡単に入手できなかったから多変量解析はあまり必要とされなかっただけでなのです。