今回のトライツニュースは「営業マネージャー/営業企画のための統計活用入門」として、実際の営業現場で使える統計学の手法/ツールについてです。

四回目で最終回の今回は「分類」について。ここでいう「分類」とは、複数のデータの関係性をもとにグループ化しようというもの。この「分類」の使い方について、営業現場でよくあるシーンを題材に解説していきます。

シーン:複数ある商品の特徴をわかりやすく見せられない!

食品メーカーでの社内打合せのシーン

課長:今日のX社向けの商品説明会はどうだった?
営業担当:グラフを入れた資料を使って説明したんですけど「違いが分かりにくい」って言われちゃいまして…
課長:この間試食してもらって官能評価をしたアレだろ?商品ごとに「甘味」「苦味」「コク」とかの点数をつけた
営業担当:そうです。点数をランキング形式やレーダーチャートにしてみたのですが、「ゴチャゴチャしてる」と…
課長:(資料を見て)確かにゴチャゴチャしているなぁ。もう少しパッと見てわかるようにシンプルにならないもんかな…

ここでこのメーカーの営業担当が持っていった資料を見てみましょう。

点数をランキング形式にしてみたり、それをさらにレーダーチャートにしたりしてはいるのですが、顧客から「ゴチャゴチャしていてわかりにくい」と言われてしまうのも仕方ないですね。こんな時に役に立つのが統計の「分類」です。

コレスポンデンス分析で商品と特性をマッピング

最初に顧客に提出した表のように「商品」と「官能評価の項目」など、複数の項目同士の関連性を一目でわかるように分析する手法がありますのでご紹介します。それはコレスポンデンス分析というもので、項目同士の関連性を距離に置き換えて図示する分析手法です。「官能評価結果」の表を統計ソフトに読ませて分析方法を指定すると、簡単に分析結果が出てきます。

上がその分析結果ですが、見方に少しクセがあります。こういう図を見ると「縦軸と横軸は何?」と思われる方が多いと思いますが、この図の縦軸と横軸には意味がありません。この図の中で意味があるのはデータ同士の距離だけで、距離が近いものほど類似度/関連性が高いということを表しています。ですので、この図全体を回転させても表している意味合いは全く同じです。

上の図では、商品A~Gが赤丸で、「甘味」から「味付け」までの評価項目が青丸でマッピングされています。わかりやすいように商品Aと距離が近い評価項目と遠い評価項目の一部を緑色で補足してあります。このことから「商品Aは素材の味が強くまたバランスが取れており、味付けは弱めだ」ということがわかります。ほかにもこの一枚の図から
「商品Fは素材の香りと甘味が強く、苦味や塩味は比較的弱い」
「商品Eと商品Bはコクが強めで味の傾向が似ている」
など、さまざまなことが言えます。

このコレスポンデンス分析を使うと、例で示した「評価項目ごとの商品の分類」だけでなく、営業に役立つ様々な分析が可能になります。
「規模や業種などの顧客グループごとに、売れている商品グループを分類」
「過去購入されている商品グループごとに、追加で売れる商品グループを分類」
などのデータを視覚的に図示できるようになるのです。

主成分分析で軸を整理してわかりやすくマッピング

とはいえ、上のマップでは「甘味」や「塩味」など評価項目が8つもあるので、冒頭の課長さんのように「もうちょっとシンプルにならないか?」と思われる方もいることでしょう。そんなときに使えるのが主成分分析です。主成分分析は、たくさんある項目(変数)をより少ない変数で効率的に表現できるように要約しようというもので、この要約した変数のことを「主成分」と呼びます。この分析で一般的なのが、たくさんの変数を2つの主成分にまとめて縦横二次元のマトリクスにするというもの。

上が主成分分析の結果です。主成分1がプラスだと素材の味や香りが強く、マイナスだと苦味や塩味などの味が濃くなります。2つ目の軸である主成分2は、プラスだと甘味とコクが強く(≒旨味があり)、マイナスだと塩味が強いということになります。また、もともとは8つあった評価項目が6つに減っていますが、これは相関係数が高すぎる項目が入ったままだと分析結果が正しくなくなってしまうために、それらの項目(「バランス」と「味付け」)を削除しているからです。

統計ソフトを使うと、上の2つの軸(主成分)で商品A~Gをマッピングしたものが自動的に出力されます。それに主成分1と2の意味合いを縦軸と横軸に書き足したのが下の図です。

このように主成分分析を使って評価項目をまとめることで、最初にレーダーチャートで図解していたときよりも評価項目がシンプルになり、さらに四象限ごとに商品の特性が明確になっていることがわかります。
右上の商品D・E・Fは「素材の風味が強く、旨味の強い商品」ですし、左下の商品B・Cは「味が濃く、塩味の強い商品」とシンプルに表現できるので、これなら顧客のX社の方にもきっとわかってもらえることでしょう。

「分類」で分析するためのおすすめツール2つ

ここまでご紹介した分析手法はExcelの標準機能にはありませんので、無償または有償の分析ツールを使うことになります。以前は統計解析のツールといえば難解で高額、さらに使い勝手が悪いものが多かったのですが、最近はそれも様変わりしています。ここでは営業マネージャー/営業企画の方にも使いやすい分析ツールを2つご紹介します。

とにかくコストをかけずに簡単に分析したいという方は「HAD」がおすすめです。完全に日本語で作られていますし、Excelのマクロとして使えるので、ほかの無償分析ツールと比べて取っつきやすさはピカイチです。ただし、個人で開発されたものをオープンにシェアしているという性質のため、機能の保証などはありませんので、そこだけ注意して使っていただければと思います。

多少なら費用を払ってもよいから安心して使えるものが欲しいという方には、株式会社社会情報サービスの「エクセル統計」がおすすめです。こちらも完全日本語対応でかつExcelのマクロとして使えますし、さまざまな種類の分析手法が収められています。以前はこのような分析ソフトは1つで数十万円していたのですが、エクセル統計は1万円/年以内でライセンス購入が可能なので、かなり取っつきやすくなっています。ちなみに今回ご紹介したコレスポンデンス分析/主成分分析には、このエクセル統計を使っています。

「分類」で大事なのはデータを「正しくモデル化する力」と「解釈する力」

今回ご紹介した「分類」を使いこなすためのポイントは2つ。「正しくモデル化する力」と「解釈する力」です。

「正しくモデル化する力」とは、分析で得られた結果がもともとのデータをどれだけ漏れが少なくモデル化できているかということで、より漏れの少ない正確なモデルを作ることが大事です。正しくモデル化できているかを測る方法として、例えば先ほどの主成分分析では、以下のような表が分析結果として出力されます。

この表でモデルの正しさを表しているのが「寄与率」と「累積寄与率」。この表によると、6つまである主成分のうち最初の2つだけで、もともとのデータの86.1%をモデルに含められていますので、なかなか出来の良いモデルになっていることがわかります。コレスポンデンス分析でも出力結果に「寄与率」と「累積寄与率」が表示されますので、どれだけ正しくモデル化できているかをチェックするようにしてください。

もう一つのポイントである「解釈する力」は、私たち分析者側に求められるものです。第2回・第3回で見てきた「統計量」や「相関」「回帰」といった分析は、「この変数とこの変数の相関関係は高い」「顧客のこういう特性を見れば、売上高を予測できる」というように分析結果自体が明確な意味を持っています。

一方で、今回見てきた「分類」の分析は、乱暴な言い方をすると元の複雑なデータをわかりやすく表現するための分析なので、分析結果自体には新たな意味というものがありません。そのため、私たち分析者側で意味づけ(=解釈)してあげなければならないのです。マッピングの結果や主成分の要素を眺めてみて、「これはどういうことを指しているのだろうか」ということを考えて言葉に変えていく「解釈する力」が「分類」には欠かせませんし、いくら「正しくモデル化する力」が高い分析であっても、実際のビジネスに役立つ解釈が得られないものであれば、もっと上手に解釈できるように分析し直す必要があるのです。

統計を活用してデータ分析をもっと面白く

ここまで「営業マネージャー/営業企画のための統計活用入門」として営業現場で使える統計の手法/ツールをご紹介してきました。その中で私が一番お伝えしたかったのが、「統計をうまく使えば普段のデータ分析はもっと面白いものになる」ということです。

私は統計の役割は、データや分析結果の正しさを「確かめる」ことと、パッと見ただけでは分からない関係を「見つける」ことの2つにあると思っています。特に後者の「見つける」ができると、分析は面白いものになります。複雑なデータの中に埋没していて誰も気づいていない商品同士の売れ方の関連性や、売上や受注につながる隠れた要因を見つけられるのが統計の力。ぜひ4回の連載でご紹介した統計手法をご自分でも試してみて、データ分析の面白さを体感してください。