今回のトライツニュースは2019年2月19日と26日の続きで、「営業マネージャー/営業企画のための統計活用入門」として、実際の営業現場で使える統計学の手法/ツールについてです。

三回目となる今回は受注確率や売上高の分析に使える「相関」と「回帰」について、皆さんがお持ちのExcelでの簡単な使い方を営業現場でよくあるシーンを使って解説していきます。これを読んだらきっと皆さんも自社のデータを使って分析してみたくなるはず。

シーン1:売れない商品Eの売り方を考える

営業会議での1シーン

課長  :商品Eの売上が目標よりずいぶん低いし、案件もあまり無いようだが。
営業マン:商品Eのニーズを誰が持っているか分からないですし、どうやって売ったらよいかも分からないので・・・
課長  :よその部署では売れているみたいだから、来週の営業会議で成功事例でも話してもらうようにお願いするよ。
営業マン:いいですね。お願いします。(事例を聞いても業種や規模が違うし、どうせ手柄話で終わりだろうなあ)

どうやって売ったらよいか分からないのに、目標だけはしっかりと与えられている商品を売ることほど大変なことはありません。そんな時に個別事情だらけの販売成功事例を聞いても、自分の顧客には置き換えられず参考にならなかったということがよくあります。

そんな時に使えるのが「相関」分析です。例えば、売れている部署から成功事例ではなく売上データを借りてきて、「商品Eと一緒に売れている傾向の強い商品を見つける」ことができれば、その商品が売れているところに商品Eを紹介すればよいということになります。売れている部署から下のような顧客別の商品の売上データをもらったらしめたもの。Excelでは「CORREL」という関数で相関係数を計算することができます。

相関係数はこう読もう

上の表の読み方をご紹介します。

商品A~商品Dの商品Eとの相関係数を計算したところ、一番数字が大きかったのは商品C(≒0.79)でした。そのため、商品Cを買っている顧客をリストアップして、商品Eを紹介するのが良さそうです。

ここで相関係数を読む上での目安をご紹介します。相関係数は、0が無相関で、+1に近づくほど相関関係が強くなります。一般的に、0.7以上が強い相関、0.4以上が中程度の相関、0.2以上が弱い相関と言われていますので、商品CとEの売上には強い相関があることが分かります。

一方で、商品Bとの相関係数はマイナスになっていますので、商品Bが多く売れている顧客では商品Eは売れないということになります。

この例では他商品の売上との相関を見ましたが、他にも顧客の規模や利益額、営業マンの経験年数など様々な変数同士の相関関係を分析することが可能です。

相関分析を使いこなす2つのコツ

このように簡単に使えて便利なExcelの「相関」分析を使いこなすためにはいくつかコツがあります。ここでは2つご紹介しましょう。

1つ目のコツは「見せかけの相関」に騙されないこと。
上の例では商品Aと商品Eの相関係数がほぼゼロになっていますがこれは見せかけ。商品Aと商品B、商品Bと商品Eなどの商品同士の色々な関係が商品AとEの相関関係に実は影響を与えているということがあります。それらの影響を取り除いた商品AとEの純粋な相関(偏相関)係数は、+0.36とそこそこの強さの相関関係がありますので、実はセットで販売できる組合せだということがあります。

2つ目のコツは「使うデータの尺度」に気を付けること。
Excelの関数で使える尺度は間隔尺度と比尺度なので、順序尺度が混ざったデータは使わないことです。(尺度については2月26日のトライツニュースを参照)

シーン2:顧客の売上高を予測する

またまた営業会議の1シーン

課長  :来年度の課の売上目標を私なりに割り振ってみましたので、確認してください。
営業マン:私の顧客のX社ですけど、まだ取引開始してから1年目なのに3,000万円も積まれているんですが・・・
課長  :そこの会社は年商もかなりの規模だから、食い込んでいける余地はきっとあるよ。
営業マン:確かにそれはそうですが、大きな売上を作るには長期的な関係性が必要だと・・・
課長  :まあ、まずは改めて情報収集してみて、そこから調整の必要があるか考えようよ。

自分の担当する顧客がどれだけの売上になりそうかは、営業マンにとって、また営業マネージャーにとっても悩みの種です。そんな時に「回帰」分析を使えば、過去の顧客データをもとに今後の予測を立てることができます。

Excel関数「TREND」でカンタン回帰分析

上の表は、顧客の「年商」や「営業利益率」「設備投資比率」「累計取引年数」というデータ(説明変数)をもとに、顧客Xの「年間売上高」(目的変数)がどのくらいまでいけそうかを分析しようというものです。Excelの「TREND」という関数を使うと33,760(3,376万円)となりますので、営業会議での課長の読みはなかなかいい線を行っていたことが分かります。

これだけでもなかなかのものですが、Excelのアドイン「分析ツール」を使うと、さらに細かい分析まで可能になります。

Excelアドイン「分析ツール – 回帰分析」の結果はこう読もう

上の表が、Excelの分析ツールを使うと出てくる分析結果です。難しそうな言葉が並んでいますが、見るべき場所は赤枠で囲っている3か所です。

1つ目は「重決定R2」です。これは回帰分析の予測精度であり、作ったモデルで目的変数(「年間売上高」)がどれだけ説明できるかを示します。およそ95%の精度で予測できているので、かなりよい分析になっています。

2つ目は「有意F」。上の「重決定R2」の予測精度の数字が本当に確かなのかをチェックするための値で、一般に0.05より小さければ安全。今回のモデルでは0.004と非常に小さいので問題なしです。

最後は「P-値」。これは「年商」から「累計取引年数」までのそれぞれの説明変数を使うことの安全性を見るための数字です。これも小さいほど良く0.05が目安となります。上の例だと「年商」と「累計取引年数」を含めずに分析する方が安全なようなので、営業会議の場で「年商」を理由としていた課長も、「関係性(累計取引年数)」を理由としていた営業マンも、実は的外れな会話をしていたということになります。

回帰分析を使いこなす2つのコツ

と、営業の分析をする上でかなり使えるExcelの「回帰」。これを使っていく上でもやはりいくつか注意点があります。今回は特に大事なものを2つご紹介します。

1つ目の注意点は予測したいデータ(目的変数)を売上高のような連続した数字データにすること。
今やっている商談が「受注」するか「失注」するか分析したいと言う場合は、受注/失注のデータを受注金額や数量に置き換える(失注の場合は見積金額を負の値にする)などの工夫をすればOKです。

もう1つの注意点は、分析前後のデータのチェックです。
例えば先ほどの分析のデータの中に「従業員数」のように「年商」とかなり相関関係の強いものを追加して分析すると、多重共線性という問題が起こって回帰分析の結果が不安定になってしまいます。そのため、回帰分析をする前に説明変数の相関関係を計算しておき0.9を超えるデータは削除しておくということが必要です。

また、先ほど見たように「P-値」が高い変数がある場合は、それを除いてもう一度分析してみることがお勧めです。ちなみに「年商」と「累計取引年数」を除いて分析すると、重決定R2は0.948のまま、有意Fはさらに小さくなり、0.42もあった「設備投資比率」のP-値も0.11にまで下がりますので、より良いモデルになると言えます。

「相関」「回帰」で大事なのはデータをイメージする力

今回ご紹介した「相関」と「回帰」を使いこなすにあたって、一番のポイントは「関係性が隠れているデータをイメージする力」ことです。例えば、売上高を予測するのにどんなデータがあったら良いだろうと考えること。営業マンのスキルでも予測できるか?顧客企業の長期的な伸び率を見るのに新卒採用人数が使えないか?などとイメージを膨らませてみて、実際にいくつかのデータを集めて分析しそのイメージの確からしさをチェックする。このイメージ力があるかないかで、面白くて役に立つ分析結果が出るか、とこかで見たような一般的な分析結果どまりになるかが決まってくるのです。

私が以前やったことがあるのは、商談が受注するかどうかのデータに「SFA上での上司とのメッセージのやり取り」というものがありました。SFAで報告した内容に対して、上司がどれくらいの頻度で、かつどれくらいの文字量でコメントしているか、というものが商談の受注/失注と大きな相関関係があったのです。このように「関係性が隠れているデータをイメージする」ことの大事さと楽しさを感じながら、皆さんも今回ご紹介した「相関」と「回帰」をExcelで試してみてください。