複数の説明変数がある回帰分析:重回帰分析を学ぼう
前回までは、単回帰分析を使って、2種類のデータ(説明変数は1種類)の関係を探りました。単回帰分析では、目的変数(y)と説明変数(x)の関係を「y=ax+b」(a=回帰係数、b=切片)で表しました。
今回は、目的変数(y)に影響を与えると思われる説明変数が複数あるケースを分析していきます。説明変数が2つ以上ある回帰分析を「重回帰分析」といいます。
事例:コンビニ売上に影響を与えている要因を調べ、新店舗の売上高を予測したい
渋谷エリア20店舗を統括するコンビニチェーンのマネージャーは、売上が落ち込む原因についてリサーチしています。売上と関連がありそうな要因として、次の4つを考えました。
- 接客
- 品揃え
- 面積
- 立地
そのうち、接客と品揃えについては調査を実施し、20店舗についてそれぞれ以下5段階で評価しました。
- かなり不満
- やや不満
- どちらもともいえない
- やや満足している
- とても満足している
その結果が次の表です。
選択式なのでカテゴリーデータですが、かなり不満→1点、とても満足している→5点とスコア化することで数量データとして扱うことができます。
接客と品揃えのスコアは、調査した期間の各店舗の平均値を表しています。立地は駅からの距離を表しています。さらにこのマネージャーは、分析結果をもとに新店舗の初台店の売上高を予測したいと考えています。
重回帰分析とは
このケースのように、あるデータに影響を与えていると考えられる要因(説明変数)が複数ある回帰分析のことを「重回帰分析」といいます。重回帰分析のポイントは、ずばり要因分析と予測分析です。
重回帰分析で学ぶこと
今回から3回にわたり、以下の順で学んでいきます。
- 売上に効いている要因を探す……要因分析(連載第7回)
- 最適な回帰モデルを求めて新しい店舗の売上を予測する……予測分析(連載第8回)
- 重回帰分析の注意点……多重共線性の問題(連載第9回)
要因分析:売上高にもっとも影響を与えている要因はどれだ?
目的変数y(ここでは売上高)に影響を与えている説明変数を探す分析手法です。本当に効いている要因を分析することで、改善の優先順位を決定する判断材料にできます。
要因分析結果
重回帰式を使って予測値を求める「予測分析」
単回帰分析の場合、y=ax+b (a=回帰係数、b=切片)で回帰式が表せました。重回帰分析では、説明変数が複数ありますので、 以下のように表現します。
重回帰分析の結果(求め方は後述)、表から以下の重回帰式を得ることができます。
新しく店舗を展開する場合などには、この式の説明変数に数値を代入することで、おおよその売上高を予測できます。たとえば、
求めた最適な回帰モデル(モデル式の求め方は次回説明します)に初台店の各スコアを代入すると、新しい店舗の売上予測は、899.26(千円)となります。
では具体的に、要因分析から始めていきましょう。
カンに頼らない! 2015年8月26日「Excel徹底活用!アンケート設計と分析」講座開催
Webの記事を読むのもいいけれど、リアル末吉正成さんに会って直接講義を受けませんか?
「プッシュ型リサーチの代表「アンケート」を効果的に活用するために必須の、ビジネス統計を学びます。論理的なアンケート設計、マーケティングに必須の統計の知識、Excelを使ったデータ分析の三本柱を身につければ、あなたも明日からデータに強いマーケターになれるはず!