売上高に効いている要因は何か? t値をグラフで視覚的に捉える
影響度の指標である「t値」を縦棒グラフで視覚的に捉えます。
1.[接客]から[立地]、それに対応するtのデータ範囲を指定して、[挿入]タブの[グラフ]の中から[2-D縦棒]グラフを選択します。

グラフ出力結果

影響度の大きさはtの絶対値で判断します。この場合「接客>品揃え>立地>面積」の順で、売上高に影響を与えていることが分かりました。時間とコストは有限です。ある問題があるとき、限られたリソースを改善のためにどこに投入すべきか、優先順位をつける際の目安になります。
回帰係数を影響度に使えない理由とは?
目的変数に影響を与える指標として、tの絶対値を参照しました。なぜ回帰係数をそのまま影響度の指標として使えないのでしょうか? 簡単にシミュレーションしてみます。
説明変数の1つ立地の単位をkmからmに変更したデータが右です。

出力すると、以下のようになります。
立地(単位:km)の場合

立地(単位:m)の場合

kmからmへ単位を変えると、数値の上では桁が1,000倍(0.3km→300m)に変わります。この場合、tの値は変わりませんが、回帰係数の値は、-42.65が-0.04265と1/1,000倍になります。よって単位の影響を受ける回帰係数は影響度の指標としては利用できません。
そこで、t値(係数を標準誤差で割っているので単位の影響を受けません)を影響度の指標として用います。統計の教科書によっては、回帰係数を標準化した標準偏回帰係数という指標を使うこともありますが、Excelではサポートされていないので、t値を影響度の指標として用います。
重回帰分析を行う際の注意点:サンプル数は説明変数の数よりも多めにとろう!
サンプル数をn、説明変数の数をkとしたとき、n-k-1>0を満たさなければ重回帰式は求められません。できるだけn とkの差に余裕が出るようにサンプル数を多くした方がよいでしょう。
Excelの仕様制限:説明変数の数は16個まで。
分析ツールの[回帰分析]は、ソフトの仕様上、説明変数(xの範囲)は16個までと制限があります。あまりたくさん変数を用いることは、次以降で説明する多重共線性という問題もありますので、16個という制約で実務上はそんなに問題はないでしょう。
むしろ、説明変数を吟味(=仮説の設定)することなく、とにかく何でも変数として放り込んで、出力された結果を後知恵で解釈するというのは分析の手順としてあまりお勧めしません。
それでは、次回は、重回帰式(特に最適な回帰モデル)を使って予測分析を行なって行きましょう。