STEP2:相関関数で「おかしい?」説明変数と目的変数の関係性を分析
では、「駅からの距離」(説明変数)と「マンション価格」(目的変数)の関係性を調べてみます。2種類のデータの関係性を調べるため、CORREL関数を使って「駅からの距離」と「価格」の相関係数を計算します。

「駅からの距離」と「価格」の相関係数は、-0.23となります。回帰係数の符号はプラスで、単相関係数の符号はマイナスという矛盾する結果になってしまいました。
STEP3:相関関数で説明変数の関係性を分析する
次に、4つの説明変数間の相関を求めます。変数が複数あるので、[分析ツール]の「相関」を使って相関係数行列を求めます。
[データ]の[データ分析]から[相関]を選択し[OK]をクリックします。2003の場合は、[メニューバー]の[ツール]を選択し、[分析ツール]をクリックし、[相関]を選択し[OK]をクリックします。


ダイアログに従い、[入力範囲]に駅からの徒歩時間から土地面積までの範囲を指定し、[先頭行をラベルとして使用]にチェックを入れて[OK]をクリックします。


出力結果

「駅からの徒歩時間」と「駅からの距離」は、0.998と非常に強い相関があります。常識的に考えて、距離が長ければ歩く時間もかかるというのは理解できるかと思います。つまり、ここでは、同じような意味合いのことを2つの変数で説明してしまっているわけです。
このように、説明変数間に高い相関がある変数を取り込むことによって、回帰係数の符号と単相関係数の符号が一致しない式ができてしまうことを「多重共線性(英語のmulticollinearityを略してマルチコとも呼ばれます)の問題」と呼びます。