SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

MarkeZine Day(マーケジンデイ)は、マーケティング専門メディア「MarkeZine」が主催するイベントです。 「マーケティングの今を網羅する」をコンセプトに、拡張・複雑化している広告・マーケティング領域の最新情報を効率的にキャッチできる場所として企画・運営しています。

直近開催のイベントはこちら!

MarkeZine Day 2025 Retail

Excelビジネス統計~アンケートの設計と分析~

「駅からの距離が遠いほどマンション価格が高くなる」データって? 重回帰分析の落とし穴


STEP2:相関関数で「おかしい?」説明変数と目的変数の関係性を分析

 では、「駅からの距離」(説明変数)と「マンション価格」(目的変数)の関係性を調べてみます。2種類のデータの関係性を調べるため、CORREL関数を使って「駅からの距離」と「価格」の相関係数を計算します。

 「駅からの距離」と「価格」の相関係数は、-0.23となります。回帰係数の符号はプラス、単相関係数の符号はマイナスという矛盾する結果になってしまいました。

STEP3:相関関数で説明変数の関係性を分析する

 次に、4つの説明変数間の相関を求めます。変数が複数あるので、[分析ツール]の「相関」を使って相関係数行列を求めます。

 [データ]の[データ分析]から[相関]を選択し[OK]をクリックします。2003の場合は、[メニューバー]の[ツール]を選択し、[分析ツール]をクリックし、[相関]を選択し[OK]をクリックします。

 ダイアログに従い、[入力範囲]に駅からの徒歩時間から土地面積までの範囲を指定し、[先頭行をラベルとして使用]にチェックを入れて[OK]をクリックします。

出力結果

 「駅からの徒歩時間」と「駅からの距離」は、0.998と非常に強い相関があります。常識的に考えて、距離が長ければ歩く時間もかかるというのは理解できるかと思います。つまり、ここでは、同じような意味合いのことを2つの変数で説明してしまっているわけです。

 このように、説明変数間に高い相関がある変数を取り込むことによって、回帰係数の符号と単相関係数の符号が一致しない式ができてしまうことを「多重共線性(英語のmulticollinearityを略してマルチコとも呼ばれます)の問題」と呼びます。

次のページ
多重共線性への対処法

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
Excelビジネス統計~アンケートの設計と分析~連載記事一覧

もっと読む

この記事の著者

末吉 正成(スエヨシ マサナリ)

株式会社メディアチャンネル 代表取締役。

慶應義塾大学経済学部卒。統計解析を駆使したWebマーケティングが専門。「見るサイト」から「使えるサイト」をモットーにWebサイトの付加価値を高めるコンサルティングを得意とする。

主著に「EXCELビジネス統計」(翔泳社)、「Excelでかんたん統計分析」(オーム社)、「事例で学ぶテキストマイニング」(共立出版)、「Excelでかんたんデータマイニング」(同友館)、「仕事で使える統計解析」(成美堂出版)がある。

所属:言語処理学会、日本行動計量学会、品質工学会

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

MarkeZine(マーケジン)
2015/05/20 17:33 https://markezine.jp/article/detail/16671

Special Contents

PR

Job Board

PR

おすすめ

イベント

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング