コラム:最小二乗法とは?
Excelでは、単回帰式y=ax+bの回帰係数aと切片bを求めるのに、最小二乗法という計算方法をしています。数式を使わずにイメージだけ紹介すると、以下のようになります。
長方形で囲まれた部分を町に見立てて、プロットの1つひとつを家だと仮定します。この町に新幹線を引こうと、誰からもクレームがこないようにバランスよく5つの家から最短の距離になるように配慮してレールを引くとします(騒音がうるさいから、レールから遠くてもかまわないという意地悪なリアクションはなしでお願いします……)。
この時、レールのイメージは、y=ax+b+誤差になります。誤差とは、各家から直線に向かって、縦軸に平行な直線を引いた時の距離です。この誤差を単純に足し合わせると、プラスとマイナスが相殺されるので二乗します。
誤差を二乗することは、正方形の面積を求めることになります。最小二乗法では、この5つの正方形の面積(誤差の二乗和)が最小になるように、傾きa、切片bを求めるものです。
