単回帰式を求める~分析ツールを利用する場合
今度は、分析ツールを使う方法を紹介します。分析ツールを使うと、散布図で得られたような数式は出力されませんが、単回帰式:y=ax+b のa(回帰係数)とb(切片)の値をそれぞれ求めることができます。
出力結果は同じものになりますが、アイスコーヒーの注文数(y)の変動を最高気温(x)でどの程度説明できているかといった回帰式の精度を出力してくれます。分析ツールを使う場合であっても、データを視覚化する必要はありますので、散布図は必ず描くようにしましょう。
1.[データ]タブの[分析]で[データ分析]を選択します。2003の場合は、[メニューバー]の[ツール]から[分析ツール]をクリックします。
2. [分析ツール]の中から[回帰分析]を選びます。
3.[OK]をクリックします。
4.[入力Y範囲]には、「結果系データ」のアイスコーヒーの注文数のデータを選択します。 [入力X範囲]には、「原因系データ」の最高気温のデータを選択します。このとき、XとY(原因と結果)を間違えないように指定してください。
5.列の先頭にデータのラベル(項目名)がある場合は[ラベル]にチェックを入れます。
6.[OK]をクリックします。
7.出力結果が表示されます。

回帰式の確認
出力結果の左下に示されている数値が、単回帰式:y=ax+bのa(回帰係数)とb(切片)となります。今回の例では、切片は30.21、最高気温の係数は11.76なので、「y=11.76x+30.21」という単回帰式が導き出されます。
散布図を利用した場合の単回帰式と同じになるはずです。
「有意F」を確認し、母集団でも成立するか確認する
回帰分析の結果が出力されたら、まず[分散分析表]にある[有意F]の値を確認します。
有意F=1.73E-12
1.73×10のマイナス12乗なので、ほぼ0に近くなります。この値が0.05よりも小さければ、母集団についてもこの式が成り立つと仮定してもよいと判断します(=回帰関係の有意性の検討)。あくまでも抽出されたサンプルから得ている式なので、これが母集団についても成り立っていなければ式を求める意義がありませんので、ここの値をしっかり確認しましょう。
この0.05は「有意水準」といって、「検定」という概念がわかっていないとピントこないかもしれません。検定については別の機会に説明しますので、今回はおまじない程度に覚えておいてください。
回帰式の精度の確認(寄与率)
散布図や分析ツールから単回帰式が出力されました。しかし、その式をそのまま鵜呑みにするのは危険です! その式が、2つの変数間の関係をどの程度表しているかを確かめておく必要があります。
回帰直線の精度の良さ(yの変化を、説明変数xでどの程度説明できるか)を判断する基準として一般的に使われているのは、単相関係数を2乗した値です。この値は、「決定係数」や「寄与率」とも呼ばれ、Excelでは「重決定R2」と表記されます。R2は0から1の値をとり(0≦R2≦1)、R2が1に近ければ近いほど回帰式の精度が良い(xとyの関係が強い)ことを意味します。
上の図の赤いカッコで囲まれた数字を見て下さい。R2が0.89ということは、アイスコーヒーの注文数の変動は、最高気温という変数で約89%説明がつくということです。単回帰分析では、文字通り説明変数xが1つ(この場合、最高気温)しかありませんので、単相関係数rの2乗が寄与率「重決定R2」と一致します。
