エクセルを使った重回帰分析のやり方
前回の記事で、説明変数が1つの場合に使える単回帰分析について書きましたが、今回は説明変数が2つ以上の場合に使える「重回帰分析」を取り上げてみたいと思います。
重回帰分析とは
重回帰分析とは、多変量解析の一種で、説明変数が2つ以上あるものを重回帰分析と呼びます。前回のようにアイスクリームの売上を予測する場合、気温だけでなく、お店の場所、値段、味などが考えられ、説明変数が1つしかない場合は稀で、大抵は重回帰分析を使います。
今回もアイスクリームの売上を予測してみましょう。
アイスクリームの売上予測をしてみる
アイスクリームの売上を重回帰分析で予測していきます。重回帰分析は2つ以上の説明変数を扱えますが、説明変数が増えると解析の精度が落ちてしまうので、説明変数は多くても6つか7つくらいに絞るといいでしょう。
例題としてアイスクリーム店A~Iの売上に対して、気温と駅からの距離を重回帰分析します。
お店 | 売上(万円) | 気温(°C) | 駅からの距離(m) |
A | 89.8 | 38.4 | 66.7 |
B | 78.0 | 31.9 | 85.8 |
C | 76.2 | 34.9 | 78.7 |
D | 73.4 | 27.7 | 103.2 |
E | 79.0 | 30.9 | 92.3 |
F | 90.2 | 37.9 | 59.9 |
G | 84.6 | 28.2 | 66.7 |
H | 85.0 | 32.3 | 87.7 |
I | 84.3 | 35.2 | 88.2 |
エクセルにデータを入力
エクセルを起動したら「データ」から「データ分析」を選び、「回帰分析」をクリックします。

「回帰分析」を開いたら「入力Y範囲」に目的変数を、今回は「売上」の範囲を選択。
「入力X範囲」は説明変数を、今回は「気温」と「駅からの距離」を選択します。

入力が終わったら、「ラベル」にもチェックを入れておきます。
これで重回帰分析の結果が得られます。
重回帰分析結果を読む

重回帰分析で得られた数値の中でも「重相関」と「係数」に注目しましょう。
「重相関」は0~1の値をとり、1に近いほど重回帰式として良い式とみなし、0に近くなるにつれ良くない式とみなします。今回は重相関が0.8なので、まずまずの結果です。
「係数」は説明変数が、それぞれのアイスクリームの売上にどれだけ影響するかを示しています。この場合なら、気温が1度上がるごとに0.4万円売上が増え、駅からの距離が1m増えるごとに売上が0.2万円ずつ減ると読みます。
よってアイスクリームの売上予測の式は
y(売上予測)=87.2(切片)+(0.4×気温)+(-0.2×駅からの距離)という式ができました。
説明変数を選択するには
今回は売上予測に「気温」と「駅からの距離」を使いましたが、説明変数が多い場合に説明変数の最適モデルを導き出す「Ru値」というのもあります。
Ru=1-{1-(Rの2乗)}×(n+k+1)/(n-k-1)
Rの2乗:重相関の2乗
n:データの個数、回帰統計の観測数
k:説明変数の個数、回帰統計の回帰・自由度の数値
さまざまな説明変数の組み合わせのなかで、もっともRu値が高いものが現実に当てはまっている式ということになります。
以上、今回はエクセルを使った重回帰分析の説明をしました。