エクセルを使った重回帰分析のやり方

前回の記事で、説明変数が1つの場合に使える単回帰分析について書きましたが、今回は説明変数が2つ以上の場合に使える「重回帰分析」を取り上げてみたいと思います。

スポンサーリンク

重回帰分析とは

重回帰分析とは、多変量解析の一種で、説明変数が2つ以上あるものを重回帰分析と呼びます。前回のようにアイスクリームの売上を予測する場合、気温だけでなく、お店の場所、値段、味などが考えられ、説明変数が1つしかない場合は稀で、大抵は重回帰分析を使います。

今回もアイスクリームの売上を予測してみましょう。

アイスクリームの売上予測をしてみる

アイスクリームの売上を重回帰分析で予測していきます。重回帰分析は2つ以上の説明変数を扱えますが、説明変数が増えると解析の精度が落ちてしまうので、説明変数は多くても6つか7つくらいに絞るといいでしょう。

例題としてアイスクリーム店A~Iの売上に対して、気温と駅からの距離を重回帰分析します。

お店売上(万円)気温(°C)駅からの距離(m)
A89.838.466.7
B78.031.985.8
C76.234.978.7
D73.427.7103.2
E79.030.992.3
F90.237.959.9
G84.628.266.7
H85.032.387.7
I84.335.288.2

エクセルにデータを入力

エクセルを起動したら「データ」から「データ分析」を選び、「回帰分析」をクリックします。

「回帰分析」を開いたら「入力Y範囲」に目的変数を、今回は「売上」の範囲を選択。
「入力X範囲」は説明変数を、今回は「気温」と「駅からの距離」を選択します。

入力が終わったら、「ラベル」にもチェックを入れておきます。
これで重回帰分析の結果が得られます。

重回帰分析結果を読む

重回帰分析で得られた数値の中でも「重相関」と「係数」に注目しましょう。

「重相関」は0~1の値をとり、1に近いほど重回帰式として良い式とみなし、0に近くなるにつれ良くない式とみなします。今回は重相関が0.8なので、まずまずの結果です。

「係数」は説明変数が、それぞれのアイスクリームの売上にどれだけ影響するかを示しています。この場合なら、気温が1度上がるごとに0.4万円売上が増え、駅からの距離が1m増えるごとに売上が0.2万円ずつ減ると読みます。

よってアイスクリームの売上予測の式は
y(売上予測)=87.2(切片)+(0.4×気温)+(-0.2×駅からの距離)という式ができました。

説明変数を選択するには

今回は売上予測に「気温」と「駅からの距離」を使いましたが、説明変数が多い場合に説明変数の最適モデルを導き出す「Ru値」というのもあります。

Ru=1-{1-(Rの2乗)}×(n+k+1)/(n-k-1)

Rの2乗:重相関の2乗
n:データの個数、回帰統計の観測数
k:説明変数の個数、回帰統計の回帰・自由度の数値

さまざまな説明変数の組み合わせのなかで、もっともRu値が高いものが現実に当てはまっている式ということになります。

以上、今回はエクセルを使った重回帰分析の説明をしました。

役立ち情報

Posted by ike