単回帰分析を使って売上の予測をしてみる
単回帰分析
今回は統計の手法である「単回帰分析」を取り上げてみたいと思います。
単回帰分析という言葉を初めて聞いたという方に、単会分析のわかりやすい例として取り上げたいのが「アイスクリームの販売個数と気温」の因果関係です。
夏に冷たいアイスクリームを食べたくなる経験は誰しもあるとおもいます。
実際に夏になるとアイスクリームの売り上げは伸びています。では、気温が1度高くなったらアイスクリームの販売量はどれくらい伸びるのか。
このような場合に単回帰分析を使うことができます。
単回帰分析は2つの関係性を「y=ax+b」という一次方程式の形で表します。
アイスクリームの売上:y
気温:x
この計算式で出された答えが「予測値」になります。
目的変数と説明変数
単回帰分析で予測したい変数を「目的変数」。目的変数に影響を与える変数を「説明変数」と呼びます。
「アイスクリームの販売個数と気温」の因果関係の場合は、アイククリームの売上が目的変数、気温が説明変数となります。
エクセルを使って散布図に線を引く
ここからは実際に計算しながら単回帰分析をみていきます。
データ番号 | 気温 | アイスクリームの販売個数 |
1 | 33 | 383 |
2 | 33 | 324 |
3 | 35 | 339 |
4 | 34 | 310 |
5 | 35 | 340 |
6 | 33 | 350 |
7 | 34 | 335 |
8 | 31 | 320 |
9 | 29 | 208 |
10 | 36 | 422 |
まず上記のデータを元にエクセルで散布図を作成します。

さらにエクセルの「グラフツール」の中にある「線形近似曲線」をクリックすると、気温とアイスクリームの関係を表す単回帰分析の線が引かれます。

このグラフのように右肩上がりの直線になっていたら、目的変数と説明変数が正の相関関係にあることを示し、気温とアイスクリームの販売個数に因果関係があることを教えてくれます。
近似曲線が適切か確認する
最後に近似曲線が適切であったかを確認しましょう。
先程引いた近似曲線をダブルクリックしてオプション画面を出します。

この中から「グラフに数式を表示する」「グラフにR-2乗値を表示する」にチェックを入れます。

このうちR-2乗値の0.614は単回帰式のy=20.937x-364.1がどれくらい当てはまっているかを示す数値であり「決定係数」と呼ばれています。
決定係数が1に近いほど因果関係が強いことを表します。
この気温とアイスクリーム販売個数の場合は0.6なので、そこそこ高い因果関係があるということが言えます。