今回のテーマは【残差(ざんさ)】
品質管理や統計を行う上で大切なワードとなりますので、しっかりチェックしておきましょう。
さらに関連する回帰分析や計算問題もわかりやすくサクッと解説していきます。
それではさっそく参りましょう、ラインナップは目次からどうぞ 😀
目次
「残差とは」をわかりやすくサクッと解説!回帰分析もチェック
ズバリ、【残差とは目的変数(y)の値と回帰式によって予測した(y)との差のこと】です。
回帰式の説明は以下のとおりです。
【変動の分解(図解)】
回帰式(回帰方程式) | 回帰分析において、x、yの観測値の組を点に記した座標平面上で、それらの点の分布を近似的に表す直線の方程式
一次式y=ax+bで表され、最小二乗法を用いて、a、bが求められる |
回帰分析 | 結果となる数値と要因となる数値の関係を調べて、それぞれの関係を明らかにする統計的手法
要因となる数値を「説明変数」、結果となる数値を「被説明変数」という また「説明変数」が1つの場合を「単回帰分析」、複数の場合を「重回帰分析」という |
さらにくわしくは以下の記事をご覧ください。
また回帰分析で得られた回帰式がどの程度の精度であるかを表す指標として、「寄与率」があります。
さらに残差の大きさも検討する必要があります。
残差に関しては次の検討を行いましょう。
残差の検討 | 関係グラフ |
残差が正規分布に従っているかどうか | ヒストグラム
【関連記事】 |
残差と説明変数(x)は無関係化どうか | 散布図
【関連記事】 |
残差の時間的変化にクセがあるかどうか | 折れ線グラフ |
一方で、いくつかある残差の性質は以下のとおり。
残差の性質
- 残差の総和は0である(Σei=0)
- 説明変数xiと残差eiの積和は0である(Σxiei=0)※式は説明変数説明変数xiと残差eiとの間には相関がない無相関である
残差と誤差の違いと計算問題(例題)をわかりやすく解説
残差と誤差の違いはこんな感じ 🙂
残差 | 誤差 |
実際のデータを用いて推定された回帰式から算出される値と実際のデータとの差を表す
残差は計算で求められる |
求めようとする真の回帰式から算出される値と実際のデータとの差を表す
真の回帰式はあくまでも理論的なものであるため、誤差を計算で求めることはできない |
残差は計算で求められますが、誤差は計算で求められないと覚えておきましょう。
それではココで、残差に関する計算問題を解いてみましょう。
ぜひチャレンジしてみてください。
【問題】
2つの変数x、yについてn=15の標本をとり、その結果は以下のとおりでした。
- xの平均値=25.0
- yの平均値=10.0
- xの平方和Sx=1500
- yの平方和Sy=70
- xとyの積和Sxy=150
このとき、以下の分析表を完成させなさい。(ア~ク)
平方和 | 自由度 | 不偏分散 | 分散比 | |
回帰 | ア | ウ | カ | ク |
残差 | イ | エ | キ | |
計 | 70 | オ | ‐ |
【解答】
ア:平方和Srは(Sxy)²/(Sx)=150²/1500=22500/1500=15
イ:残差SeはSy-{(Sxy)²/(Sx)}=70-15=55
ウ:回帰による自由度Φ=1
エ:全体の自由度はn-2=15-2=13
オ:自由度の合計1+13=14
カ:回帰における不偏分散(V)はVr=SrよってVr=15
キ:残差における不偏分散(V)はVe=(Se/n-2)=55/13=4.23
ク:F₀=Vr/Ve=15/4.23=3.55
解答:ア(15)イ(55)ウ(1)エ(13)オ(14)カ(15)キ(4.23)ク(3.55)
残差の問題は、平方和や回帰などと関連して出されることが多いので、セットで確認しておきましょう。
「残差とは」をわかりやすくサクッと解説!回帰分析や計算問題まとめ
【残差とは目的変数(y)の値と回帰式によって予測した(y)との差のこと】
例題で残差の問題をチェックしよう!
残差と誤差の違い
残差 | 誤差 |
実際のデータを用いて推定された回帰式から算出される値と実際のデータとの差を表す
残差は計算で求められる |
求めようとする真の回帰式から算出される値と実際のデータとの差を表す
真の回帰式はあくまでも理論的なものであるため、誤差を計算で求めることはできない |
以上です。
ありがとうございました。