統計量とは【1組の標本データに目的に応じた統計学的なアルゴリズム(関数)を適用し得た、データの特徴を要約した数値】のことです。
日本産業規格では「確率変数だけで規定された関数」と定義されています。
まあ、こむずかしいことは置いといて。(笑)
今回はQC検定などでもよく出る統計量の求め方についてまとめました。
それではさっそく参りましょう、ラインナップは目次からどうぞ 🙂
目次
統計量の求め方
代表的な統計量は以下のとおりです。
統計量の求め方
- 平均値
- メディアン
- モード
- 範囲
- 平方和
- 不偏分散(標本分散)
- 標準偏差
- 変動係数
平均値
個々のデータを全部足して合計を求め、その合計をデータの個数で割れば、平均値が求められます。
平均値=(データの合計)/(データの個数)
ちなみに合計を表すギリシャ文字はΣで、「シグマ」と読みます。
ここで、かんたんに例題をやってみましょう。
例)ある商品の長さ(㎜)5個のデータ{5.1, 5.2, 5.5, 5.4, 5.2}の平均値を求めよ
平均値=26.4/5=5.28
メディアン
測定値を大きさの順に並べたときに、中央に位置する値をメディアン(中央値)と言います。
記号はXの上部に~をつけて、「Xウェーブ」と読みます。
さっそく例題をみてみましょう。
①測定値の数が奇数個の場合⇒中央に位置する値
{6,7,5,4,3}のメディアンは5
②測定値の数が偶数個の場合⇒中央の2つの値の平均値
{7,6,5,4}のメディアンは、(5+6)/2=5.5
こんな感じです。
モード
データの中で、最も多く表れている値をモードといいます。
また、現れる頻度が最も高いということで「最頻値」ともいい、度数分布表では、最も高い階級の値がモードになります。
たとえば、11人の人がいて、うち10人が300万円、1人が3,000万円持っています。
この場合の金融資産についてモードを求めると、【300万円が10人】が最も多いので、300万円がモードになるというわけです。
範囲
1組の測定値のなかの最大値と最小値との差を「範囲」といい、Rで表します。
ちなみに「範囲」なので、負の値にはなりません。
例としては、{6,7,5,4}の範囲Rは、R=7-4=3 となります。
平方和
個々の測定値と平均値との差の2乗の和を「平方和」といい、大文字のSで表します。
公式としては、
S=Σ(XiーXバー)²=ΣXi²ー(ΣXi)²/n
と表せます。
たとえば{1,2,3,4,5}の平方和を計算してみると、
S=(1+4+9+16+25)ー{(1+2+3+4+5)×(1+2+3+4+5)/5}
=55ー(15×15/5)=55ー45=10
となります。
計算補助表 | X | X² |
データ数 | 1 | 1 |
2 | 4 | |
3 | 9 | |
4 | 16 | |
5 | 25 | |
合計 | 15 | 55 |
ちなみに上記のような表をつくって考えると頭が整理されてミスを起こしにくくなるのでおすすめです。
不偏分散(標本分散)
JIS Z 8101では、不偏分散(標本分散)は、(※JIS:日本産業規格)
「各観測値の平均値から偏差値の二乗の和(平方和)を観測個数から1を引いた(Φ)で割ったバラツキの尺度」
と定義されており、Vで表します。
母分散の推定値として使われるのが一般的です。
公式:V=S/Φ
S:平方和、Φ(自由度):n-1 n=観測個数
たとえば、平方和=10、観測個数=5個のときの不偏分散Vをもとめると、
V=10/(5-1)=2.5
となります。
標準偏差
不偏分散の平方根を標準偏差といい、sで表します。
s=√不偏分散
不偏分散V=2のときの標準偏差を求めると、
s=√2≒1.4142
となります。
変動係数
標準偏差sと平均値の比を変動係数といい、CVで表します。
CV=s/x(エックスバー)
標準偏差=0.5、平均値2.0のとき、変動係数を求めると以下のとおりです。
CV=0.5/2.0=0.25
まとめ
統計量 | 求め方 |
平均値 | 平均値=(データの合計)/(データの個数) |
メディアン | ①測定値の数が奇数個の場合⇒中央に位置する値
{6,7,5,4,3}のメディアンは5 ②測定値の数が偶数個の場合⇒中央の2つの値の平均値 {7,6,5,4}のメディアンは、(5+6)/2=5.5 |
モード | データの中で、最も多く表れている値をモードという
例:11人の人がいて、うち10人が300万円、1人が3,000万円持っている この場合、【300万円が10人】が最も多いので、300万円がモードになる |
範囲 | 1組の測定値のなかの最大値と最小値との差を「範囲」といい、Rで表す
例:{6,7,5,4}の範囲Rは、R=7-4=3 |
平方和 | 公式:S=Σ(XiーXバー)²=ΣXi²ー(ΣXi)²/n
例:{1,2,3,4,5}の平方和 S=(1+4+9+16+25)ー{(1+2+3+4+5)×(1+2+3+4+5)/5} =55ー(15×15/5)=55ー45=10 |
不偏分散(標本分散) | 公式:V=S/Φ
S:平方和、Φ(自由度):n-1 n=観測個数 例:平方和=10、観測個数=5個のときの不偏分散Vをもとめると、 V=10/(5-1)=2.5 |
標準偏差 | s=√不偏分散
例:不偏分散V=2のとき s=√2≒1.4142 |
変動係数 | CV=s/x(エックスバー)
例:標準偏差=0.5、平均値2.0のとき CV=0.5/2.0=0.25 |
以上です。
また品質管理検定関連だと以下の記事もおすすめです。
- サンプリング方法(品質管理)★1分で分かる!図解でかんたん解説
- ヒストグラムの作り方かんたん解説★技術系品質管理の基礎知識
- 正規分布とは?わかりやすく標準偏差との関係や見方をていねい解説
- 新qc7つ道具まとめ★覚え方や事例をわかりやすく解説
ありがとうございました。