データの取り方・まとめ方

QC検定 3級

QC検定の出題頻度

データの取り方・まとめ方はQC検定3級では約2/3程の確率で出題されます。

試験(QC検定3級)第24回第25回第26回第27回第28回第30回
データの取り方・まとめ方1問2問1問0問0問1問

出題されない時もありますが、データの取り方・まとめ方はQC検定にとって基本的な内容で、管理図や標準偏差などで出題されるので、必ず覚えておく必要があります。

データとは

QC検定においてデータとは、情報を分かり易い形にし再度解釈できるものです。

データには数値データ言語データの2種類があります。
数値データQC七つ道具やQC検定2級に出題される統計的検定・推定、実験計画法などの手法に用いられ、言語データ新QC七つ道具に用いられます。

また、数値データには計数値データ計量値データの2種類があります。
計数値データとは基本的に不良数や不具合件数など数えられる値(整数)です。
計量値データとは重量や長さなど連続的な値(小数)です。

ただし不良率は小数まで書くことが一般的ですが、分類は計数値データになります。
※不良率は不良数(計数値データ)/生産数(計数値データ)なので、計数値データになります。

サンプリング

サンプリングとは、母集団からサンプルを採りだす行為の事です。
※母集団・・・元の全体の集団(データ)

サンプリングからデータを収集(測定)する事で、母集団の傾向を推測する事ができます。

データには必ずと言っていいほどのばらつきが含まれています。
データのバラツキは以下の式で表す事ができます。

データのバラツキ = サンプリング誤差のバラツキ + 測定誤差のバラツキ

サンプリング誤差のバラツキは、抜き取ったサンプルのバラツキかたよりの両方を含みます。

基本統計量とは

データを分布にまとめるのに、必要な指標を基本統計量と言います。
基本統計量には以下の7つがあります。

◎分布の中心を表す統計量
 1.平均値(Xbar:エックスバー)
 2.メディアン(Me)

◎分布のバラツキを表す統計量
 3.平方和(S:ラージエス)
 4.分散(V:ラージブイ)
 5.標準偏差(s:スモールエス)
 6.範囲(R:アール)
 7.変動係数(CV:シーブイ)

基本統計量の計算方法

7つの基本統計量の計算方法は以下の通りになります。

1.平均値

平均値は小学生から学んだ通り、全てのデータの総和をデータ数で割った値になります。

2.メディアン(Me)

データを大きさ順に並べた時の中央の値になります。データ数が奇数個の場合は真ん中の値になり、データ数が偶数の場合は真ん中2個の平均値になります。

【データが奇数個】
 データが1、3,,7,9(データ数5個)の場合
 Me = 6

【データが偶数個】
 データが1、3,,9,11(データ数6個)の場合
 Me = (6+7)/ 6.5

3.平方和(S:ラージエス)

平方和とはサンプルのバラツキを表す指標の1つです。各サンプルデータから平均値を引いた値を2乗、それを総和すれば平方和になります。

以下の公式で求める事ができます。

4.分散(V:ラージブイ)

データの散らばりの大きさを表す指標で、大きいほどデータが散らばっていることを表します。

統計局ホームページ
総務省統計局、統計研究研修所の共同運営によるサイトです。国勢の基本に関する統計の企画・作成・提供、国及び地方公共団体の統計職員に専門的な研修を行っています。
総務省統計局HPより引用

公式は以下の通りになります。

 V:分散、s:標準偏差、 S:平方和

5.標準偏差(s:スモールエス)

標準偏差とは平均値からの散らばり具合(ばらつき)を表す指標の一つです。

標準偏差については以下のページに詳しく書いていますので、良ければ覗いてください。
QC検定3級 QC七つ道具 ヒストグラム② 標準偏差と工程能力指数 | アンキロぱぱのQC検定3級合格のためのブログ (ankiropapa.com)

公式は以下の通りです。

6.範囲(R:アール)

範囲はデータの最大値から最小値までで、公式にすると

R = Xmax(最大値) - Xmin(最小値)

になります

7.変動係数(CV:シーブイ)

変動係数とは標準偏差を平均で割ったものです。
標準偏差を平均で割る事で、複数の集団のバラツキ(標準偏差)を比較する事ができます。

公式は以下の通りです。

コメント

タイトルとURLをコピーしました