平成21年度 春期 ITパスポート試験 問80 解説 度数分布と分散
横軸を点数(0〜10点)とし, 縦軸を人数とする度数分布のグラフが, 次の黒い棒 グラフになった場合と, グレーの棒グラフになった場合を考える。二つの棒グラフを 比較して言えることはどれか。
- ア 分散はグレーの棒グラフが, 黒の棒グラフより大きい。 ✓ 正答
- イ 分散はグレーの棒グラフが, 黒の棒グラフより小さい。
- ウ 分散はグレーの棒グラフと, 黒の棒グラフで等しい。
- エ 分散はこのグラフだけで比較することはできない。
解説
この問題は、グラフの形を見て「データの散らばり具合」を比較することで解けます。グラフの山が中央に集中していれば散らばりは小さく、両端に広がっていれば散らばりは大きくなります。
分散とはデータの散らばりを示す指標
統計の世界では、データの中心からどれくらい離れているかを示す数値を分散と呼びます。計算式は で表されます。式を覚える必要はありませんが、意味合いとして「各データが平均値からどれだけ離れているか(偏差)を2乗して平均したもの」と捉えてください。
分散の値が小さいほど、データは平均値の近くに密集しています。逆に分散の値が大きいほど、データは平均値から離れた範囲まで幅広く分布していることを意味します。
グラフから判断する手順
今回の問題では、黒い棒グラフとグレーの棒グラフを比較します。
グレーの棒グラフを確認する グレーの棒グラフは、中央の「5点」に極端に人数が集中しています。他の点数(3点や7点)にいる人数は少なく、平均値(5点)付近にほとんどのデータが集まっている状態です。
黒い棒グラフを確認する 黒い棒グラフは、中央の5点だけでなく、1点から9点まで幅広く分布しています。平均値(5点)から離れた点数にも一定の人数が存在しており、グレーのグラフに比べて「裾野が広い」状態です。
二つを比較する グレーは平均値に密集しているため散らばりが小さく、黒は全体に広がっているため散らばりが大きいといえます。したがって、散らばりの指標である分散は、分布が広がっている黒い棒グラフの方が大きくなります。
選択肢を見ると「分散はグレーの棒グラフが、黒の棒グラフより大きい」とするアが正解となります。
この知識が役立つ現場
この考え方は、ITの現場における品質管理やデータ分析で非常に重要です。
たとえば、システムのレスポンス速度を測定した際、すべてのユーザーが平均的な時間で処理できているか(グラフが中央に集中)、それとも一部のユーザーだけ極端に遅い時間がかかっていないか(グラフが裾野まで広がっている)を分析する際にこの「分散」の概念を使います。
また、ある試験の得点分布を見て「平均点は同じでも、上位と下位が分かれているのか、全員が平均付近にいるのか」を評価する場合も同様です。ITパスポートで問われるのは、複雑な計算式そのものよりも、グラフを見たときに「このデータ群はどのような傾向を持っているか」を直感的に読み取る力です。