令和5年度 ITパスポート試験 公開問題 問6 解説 主成分分析の活用
A 社では,顧客の行動や天候,販売店のロケーションなどの多くの項目から成るデータを取得している。これらのデータを分析することによって販売数量の変化を説明することを考える。その際,説明に使用するパラメータをできるだけ少数に絞りたい。このときに用いる分析法として,最も適切なものはどれか。
- ア ABC 分析
- イ クラスター分析
- ウ 主成分分析 ✓ 正答
- エ 相関分析
解説
この問題の解き方
この問題は「多すぎる変数を、情報の損失を抑えながら、より少数の指標にまとめる」という目的に合致する手法を選ぶことがポイントです。キーワードは「次元圧縮」であり、これに該当するのが主成分分析です。
多変量データと次元圧縮の考え方
現代のビジネスでは、顧客データや気象データなど、非常に多くの項目(変数)を収集します。しかし、項目が多すぎると計算が複雑になるだけでなく、項目同士に関連性がある場合、データが重複してノイズになることがあります。
主成分分析とは、複数の変数から互いに相関のない「主成分」と呼ばれる新しい指標を合成し、元の情報の持つ特性(バラつき)をできるだけ保持したまま、変数の数を減らす手法です。例えば、テストの点数データ(数学、物理、化学、国語、英語)を主成分分析にかけることで、「理数系能力」と「文系能力」という2つの大きな指標に集約するといったことが可能になります。
思考のプロセス
問題文の「多くの項目から成るデータ」「パラメータをできるだけ少数に絞りたい」という一文が決定的なヒントです。
- ABC分析:売上金額や在庫金額など、項目をランク付けして管理する手法であり、次元を減らすものではありません。
- クラスター分析:似たもの同士をグループ分けする手法であり、変数をまとめる目的とは異なります。
- 主成分分析:情報の密度を保ったまま次元を削減するため、設問の目的に合致します。
- 相関分析:2つの変数間の関係の強さを調べる手法であり、変数の数自体を減らすことは目的としていません。
以上の検討から、次元を削減して扱いやすくする主成分分析が正解となります。
データの可視化と意思決定への活用
この知識は、AIや機械学習の現場で非常に重要です。機械学習モデルにあまりにも多くの変数をそのまま投入すると、計算コストが膨大になるだけでなく、予測精度がかえって低下する「次元の呪い」という現象が起こります。
主成分分析を行うことで、データの本質的な構造を可視化できます。例えば、顧客アンケートの数百項目を分析して「価格志向度」や「品質志向度」という2つの主成分に集約できれば、顧客を2次元のグラフ上にプロットして、どのグループがどの戦略に反応しやすいかを一目で把握できるようになります。ビジネスの現場では、複雑すぎるデータを意思決定に使えるレベルまで単純化する、強力な武器となる手法です。