令和6年度 ITパスポート試験 公開問題 問65 解説 機械学習の分類
AIにおける機械学習の学習方法に関する次の記述中のa〜cに入れる字句の適切な 組合せはどれか。 教師あり学習は,正解を付けた学習データを入力することによって, a と呼 ばれる手法で未知のデータを複数のクラスに分けたり, b と呼ばれる手法で データの関係性を見つけたりすることができるようになる学習方法である。教師な し学習は,正解を付けない学習データを入力することによって, c と呼ばれ る手法などで次第にデータを正しくグループ分けできるようになる学習方法である。
- ア
- イ
- ウ ✓ 正答
- エ
解説
正解への判断基準
機械学習の学習方法は、データに正解ラベル(答え)がついているかどうかで大きく2つに分けられます。
- 教師あり学習:入力データと正解ラベルのペアを使って学習する。
- 分類:予測結果が「カテゴリ」である場合(例:メールがスパムか否か)
- 回帰:予測結果が「数値」である場合(例:来月の売上予測)
- 教師なし学習:正解ラベルのないデータから、データの構造や規則性を探す。
- クラスタリング:似たもの同士をグループ分けする
問題文で問われている内容が「数値を予測するもの」であれば回帰、「カテゴリに分けるもの」であれば分類、と判断します。
機械学習における分類と回帰の違い
試験対策として最も重要なのは、出力結果の性質に着目することです。
分類は、世の中にある事象をいくつかのグループに振り分ける作業です。たとえば、画像を見てそれが「犬」か「猫」か、あるいは「手書き数字の0~9」のどれであるかを特定する作業はすべて分類です。結果は離散的な(飛び飛びの)カテゴリになります。
一方、回帰は、連続的な数値を予測する作業です。過去の気温データから明日の気温を予想したり、物件の面積や駅からの距離から家賃を算出したりする場合に使われます。結果は0.1単位や1円単位といった数値として出力されます。
なぜこの知識が重要なのか
AI技術がビジネス現場で活用される際、最初に行うべきは「解決したい課題は、数値を当てたいのか、それともグループ分けをしたいのか」という見極めです。
たとえば、マーケティング担当者が「顧客が商品を買う確率(%)」を予測したいのであれば回帰モデルを検討します。一方で「この顧客はプレミアム会員になるか、一般会員になるか」を予測させたいのであれば分類モデルを採用します。
ITパスポート試験では、手法の名前を丸暗記するだけでなく、その手法が現実世界のどのような「予測」に使われるのかという具体例と結びつけて記憶することが、正答率を高める近道となります。クラスタリングについては、AIが自力で「この顧客たちは購買傾向が似ているから同じグループにまとめよう」と発見する教師なし学習の代表格であることをセットで覚えておきましょう。