ITパスポート試験 / 令和8年度 ITパスポート試験 公開問題 / 問16
certification-simodake-work

令和8年度 ITパスポート試験 公開問題 問16 解説 教師あり学習の用語

教師あり学習において, 正解となる情報を付与する作業を表す用語として, 最も適切なものはどれか。

  1. ア アノテーション ✓ 正答
  2. イ エンコード
  3. ウ データクレンジング
  4. エ フィルタリング

解説

正解を選ぶ判断基準

教師あり学習における「正解ラベルを付与する作業」を指す言葉を探します。データに対して意味情報を付け加えることを意味する「アノテーション」が正解です。他の選択肢はデータ処理の段階や目的が異なるため除外します。

教師あり学習とアノテーションの役割

教師あり学習とは、AI(機械学習モデル)に「入力データ」と「正解(ラベル)」をセットで読み込ませ、その傾向やパターンを学習させる手法です。例えば、画像データを見てそれが「犬」か「猫」かを判定させる場合、元の画像に対して「これは犬」「これは猫」という正解情報を付与する必要があります。

この作業がアノテーションです。具体的には、画像の中に写っている対象物を枠で囲んだり、文章の中から特定の単語にタグを付けたりする作業を指します。質の高い学習データを用意するためには、正確で大量のアノテーションが不可欠です。AIの性能は学習データの質に大きく依存するため、この工程はAI開発において最も時間とコストがかかる重要なプロセスの一つといえます。

その他の選択肢が指す概念

問題文にある他の用語は、AI開発における前処理やデータ加工のプロセスで登場します。

エンコード(符号化) 情報を別の形式や記号に変換することです。例えば、コンピュータが処理しやすいように文字を数値(文字コード)に変換したり、データを圧縮したりする作業を指します。

データクレンジング データセットの中に含まれる、誤字脱字、欠損値、重複データなどの「不備」を取り除き、データの品質を整える作業です。「ゴミデータ」を取り除いてきれいな状態にすることを指します。

フィルタリング 一定の条件に基づいて、必要なデータを選別したり、不要なデータを取り除いたりする作業です。メールのスパムフィルタなどが身近な例です。

実務における位置付け

ITパスポート試験では、AIやビッグデータ活用の基礎知識が問われます。アノテーションを理解しておくことは、データサイエンスやDXの現場で「なぜAIの精度向上には時間がかかるのか」「データの準備にどれだけの労力が必要か」を理解するための第一歩となります。実際のビジネス現場では、クラウドソーシングを活用してアノテーションを外注したり、アノテーションを効率化するためのツールを活用したりすることが一般的です。

参考リンク

学習の記録にははてなブックマーク!

気づいたこと・覚えたことをコメントにメモしよう