令和3年度 ITパスポート試験 公開問題 問19 解説 ビッグデータの分析
ビッグデータの分析に関する記述として,最も適切なものはどれか。
- ア 大量のデータから未知の状況を予測するためには,統計的な分析手法に加え,機械学習を用いた分析も有効である。 ✓ 正答
- イ テキストデータ以外の,動画や画像,音声データは,分析の対象として扱うことができない。
- ウ 電子掲示板のコメントやSNSのメッセージ,Webサイトの検索履歴など,人間の発信する情報だけが,人間の行動を分析することに用いられる。
- エ ブログの書き込みのような,分析されることを前提としていないデータについては,分析の目的にかかわらず,対象から除外する。
解説
正解はアです。この問題は、ビッグデータの特徴(多様性)と、現代的な分析手法(機械学習)の活用について問うています。選択肢を一つずつ検討し、誤りである理由を明確にすることで正解を導き出せます。
ビッグデータ分析の基本的な考え方
ビッグデータとは、単にデータ量が多いことだけでなく、形式が多様(非構造化データ)で、発生頻度が高いといった特徴を持つデータの総称です。
アが正しい理由 機械学習は、大量のデータからパターンやルールをコンピュータ自身に見つけさせる技術です。従来の統計的な分析(平均や相関関係を出すなど)では捉えきれない複雑な関係性を導き出せるため、未来予測や未知の状況に対する判断に非常に有効です。
イが誤りである理由 ビッグデータ分析の強みの一つは、テキストデータだけでなく、動画、画像、音声といった非構造化データを分析できる点にあります。例えば、防犯カメラの映像から異常行動を検知したり、SNSに投稿された写真から流行を分析したりすることは、現代の分析手法では一般的です。
ウが誤りである理由 人間の行動を分析するために用いるデータは、SNSや検索履歴といった人間が発信した情報だけではありません。例えば、コンビニのPOSシステムが記録する購買データ、交通系ICカードの利用履歴、工場のセンサーが記録する機械の稼働状況なども、間接的に「人間の活動」を反映する重要な分析対象となります。
エが誤りである理由 ブログの書き込みのように、分析を目的として作成されていないデータを非構造化データと呼びます。これらはビッグデータ分析における宝の山です。顧客の本音やトレンドが自然な形で現れていることが多いため、分析の目的が合致していれば、積極的に分析対象として活用します。除外する理由はありません。
実務での活用と試験対策
ビッグデータ活用は、マーケティングや設備保全など幅広い分野で行われています。試験では「ビッグデータ=構造化データ(Excelのような表形式)に限らない」「機械学習は未知の予測に役立つ」という2点をおさえておきましょう。特に「テキストや画像も分析対象になる」という点は、近年のAI活用技術と関連して頻出のポイントです。
- ITパスポート試験 シラバス(IPA 独立行政法人情報処理推進機構)