平成28年度 秋期 ITパスポート試験 公開問題 問86 解説 クローラ
全文検索型検索エンジンの検索データベースを作成する際に用いられ、Web ページを自動的に巡回・収集するソフトウェアはどれか。
- ア CGI
- イ クローラ ✓ 正答
- ウ クロスサイトスクリプティング
- エ バックドア
解説
問86:Webページを自動巡回・収集するソフトウェアを特定する
解き方 問題文は「Webページを自動的に巡回・収集するソフトウェア」について問われています。選択肢の中から、この動作に合致するものを判断します。
クローラとは何か?
正解は「イ クローラ」です。クローラ(またはスパイダー、ボットとも呼ばれます)は、インターネット上のWebページを自動的に巡回し、その内容を収集するプログラムのことです。検索エンジンのデータベースを作成する際に、Web上の情報を集めるために不可欠な存在です。
なぜクローラが必要なのか?
現代のWeb検索エンジンは、インターネット上に存在する膨大な数のWebページから、ユーザーが求める情報を瞬時に見つけ出す必要があります。しかし、Webページは日々増え続け、内容も変化していきます。そのため、手作業でこれらの情報を集め、整理することは現実的ではありません。
ここでクローラの役割が重要になります。クローラは、あらかじめ定められたルールやリンクをたどって、Webサイトを効率的に巡回します。そして、収集したWebページの情報(テキスト、画像、リンク先など)を検索エンジンのデータベースに登録していきます。このデータベースがあるおかげで、私たちは検索エンジンを使って、関連性の高い情報を素早く見つけることができるのです。
この問題の教育的意図は、検索エンジンの裏側で動いている重要な技術の一つであるクローラの役割を理解することにあります。
他の選択肢について
- ア CGI (Common Gateway Interface): CGIは、Webサーバーが外部のプログラムを実行するための仕組みです。Webページに動的なコンテンツ(例えば、お問い合わせフォームの送信処理や、掲示板の投稿など)を表示するために使われますが、Webページを自動的に収集する機能はありません。
- ウ クロスサイトスクリプティング (Cross-Site Scripting, XSS): クロスサイトスクリプティングは、Webサイトの脆弱性を利用して、悪意のあるスクリプト(JavaScriptなど)をWebページに埋め込み、他のユーザーのブラウザ上で実行させる攻撃手法です。Webページを収集するソフトウェアとは全く関係ありません。
- エ バックドア (Backdoor): バックドアは、正規の認証プロセスを経ずにシステムに侵入したり、操作したりするための「裏口」となる仕組みやプログラムを指します。セキュリティ上の脅威であり、Webページを収集するソフトウェアとは異なります。