平成21年度 秋期 ITパスポート試験 問14 解説 データモデリング
問14 業務で利用するデータの構造を分析し、抽出したエンティティとエンティティ間の 関係をE-R図などで整理する手法はどれか。
- ア データクリーニング
- イ データクレンジング
- ウ データマイニング
- エ データモデリング ✓ 正答
解説
キーワードで判断するデータ構造の整理手法
この問題は、キーワードの組み合わせで即答できる典型的な問題です。「エンティティ」「関係(リレーションシップ)」「E-R図」という言葉が出てきたら、迷わず「データモデリング」を選びます。これらはデータベース設計の設計図を作るための専門用語であり、他の選択肢はすべて別の目的を持つ手法であるためです。
エンティティとリレーションシップが意味すること
データモデリングとは、現実世界の複雑な業務内容を、コンピュータが扱いやすいように抽象化して整理する作業のことです。ここで使われる「エンティティ」とは、データとして保存すべき「実体(人、モノ、場所、事象など)」を指します。例えば、オンラインショップであれば「顧客」「商品」「注文」などがこれにあたります。
そして「リレーションシップ」とは、それらのエンティティ同士がどのような関係にあるかを定義したものです。例えば「顧客」が「注文」をする、「注文」には「商品」が含まれるといった、データ間のつながりを指します。これらを視覚的に分かりやすく図にしたものが「E-R図(Entity-Relationship Diagram)」です。
選択肢の選別プロセス
なぜ他の選択肢ではいけないのかを整理すると、正解の確信がより強まります。
・データクリーニング、データクレンジング これらは、分析に使う前のデータから「誤字脱字」や「不要なデータ」を取り除き、中身をきれいに整える作業を指します。データモデリングが「器(入れ物)」を設計するのに対し、これらは「中身」を洗練させる作業です。
・データマイニング これは、大量のデータの中から統計的な手法などを用いて、未知の法則性や隠れたパターンを見つけ出す技術です。すでに構築されたデータベースに対して行う「分析手法」であり、データの構造を設計する作業ではありません。
このように、整理・設計という文脈において「データモデリング」以外の用語が当てはまらないことを確認することで、自信を持って回答を絞り込めます。
実務におけるデータモデリングの重要性
データモデリングは、システム開発の最初期段階である「要件定義」や「基本設計」で非常に重要な役割を果たします。いきなりプログラミングを始めるのではなく、まず業務の流れをデータという視点で可視化しておくことで、開発者と利用者の間で「どのデータが重要か」「データ同士はどうつながっているか」という認識のズレを防ぐことができます。
また、一度構築されたデータ構造は、後のシステム改修やデータ分析のしやすさに直結します。優れたデータモデリングが行われていれば、将来的に新しいサービスを追加したいときや、AIによる高度な分析を行いたいときにも、柔軟に対応できる頑丈なシステム基盤を維持することができるのです。