データ分析・統計・BI

【データマネジメントの教科書】DAMAホイールで全体像を掴む!あなたの仕事と11の知識領域の関係

データ分析・統計・BI

なぜ今データマネジメントが重要か

近年、「データドリブン経営」という言葉が定着しつつあり、経験や勘に頼る従来型の判断を改め、データに基づいて意思決定を行おうとする経営手法が多くの企業で取り組まれています。デジタルトランスフォーメーション(DX)という大きな潮流において、データは新しいビジネスモデルの構築や業務プロセスの効率化など、企業の成長を支える鍵であり、その核心に存在します。

しかし、データを活用してビジネス成果を追求したい組織は多いにもかかわらず、それが実現できている組織は少ないのが現状です。多くの企業は、データが部門ごとに散在している(サイロ化、同じ項目なのに定義が一致しない(メタデータ未整備)、データ品質が不安定で信頼されない、といった「データのカオス」を抱えています。

データマネジメントとは、データと情報という資産の価値を提供し、管理し、守り、高めるために、そのライフサイクルを通して計画・方針・手順などを開発、実施、監督することです。データは石油や原油のように、精製し管理して使えるものにすることで初めて多大な価値が生まれる「資産」であるため、正しい体制と運用で管理する取り組みが不可欠なのです。

DAMAホイールの全体像:地図を俯瞰する

データマネジメントは非常に広範かつ複雑な活動であり、その全体像を理解し実践するためにはフレームワークが有効です。

データマネジメントの知識体系ガイド「DMBOK (Data Management Body of Knowledge)」(第二版)で定義されているのが、「DAMAホイール図」と呼ばれるフレームワークですDAMAホイールは、データマネジメントの主要な知識領域を円形に配置し、企業がデータを価値に変えるために管理すべき領域を一覧できる「考え方の地図」として機能します。

このホイール図では、データ管理の一貫性とバランスを取るために最も重要な「データガバナンス」が中心に配置され、その周囲に10個(合計11個)の知識領域が環状に配置されています。

データマネジメントの活動は広範に及ぶため、ITスキルと非IT(業務)スキルの両方が必要とされ、各領域は相互に連携し合いながら、組織全体で協力して進めることが求められます。

中心にある「データガバナンス」とは

データガバナンスは、データに関する方針・ルール・意思決定の枠組みを定め、全体を統括する領域です。経営の方針とデータ活用をつなげる「司令塔」として機能します。

  • 扱うもの:データ方針、ポリシー、標準、役割・責任(データオーナー、スチュワード)、委員会体制など
  • 現場との関係:権限設計、データ公開範囲、品質基準など、日々の判断の拠り所となります。
  • ベストプラクティス例:
    • 経営直下のデータガバナンス委員会を設置し、全社ポリシーと優先度をそこで決定します。
    • 各重要ドメイン(顧客・商品など)ごとにデータオーナーとスチュワードを任命します。
知識領域一言コンセプト+現場イメージ
データガバナンス全領域を貫く「ルール・組織・責任分担」の枠組み
何を扱うかデータ資産の管理を、職務権限に基づいて統制し、組織として意思決定を共有・徹底させることです。全社的な原則・ポリシー・手続き・責任を定義し、ポリシーの遵守やデータ利用・管理活動を継続的に監視する仕組みを整えることをゴールとします。
現場との関係データオーナーの定義、承認プロセス、ポリシー策定、ステアリングコミッティの運営など、「誰がデータに対し責任を持ち、どのように意思決定を行うか」を定める活動です。データ利活用における問題の発生を抑制し、万一問題が発生したときに解決しやすくするための管理ルールや体制づくりでもあります。

データアーキテクチャ:データ基盤の設計図

データアーキテクチャは、組織内のデータの全体構造と流れを設計する領域です。どのシステムにどんなデータがあり、どう連携されるかの「地図」を作ります。

  • 扱うもの:システム間のデータフロー図、データドメイン定義、標準インターフェース、基盤構成など
  • 現場との関係:新システム導入や連携のたびに「どこに繋ぐか」「どのデータを使うか」の判断基準となります。
  • ベストプラクティス例:
    • EA(エンタープライズアーキテクチャ)図の中に「データ流通」観点のレイヤーをもちます。
    • コアデータ(顧客IDなど)は必ず共通基盤を経由させる標準パターンを定義します。
知識領域一言コンセプト+現場イメージ
データアーキテクチャ会社全体で「どこにどんなデータがあり、どう流れるか」の設計図
何を扱うか企業のデータニーズを明確化し、ビジネスに適したデータ構造とマスターとなる青写真を設計・維持することです。データの保存と処理の要件を明確にし、データ資産を戦略的に管理・投資するための基盤を設計します。
現場との関係業務システム・DWH・データレイク・BIツールをつなぐ全体アーキテクチャ図の作成に関わります。DMBOKの「データアーキテクチャ」は、具体的なシステム構成図ではなく、エンタープライズレベルでの大枠のデータモデルやデータフロー、ロードマップの作成を指します。

データモデリングとデザイン:業務をデータ構造に落とす

データモデリングとデザインは、業務で扱う概念をエンティティやテーブルとして構造化する領域です。業務の意味を壊さずにデータベースへ写像します。

  • 扱うもの:概念/論理/物理データモデル、ER図、命名規約、キー設計、正規化・非正規化方針など
  • 現場との関係:システム開発やDWH設計時に「解釈がブレないデータ構造」を保証します。
  • ベストプラクティス例:
    • 重要なマスタ・イベントについては必ず概念→論理→物理の3階層でモデルを作ります。
    • ビジネス用語集とデータモデルのエンティティ名を対応させ、レビューをビジネス側と一緒に行います。
知識領域一言コンセプト+現場イメージ
データモデリングとデザイン業務の概念(顧客・注文など)をテーブルやエンティティとして設計する領域
何を扱うかデータ要件を明確にし、分析・記述・伝達するために概念モデル・論理モデル・物理モデルを作成するプロセスです。これはアプリケーションやデータ管理の前提となる構造を設計する活動です。
現場との関係ER図の作成、正規化・非正規化の実施、イベント系・マスタ系の粒度の決め方など、業務の概念を整合性の高いデータ構造に落とし込み、MDMやデータガバナンスの基盤を整備します。

データストレージとオペレーション:保存と運用のしくみ

データストレージとオペレーションは、データの保存・バックアップ・運用を扱う領域です。性能・可用性・コストのバランスをとりながら、日々の安定運用を支えます。

  • 扱うもの:データベース・DWH・データレイク・バックアップ、アーカイブ、運用監視、リソース管理など
  • 現場との関係:バッチの遅延、クエリの遅さ、障害復旧など「インフラ起因の問題」を左右します。
  • ベストプラクティス例:
    • 重要度に応じたストレージ階層(ホット/ウォーム/コールド)を設計し、ライフサイクルで自動移行します。
    • RPO/RTOを明示してバックアップ・リストア手順を標準化し、定期的に復旧訓練を実施します。
知識領域一言コンセプト+現場イメージ
データストレージとオペレーションデータベースやストレージの選定・運用・バックアップなどの実務
何を扱うかデータの価値を最大化するために、永続化されるデータの設計・展開・維持を実施することです。データの可用性、完全性、性能を保障するための運用管理を含みます。
現場との関係クラウドDWH、オブジェクトストレージの選定バックアップ・リストア手順の策定、運用監視など、データの「器」を安定的に維持する実務が該当します。これはデータライフサイクル全体にわたる可用性の管理を目的とします。

データセキュリティ:守るためのルールと仕組み

データセキュリティは、データへの不正アクセスや漏えいを防ぎ、法規制を順守するための仕組みを扱う領域です。「誰が何にアクセスできるか」を設計します。

  • 扱うもの:認証・認可、暗号化、マスキング、監査ログ、アクセスレビュー、法令対応(個人情報保護など)
  • 現場との関係:現場ユーザの権限設定、第三者提供、ログ確認など、日々の運用に直結します。
  • ベストプラクティス例:
    • ロールベースアクセス制御(RBAC)と、必要に応じて属性ベース(ABAC)を組み合わせます。
    • 個人情報は保存時暗号化+分析用にはトークナイゼーションや擬似データを利用します。
知識領域一言コンセプト+現場イメージ
データセキュリティデータへのアクセス制御・暗号化・監査ログなど「守るための仕組み」
何を扱うかセキュリティポリシーを策定・実装し、データ資産に対し適切な認証・権限付与・アクセス制御・監査を行うことで、不適切なアクセスを防ぎ保護することです。データに伴うリスク管理もデータマネジメントに含まれます,。
現場との関係権限設計行・列レベルセキュリティの導入、保存データや通信データの暗号化(例えばAES暗号化)、個人情報保護対応などが該当します。プライバシー・機密性・保護に関する規制やポリシーを遵守し、持続的に管理することをゴールとします。

>データ基盤におけるロール設計に関して、以下の記事が大変参考になります!

データインテグレーションと相互運用性:サイロをつなぐ

データインテグレーションと相互運用性は、複数システム間のデータ連携・統合を扱う領域です。サイロ化されたデータをつなぎ、一貫性あるビューを作ります。

  • 扱うもの:ETL/ELTパイプライン、バッチ/リアルタイム連携、メッセージング、API連携、データマッピングなど
  • 現場との関係:レポートの数字が合わない、システム間で顧客情報が違うといった問題に直結します。
  • ベストプラクティス例:
    • 共通インターフェース仕様とマッピングルールを中央管理し、各システム連携時に再利用します。
    • CDC(変更データキャプチャ)やイベントストリーミングを用いて、できるところからリアルタイム化します。
知識領域一言コンセプト+現場イメージ
データインテグレーションと相互運用性バラバラなシステム間でデータを連携・統合するしくみ
何を扱うかアプリケーション間や組織内外のシステム間で、データが適切に移動し統合されるように管理することです。共通のモデルやインターフェースを整備し、システム間連携を容易にし複雑性を低減させます。
現場との関係ETL/ELTパイプラインの設計と運用、メッセージング、API連携、データマート間の整合性維持など、サイロ化されたデータをつなぎ、BI・アナリティクス・MDMなどの取り組みを支える統合基盤を提供します。

ドキュメント&コンテンツ管理:非構造データの扱い

ドキュメント&コンテンツ管理は、文書・画像・動画など非構造データを整理・保管・共有する領域です。ナレッジを見つけやすく、安全に扱うための仕組みを作ります。

  • 扱うもの:文書分類、フォルダ構造、メタデータ付与、版管理、検索、公開・廃棄ルールなど
  • 現場との関係:マニュアルや仕様書がどこにあるか分からない、最新がどれか分からないといった混乱を防ぎます。
  • ベストプラクティス例:
    • 公式文書はDMS/SharePoint等の一元リポジトリに集約し、版管理と公開フローを必須化します。
    • 文書テンプレとタグ(プロジェクト名、システム名など)を標準化して検索性を確保します。
知識領域一言コンセプト+現場イメージ
ドキュメント&コンテンツ管理文書・ファイル・画像・動画など非構造データの整理・版管理・検索性向上
何を扱うかデータおよびインフォメーションがあらゆる形式・媒体で取得されることを前提に、それらのライフサイクル全体を通して計画・実行・統制する管理活動です,。
現場との関係社内ポータルの整備、文書分類ポリシーの策定、アクセス権設計、電子契約書の保管など、文書やコンテンツを効率的に蓄積・検索・利用できる状態を整える活動です。

参照データ&マスターデータ管理:マスタやコード体系の整理

リファレンス&マスターデータ管理は、顧客・商品・組織など全社共通の基盤データを一元的に整備する領域です。各システムが同じマスタを参照できるようにします。

  • 扱うもの:マスタ定義、コード体系、ゴールデンレコード、同定ルール(マッチングルール)、配信方式など
  • 現場との関係:顧客数が部署ごとに違う、商品名がバラバラといった「全社で数字が合わない」問題に直結します。
  • ベストプラクティス例:
    • 重要マスタに対してMDMツールまたは中心マスタDBを用意し、そこから各システムへ配信します。
    • 顧客や取引先の重複判定ルール(名前・住所・電話など)を定義し、定期的な統合作業を運用化します。
知識領域一言コンセプト+現場イメージ
リファレンス&マスターデータ管理「顧客マスタ」「商品マスタ」など、全社共通で使う主要なデータの管理
何を扱うか組織内の共通データを管理し、データの冗長性や不整合によるリスクを低減し、品質向上とデータ統合コストの削減を実現することです。
現場との関係マスタのゴールデンレコード作成コード体系の統一、マスタ更新プロセス設計などが該当します。これにより、業務領域やアプリケーションを横断してデータを一貫性のある形で共有できるようにし、品質が担保されたマスターデータを提供します。

データウェアハウスとBI:分析用データとレポーティング

データウェアハウスとBIは、分析・意思決定のためにデータを整理・集約し、レポートやダッシュボードで提供する領域です。意思決定の「見える化」の中心となります。

  • 扱うもの:DWH/Datalakehouse、データマート、分析用スキーマ設計、BIツール設定、KPI定義など
  • 現場との関係:経営ダッシュボードや業務レポートの「元データ」と「見せ方」の両方に関わります。
  • ベストプラクティス例:
    • コアKPI(売上、LTV、解約率など)については定義書を作成し、単一の公式レポートに集約します。
    • セルフサービスBIのガバナンス(公式データソース/個人データソースの区別や公開基準)を定義します。
知識領域一言コンセプト+現場イメージ
データウェアハウスとBI分析用に整理したデータ基盤と、レポート・ダッシュボードによる可視化
何を扱うか意思決定を支援するデータを提供するために、レポート作成、クエリ処理、分析に必要な基盤を計画・構築・運用・統制することです。
現場との関係スター/スノーフレークスキーマの設計、BIツール設計、セルフサービスBIの方針策定などが該当します。業務遂行・規制遵守・分析活動を支える技術環境と統合データ基盤を提供し、ナレッジワーカーが意思決定を行う際に必要な業務分析を可能にする環境を整備します。

メタデータ管理:データの「データ」を整える

メタデータ管理は、「データのデータ」を管理する領域です。データがどこから来て、何を意味し、誰が責任者かを明らかにします。

  • 扱うもの:技術メタデータ(カラム名、型、系譜)、ビジネスメタデータ(用語定義)、プロセスメタデータ(更新頻度など)
  • 現場との関係:アナリストや開発者が「このカラムは何?」「どこで計算されている?」を素早く把握できるかを左右します。
  • ベストプラクティス例:
    • データカタログツールを導入し、主要テーブル・カラムにビジネス説明やオーナー情報を紐づけします。
    • ETL/ELTの系譜情報を自動収集し、レポートからソースシステムまでたどれるリネージュ表示を提供します。
知識領域一言コンセプト+現場イメージ
メタデータ管理「このデータはどこから来て、何を意味し、誰が責任者か」といった付帯情報の管理
何を扱うかデータを理解し、管理するために必要な、データについてのデータ(メタデータ)を管理します。メタデータは、データを生成、処理、使用する様々なプロセスの中から生まれるため、データとして管理する必要があります,。
現場との関係データカタログの構築、ビジネス用語集の整備、データリネージュ(データの来歴)の可視化などが該当します。メタデータ管理は、データマネジメント全体を改善する第一歩になることが多いです。

データ品質:信頼できるデータとは

データ品質管理は、データが正確・完全・一貫・最新であるかを測定・改善する領域です。データへの信頼度を維持するための「品質保証」の役割を果たします。

  • 扱うもの:品質ディメンション(正確性、一貫性、完全性、適時性など)、品質ルール、チェックプロセス、モニタリング指標
  • 現場との関係:誤請求・誤分析・誤判断など、ビジネスインパクトの大きいトラブルを未然に防ぎます。
  • ベストプラクティス例:
    • 重要テーブルに対して品質チェック(NULL率、重複率、コード不整合など)を定義し、パイプラインに自動組み込みます。
    • 品質インシデントを「どのルールで、どの程度の件数が、どの期間発生したか」を記録し、改善サイクルを回します。
知識領域一言コンセプト+現場イメージ
データ品質データが正確・一貫・完全・最新であるかを管理する領域
何を扱うかデータマネジメントの根幹であり、データ資産が「目的に沿っていること」を保証するために管理を行います,,。ステークホルダーの品質要求事項を理解し、データがその要求に答えているかを測定する必要があります。
現場との関係重複・欠損・コード不整合の検出品質KPIの定義、クレンジングルールの策定などが含まれます。低品質なデータに対処するためのコストは、収益の10%〜30%程度に上ると専門家は推定しています。

DAMAホイール知識領域まとめ表

DAMAホイールの各成果物を表にまとめます。

知識領域STEP分類役割ゴール主な成果物
データガバナンスSTEP1
戦略と統制
全体のデータマネジメントを統括し、方針・ルール・責任を定義する。データがビジネス目標に沿って一貫性を持って活用される状態を実現する。データポリシー、ガバナンス委員会設置、役割責任マトリクス(RACI)、監視レポート。
データアーキテクチャSTEP2
基盤設計
データの全体構造と流れを設計し、システム間連携の基盤を構築する。スケーラブルで柔軟なデータ環境を整備する。データアーキテクチャ図、データフロー図、標準インターフェース仕様書。
データモデリングとデザインSTEP2
基盤設計
業務概念をデータ構造(モデル)に変換し、解釈の統一を図る。業務要件を正確に反映したデータモデルを作成する。概念/論理/物理データモデル、ER図、命名・設計規約ドキュメント。
データストレージとオペレーションSTEP3
データ資産管理
データの保存・運用・監視を担い、安定稼働を保証する。高可用・高性能なデータストレージ環境を維持する。ストレージ設計書、運用手順書、バックアップ/復旧計画、監視ダッシュボード。
データセキュリティSTEP3
データ資産管理
データの機密性・完全性・可用性を守る仕組みを構築する。リスクを最小化し、法規制遵守を実現する。セキュリティポリシー、アクセス制御リスト、暗号化仕様、監査ログレポート。
データインテグレーションと相互運用性STEP3
データ資産管理
システム間のデータ連携を標準化し、一元ビューを作成する。データサイロを解消し、シームレスな統合を実現する。ETL/ELT仕様書、データマッピング表、API/メッセージング仕様。
ドキュメント&コンテンツ管理STEP5
価値創出
非構造データの整理・版管理・検索性を向上させる。ナレッジの迅速な発見と安全共有を可能にする。文書分類スキーマ、版管理ルール、メタデータタグセット、検索インデックス。
リファレンス&マスターデータ管理STEP5
価値創出
全社共通マスタデータを一元管理し、整合性を確保する。ゴールデンレコードによるデータ品質向上を図る。マスタデータモデル、マッチング/統合ルール、MDM配信仕様書。
データウェアハウスとBISTEP5
価値創出
分析用データを集約し、意思決定支援ツールを提供する。信頼できるインサイトを迅速に届ける。DWHスキーマ設計、KPI定義書、ダッシュボード仕様、データマート定義。
メタデータ管理STEP4
品質と信頼性確保
データの意味・由来・責任者を明確に管理する。データの信頼性とトレーサビリティを高める。データカタログ、ビジネス用語集、リネージュ図、運用メタデータ。
データ品質管理STEP4
品質と信頼性確保
データの正確性・完全性などを測定・改善する。ビジネスで信頼できるデータ品質を維持する。品質ディメンション定義、品質ルールセット、品質レポート、改善計画書。

コメント

タイトルとURLをコピーしました