DMBOKとは? 評価軸やデータマネジメントの重要性について解説

 2022.07.20  2024.03.22

データ活用の重要性が高まる近年において、データの質の向上と維持に関連する、データマネジメントの実施は大切なことです。本記事では、企業のIT部門担当者に向けて、データマネジメントの知識とノウハウが詰まった「DMBOK」を紹介する他、データ管理に重要な11項目の知識領域について解説します。

マンガでわかるSnowflake

DMBOKとは?

「DMBOK(Data Management Body of Knowledge)」は、データマネジメントの知識を、体系的にまとめた書籍を指しています。具体的には、データの質を維持・管理するのに欠かせない知識や考え方、手法などのベストプラクティスをまとめたものです。書籍自体は、アメリカに本部を置くデータマネジメント組織によって、刊行されています。

データマネジメントそのものは、データ管理の業務全般を指しますが、範囲が広いので、担当者には体系的な理解が求められます。また、近年において、企業に求められているDXやビッグデータなどと密接に関連し、データ活用を支える業務でもあるのです。

DMBOKの書籍は、2011年に1版、2017年に2版(「DMBOK2」)が刊行済みです。2版では、データマネジメントに関連する知識領域について、11の項目が定められており、データのさまざまな課題に対処するための内容が、網羅的に書かれています。

デジタルトランスフォーメーション(DX)に取り組むエンタープライズ企業の成功と挫折の現状
顧客体験価値向上DX「ストリーミングエンジンによる

データマネジメントとは

データマネジメントは、簡単に言えばデータの管理です。具体的に掘り下げると、その業務範囲は多岐にわたります。主なものを挙げるなら、データの登録・更新・活用などの処理と、それらを進めるために伴う作業も、業務範囲に含まれます。

さらに細かく見ていけば、品質管理や運用方法などを検討しながら、自社のビジネスにおいて、効果的に活かせる設計や保守を行うことも、業務のひとつです。データの効率的な利活用には、データ蓄積の仕組み化や構築した基盤の維持、責任体制の確立なども該当するでしょう。

広範囲にわたるデータマネジメントの活動は、企業の資産とも言えるデータを、適切に運用するために存在します。企業の達成したい目的や目標に合わせて、データを入手し最適な手続きを考えた上で実行します。

データマネジメントの重要性

データマネジメントの実行により、適切に整理された正しいデータを、常に利用できる状態になります。一見、地味な効果ですが、データ活用を行う企業のパフォーマンス向上に直結するので、企業にとっては重要な意味を持つのです。

まず、整理された状態から、適切なデータをピックアップするので、利用スピードが上がります。そして、信頼の置けるデータを参照するため、意思決定に迷いがなくなり、素早い判断がしやすいです。判断の早さに伴って、施策の実行スピードも上がることでしょう。

もし、データが整理されていなければ、欲しいデータを探してまとめるのに日数がかかり、さらにデータの形式が異なるので、統一するのにも時間を要するなど、余計なプロセスが発生してしまいます。それらが終わった後に、ようやく意思決定と施策実行に移るため、整理されたケースと比べて、成果を得るのが遅くなりがちです。

他にも整理によって、データの価値が実態に近い状態に最適化される、データ活用の幅が広がる、などのメリットがあります。

DMBOKにおけるデータマネジメントの領域

DMBOKにおける、知識領域の11項目について解説します。組織で行っている、データマネジメントの取り組みを振り返って、弱い領域を確認した上で問題点を顕著化し、改善していきましょう。

データガバナンス

基本的には、全社横断の活動で、データマネジメントによる利益の最大化、リスクやコストの最小化を目指します。また、目的から外れないための監督や、活動が最適になるためのサポートが欠かせません。最低限のコンプライアンスやセキュリティなどを守らせる体制づくりも、役割のひとつです。

企業全体のデータにおける、取り扱いの方針やルール、体制などをあらかじめ決めておけば、データ活用の安全な使い方を統制できます。誤ったデータの扱いによる、信頼を失うリスクを低下できます。

データマネジメントに関連するルールを作る際の考え方として、実施する側の個別の事情も汲み取ることを忘れないようにしましょう。ルールを設定しても、守られなければ意味がありません。

組織全体に対して、実効性を持った指示を出さなければならないので、経営層からの支援も不可欠です。一度決めた後でも、扱うデータの追加や組織の戦略によっては、定期的に見直す必要があるでしょう。

データアーキテクチャ

ビジネス上のデータ活用において、全体像を俯瞰するための設計図になる部分を指します。そもそもデータマネジメントは、企業が継続的なデータ活用を行うのに大切です。しかし、活用しようにも、具体的な活用法をまとめた計画がなければ、場当たり的な作業になってしまい、上手くいきません。したがって、データの収集と蓄積の後、ビジネス上の活用法を顕著にする作業を進めます。

例えば、データの取得から始まって保存された後の活用法、つまりデータが通るプロセスを把握します。活用の途中で、重複データや不均一な形式などのムダの発生防止として、データの整理と適切なデータの定義を行います。これらの作業は、企業のデータ活用のプロセスを標準化して、理解しやすい形への構築でもあるのです。

その結果、適切なデータが適切な人のもとに、適切なタイミングで届き、現場で円滑に活用されていれば、目的は達成されているでしょう。

データストレージとオペレーション

データベース管理に重点が置かれている領域です。データ価値の最大化を目的に、格納データの設計と実装のサポートを、メインの活動としています。

適切なデータベース管理も業務のひとつであり、データを要する際の抽出や、常に最新かつ正しい状態の維持、データベースの性能の最適化が求められます。もし、活動が不十分だった場合は、システムの不安定化につながるので、事業の継続性にも関わるでしょう。

実行する際は、データベースのソフトウェアに適した管理の仕組みの確立と、データベースの稼働に適した環境の構築を行います。データベースの機能を使って、データを管理しながら、ビジネスの要件に合致する保守と運用もマストです。

データベース管理は専門性が高いことから、管理が属人化したり、正常運転中における運用の見直しは不要と思われたりしがちです。しかし、事業の継続性やデータの価値にも関連しているため、管理を放棄してしまうと、事業の損失に陥るおそれを否定できません。

データモデリングとデザイン

データモデリングは、データの要件を顕著化して分析を行い、取り扱いスコープを決めるプロセスです。各データとの関連性などが書かれたものを、データモデルと言います。

適切なデータの円滑な出し入れには、適切な準備を要するので、この領域が欠かせません。組織内でデータを正しく扱うには、まずデータの意味や形式などの定義を行います。また、データが増えるにつれて、データテーブルも増えます。しかし、増えすぎると却って、各テーブルとの関連性がわかりにくくなるため、正しく運用できるように整理しなければならないのです。

データアーキテクチャの設計とも関連性があり、全体を俯瞰した際に、データの存在の顕著化によって、プロジェクトなどで連携を取りやすくなります。データの収集先やデータ項目などの整え方は、問題として挙がることが多く、それらを解決するには、データアーキテクチャとモデリングの観点が不可欠でしょう。

データセキュリティ

企業の情報セキュリティでもよく挙がる、不正アクセスやサイバー攻撃などの、さまざまな脅威からデータを守る領域です。企業が保有するデータの中には、顧客データなど機密性の高いものが多く含まれています。もし、流出や不正アクセスの被害に遭えば、企業に対する信頼性の低下につながるため、十分な対策を施さなければなりません。

例えば、セキュリティレベルの管理や役割に応じたアクセス権限の付与、障害や災害に備えたバックアップなどがあります。不正アクセスを防ぐには、ログの取得と管理を行って、検知できる体制を整えておきましょう。

セキュリティ対策を施す際は、セキュリティポリシーの作成も必要です。組織におけるセキュリティの方針を定めることにより、セキュリティ上の脅威になるものからデータ資産を保護できる他、従業員の情報保護への意識も向上します。従業員のリテラシーを高めることも、トラブル防止に役立ちます。

また、セキュリティは一度、対策を施したら終わりではなく、時代の流れや脆弱性の判明に応じて、定期的な見直しやアップデートが大切です。

データ統合と相互運用性

データ移動と統合のプロセスを指した領域です。統合については、利用しやすさを目的として、組織内でのデータ形式を統一します。一方で相互運用性は、社内の各システムとの連携力であり、全社の視点に立った設計と、整合性の取れたデータ提供を行うことがマストです。

システム間やアプリケーション間でのデータの連携は、抽出・変換・取り込みによって行われます。これらの一連動作は、英語の頭文字を取って「ETL(Extract・Transform・Load)」と呼ばれており、製品化されている処理とも言えます。

データ統合と相互運用性が求められる理由は、ソリューションの管理コストと複雑さの削減につながるからです。ETLなどが絡む各システムは、連携しつつ稼働していますが、その仕組みの最適化により、データフローを円滑にしていく狙いがあります。

既存のシステムから利活用するデータを抽出する際、マイナス要素を見つけた場合は、データ統合や相互運用性の部分に、課題が隠れている可能性があるでしょう。

データウェアハウジングとビジネスインテリジェンス

データウェアハウスとは、収集したデータを分析しやすい形に変換して蓄積される、倉庫のような場所を指します。データウェアハウスがあれば、大量のデータの中から条件に合うデータの抽出や、データの重複を避けながらの保存がスムーズです。

データベースまわりの構成は、企業によって異なりますが、データ自体はまず、データベースからデータレイクへと集約され、最後にデータウェアハウスに到着します。この仕組みがあることで、目的のデータを探す際は万が一、保存場所がわからなくても、データウェアハウスの中を探せば、おのずと見つかるでしょう。

BI(ビジネスインテリジェンス)ツールは、データウェアハウスなどに保存されているデータを分析するツールを指しており、専門知識を持たない人でも、レポート機能やデータマイニング、OLAP(Online Analytical Processing) 分析などを行える点が特徴です。データウェアハウスに蓄積された変換済みデータは、BIツールを用いた意思決定や分析が行われる際に抽出されます。

ドキュメントとコンテンツ管理

主に、データベースの外にあるデータの管理を指している領域です。ドキュメントやコンテンツには、データマネジメントに関連する、計画書やシステム仕様書などが該当します。

データに関連するドキュメントの定義および適切なコンテンツの作成も、データマネジメントの円滑な活動に貢献します。データマネジメントの整理や実行を進める過程の中で、データの種類や量が増えることがあるはずです。その場合、仕様から変更しなければならないですが、それに付随する計画書や仕様書の情報も、今後の改善に役立てるために、適切に管理した方がよいでしょう。

ドキュメントやコンテンツの管理が行き届いていると、人事異動や計画変更の際、プロジェクトの制御しやすさにもつながります。また、データベース化できない画像やメール文書、動画などの非構造化データは、埋もれて放置されやすい傾向があるので、定期的な管理を行うべきです。機密事項を含むドキュメントの場合は、情報漏洩などを発生させない、正しい取り扱い方の周知が欠かせません。

参照とマスターデータ管理

参照データとは簡単に言えば、他のデータを分類するデータです。例えば、処理中やキャンセルなどの状況を示す際に利用されますが、一度構成された後は、あまり変更されるものではありません。一方でマスターデータは、自社の業務で共通するデータを指します。主要業務で扱われ、トランザクションデータにも記録・測定・分析されます。

これらのデータの管理を行う目的は、データ品質の維持とデータ統合コストの削減です。マーケティング活動の最適化や、的確な意思決定へと導くデータ活用や分析結果は、実はデータ品質と関連しています。高い品質の維持により、データの信頼性が高くなる他、ITシステムの効率化にもつながります。結果として、顧客へ提供する商品やサービスの価値が向上していくはずです。

マスターデータと似たデータテーブルがあるなど、管理が不十分な場合は、現場の混乱を招くおそれを否めないため、運用ルールは設定しておいた方が無難でしょう。

メタデータ

メタデータとは、データに関連する定義を行ったものを指し、数値や文字列などのデータそのものではなく、属性や関連情報が記述されています。具体的には、ファイルのタイトルや作成日、データサイズ、データ型、番号の桁数などが該当します。主に、データの管理や検索性の向上に向けて付与されるものであり、データマネジメントにおいても、メタデータは不可欠です。

データの管理は適切であっても、逆にメタデータの管理が不適切である場合は、いくら多くのデータを蓄積しても、従業員が求めるデータに、アクセスしづらい状況になってしまいます。データの内容に対して、ひと目では判断が難しいので、確認に時間がかかり、コミュニケーションのコストが増加します。また、適切なメタデータの付与によって、データの不正利用の防止につながり、セキュリティ性が向上する効果も期待できるでしょう。

データマネジメントの視点から、作成すべきメタデータは、主に3つあります。業務に関連し、用途や説明などのルールを定義した「ビジネスメタデータ」と、ITに関連し、データ構造やアクセス権限など、アクセスに適切な情報を定義した「テクニカルメタデータ」、そしてシステム運用で生成され、ジョブ実行ログやデータに関連する履歴などを含めた「オペレーショナルメタデータ」が挙げられます。

データ品質

データマネジメント活動では、データ品質のチェックも欠かせません。データに欠損が生じたり、古いものが残っていたりすると、データ活用に支障が出るおそれがあります。問題を発生させないために、データ品質の定義や、測定と評価のプロセスの決定が大切です。

データ品質を測定・評価する際は、品質の問題を定量的に扱えるプロセスを決めなければなりません。データ品質の主要な評価軸については、DMBOKで次の項目が紹介されています。データの実態の正しさを見る「正確性」、データ要素に欠損がないことを表す「完全性」、求める際に即時利用できることを示す「適時性」、その他「一貫性」や「最新性」「妥当性」などの評価軸が主要なものとして、書籍内で挙げられています。

データ品質は定期的に測定し、必要に応じて修正を行うだけではなく、決められた品質を維持するために、監視を要します。また、AIでデータ分析を行う場合は、前処理の工程があります。データ品質がよい方が、良質な分析結果を得やすいので、ファイル形式を統一するなど、意識した方が望ましいでしょう。

CTA

RECENT POST「データマネジメント」の最新記事


データマネジメント

クラウドデータ移行ならSnowflake x Alation

データマネジメント

Alation、はじめました。第8回:Alation(アレーション)のデータガバナンス

データマネジメント

Alation、はじめました。第7回:Alation(アレーション)の機能《コンポーズ》

データマネジメント

データ加工の力 ― ビジネスにおけるデータ加工の必要性

DMBOKとは? 評価軸やデータマネジメントの重要性について解説
CTA

RECENT POST 最新記事

CTA

RANKING人気記事ランキング


OFFICIAL SUPPORTER