ProVision

 View Only

実践的データ・ガバナンスのススメ(vol97-0013-ai)

By IBM ProVision posted Tue August 17, 2021 04:35 AM

  
Okubo.jpg 大久保 将也 Masaya Okubo
日本アイ・ビー・エム株式会社
グローバル・ビジネス・サービス データ・プラットフォーム・サービス
パートナー
データベース・アーキテクトとして、ミッション・クリティカルなシステムの安定稼働や、情報系システムにおける大量データの高速処理のチューニングを実現。近年では特にDXに必要なデータ・ガバナンス整備およびデータレイク基盤構築を支援。

世の中に様々なデータ・ガバナンスの文献はあるものの、それらを自社内に実際に適用することは非常に難しい。本稿では改めてデータ・ガバナンスの目的を明確にした上で、システム、プロセス、人・組織の観点で実践的にデータ・ガバナンスを整備し、データ利活用の効果を出すためのステップについて紹介する。


データ・ガバナンスの整備は難しい

デジタル・トランスフォーメーション(DX)という言葉が広まって久しいが、あらゆる企業が取り組んでいる状況において、データ・ガバナンスについて相談を受けるケースが増大している。DX推進においてデータとAIの活用は極めて重要であり、特にデータの取り扱いにおいて多くの課題をもつ企業が多く、それをどのように解決し維持運用するかが関心の中心である。
世の中にはデータ・ガバナンスに関する多くの文献も出ており、多くの企業が取り組んでいる。一方で、うまく行っている企業は少ない。なぜか?

大きく3つのケースがある。

  1. 何をやれば良いか分からない
  2. どこまでやれば良いかが分からない
  3. 誰がやれるのか?

1.については、やるべきことはDAMA DMBOK[1]をはじめとして様々な文献で体系立てて整理されている。ただし、これらを自企業において導入することは容易ではない。概念としては理解できても、それをどのように自社内で作るかが難しいからだ。

2.はデータ・ガバナンスを整備することを目的と履き違えてしまい、本質を見失っているケースである。本来はビジネス変革による新たな価値を産むことが目的のはずで、データを活用して洞察を得ることでDXを推進することは手段に過ぎない。つまり、実現するビジネス価値によってデータ・ガバナンスをどこまで整備するか、がポイントとなるはずだ。

3.そもそもデータ・ガバナンスに関する文献を読んで解釈するのも一苦労である。しかもデータ・ガバナンス組織を立ち上げるだけでは済まないし、運用が始まったら誰がそれをやるのか?ずっと自分がやるのか?そもそもできるのか?

このようにできない理由を挙げ始めると枚挙にいとまがない。やはり実践的な進め方が必要と考える。

図1:データ・ガバナンスの整備を進めるためには?


何が実現できれば良いのか?

改めてデータ・ガバナンスの目的を考える。データが適切に扱え、統計分析やAIでデータから洞察を抽出することができれば良いはずである。そのためには、自分たちはどのようなデータを持っており、それは誰が使って良いかが分かっていれば良い。それらのデータを様々な脅威から適切に守ることができれば良い。

難しいのは、企業が持つデータがサイロ化しており、かつ変化し続けているため、たった一度整備するだけでは済まない、ということである。大変な苦労を掛けて各システム・オーナーやデータ・オーナーの協力を仰いで一時的な情報を収集したところで、次のタイミングではまた状況が変化している。データ・ソースの状況は常に変化し続ける。継続的にこれらの変化を捉える仕組みを整備する仕組みが必要となる。

実践的な進め方とは

企業が持つ全てのデータに対し、あるべき姿を全部一度に実装することを考えてはいけない。それは重厚長大すぎて、実現するのにお金も時間もかかってしまう。そのような投資判断ができる経営者などいないのではないか?
目の前で実現できる効果に照らし合わせ、必要なデータに対して少しずつ整備することこそが実践的な進め方となる。この進め方には大きく3つの観点がある。

システムの観点:

データを適切に扱うにはそれを支えるシステムが必要となる。すでに多くの企業がEUCEnd User Computing)やデータ・ウェアハウスを保有し、データ利活用を進めている。一方で、新たに使いたいデータを使えなかったり、分析に必要な処理パフォーマンスが得られなかったり、という課題に直面している。近年のデータ処理機能の展開から、まずはオブジェクト・ストレージやHadoopを使用したデータ・レイクでデータの一元化を図ることがコスト面では有効である。正規化が必要なデータベースではなく、データ・ソースから抽出したデータをファイル形式のままで格納・保存する方式である。データはソース・システムにある状況では自由に活用できないため、一度自由に扱える場所に移す、という考え方である。データ・コピーができてしまうことでのデータ一元性の課題は出てしまうが、データ活用を促進しつつソース・システムへの影響を最小化するというSoR/SoI分離の意味では現時点の最良策と考える。また、データ・レイクにあるデータは処理性能が遅いというデメリットはあるものの、データ処理部分だけを切り出して他の高速データ処理を利用することも可能なので、それらの組み合わせによって適切なデータ利活用を実現することができる。

そしてもう一つ、データ・レイクにはデータ・カタログが必須の概念である。
データ利活用のために使用できるデータは全てデータ・レイクに存在する、そしてそこにあるデータはデータ・カタログによってどのようなものかを知ることができる。ここで言うデータ・カタログとは、そのデータがどこから来ていて、どのような許諾情報と紐づき、どのようなデータ変換処理によって生成・変換され、どのような業務的な意味があり、誰が扱って良いかなど、そのデータに関するあらゆるメタデータが管理されている必要がある。
そういう意味では単独のツールで全ての管理対象メタデータを管理することは難しく、一定のツールやプロセスの組み合わせ、必要に応じて人力でのメタデータ整備を組み合わせざるを得ないのが現状である。最近はAIを使って人力部分を省力化する取り組みも進んでいるため、この領域には継続して期待したい。

図2:システム観点でのスモール・スタートの考え方

プロセスの観点:

データを適切に取り扱うためのプロセスについては、DMBOK[1]等で体系づけられており、まずはそちらを参考にすることが重要である。一方で、並行してデータ活用のトライアルを実施することを強く推奨する。実際に自分たちが持つデータを取り扱おうとした際に、どのような課題があるかが重要である。データ・オーナーへの依頼プロセスがなかったり、手作業のデータ抽出のワークロードが捻出できなかったり、そもそも他部署にデータを提供して良いかどうかの判断がつかなかったり、など想像するよりもより原始的な課題に直面するケースが多い。
まずはデータ保護の最低限の取り決めを交わした上でデータ活用を進めた上で、明確になった様々な課題を順次対応していく方法が、結果的には最短となる。他にもデータ保存、データ品質、データ信頼性、マスターデータ、メタデータに関するデータ取扱の標準プロセスの考え方があるため、これらを参考にしながら使うデータを基に徐々に整備を進める方式を推奨する。

人・組織の観点:

データ・ガバナンスに必要な人・組織の役割については、こちらもDMBOK[1]等で定義されているので参考にして欲しい。ポイントはこれらの役割をいかに自身の企業で建てつけるか、というところである。もともと企業内に存在しない役割であり、それに対する研修体系も報酬体系もないケースが多い。もちろん、その役割をやるために入社した、というような人材も存在しないだろう。
存在しうるのは、データ利活用の重要性を理解し、自社のデータ環境について一定の知識を持ち、それを継続することの難しさを認識しているごく一部の担当者、というケースが多い。もしこのような人材がいれば幸運である。この貴重な人材に対し、きちんとそのタスクの価値を定義し、少しずつチームを補強していく。これが成功パターンの一つである。
コンサルティングや外部から人材を補強することも重要だが、自社データの課題把握や関連部門との信頼性構築に時間がかかるケースが多いため、やはり自社内にコアとなる専任のメンバーがいるかどうかが早期の成功のポイントとなりうる。


DX
の実現に向けて

データ・ガバナンスを整備するということは、いくら投資が必要か、という側面に偏りがちである。一方で投資の判断には効果の見込みが必須であり、それがない中での推進は非常に難しい。そういう意味でも、データ活用の効果さえ明確にできればデータ・ガバナンスにも投資しなければならない、という判断ができるはずであり、これらを両輪で進めることが実践的であり、非常に重要である。データの取り扱いに課題がある企業ほど、データ活用による変革の可能性が大きいと考える。これまでできなかった様々なデータの組み合わせや最新の分析技術はビジネス仮説の検証に有効である。実践的データ・ガバナンスの進め方とともに、まずはデータ活用の第一歩を踏み出してみてはいかがだろうか。


図3:実践的なデータ・ガバナンスの進め方



[参考文献]
[1]
監訳 DAMA日本支部 Metafindコンサルティング株式会社:DAMA-DMBOK, 2018


*ProVISION 記事一覧はこちらから


#AI
#ProVISION
#AI
#Highlights
#Highlights-home
#ProVision
#ProVision-AI
0 comments
2724 views

Permalink