「データの民主化」はDXの文脈で語られる
企業において「データの民主化」というキーワードはDXの文脈で語られます。そもそもDXとは何でしょうか。DXとは単なるIT投資ではなく、経営・基盤・文化の変革です。DXは単なるICT化、IT導入といったものではなく、最終的には経営や企業文化の変革を目指すために実施するものです。つまりは経営者の意識行動変革、組織体制、企業運営制度の変革、従業員の意識行動変革のことですが、組織の体制や、企業の運営、仕事の仕方までを含んでいます。
ここで企業のDXの推進状況を確認してみたいと思います。というのも、すでにある企業において競争優位性が保たれているのであれば「DXは不要では?」と言われたり「少し動いてはみたものの上手くいかない」という声がよく聞こえるからです。アンケートを実施して調べてみますと、やはり企業の9割が未着手、もしくは散発的な実施にとどまっているということが明らかになりました。
一方で、コロナ禍により人々の価値観が変化し、多くの企業でテレワークが導入されるなど、デジタルビジネスへの移行は急速に進みました。印鑑の 使用、対面での打ち合わせ、常駐勤務など、これまで企業が頑なに守ってきた企業文化は外的要因で強制的に一部DX化させられたのです。素早く変革する、継続して変わっていくという点は、DXの一つの本質です。
DXに取り組むことになれば、企業はビジネス戦略を素早くシステムに反映し、デジタルでの業務の改革を行うことになります。そのシステムで発生した結果、つまりデータを集めて分析し、戦略に反映していくわけです。ここでのポイントは、このサイクルをいかに迅速にしていくかということにあります。そのために、システムには柔軟性のほか、溜まりゆくデータに対応できる拡張性が必要です。このようなポイントを実現してこそ、真にDXに対応できる企業になっていきます。
自社ビルを作ると業績が伸びる?
DX推進のためのシステムのポイントについて教科書的な話をしましたが「そうは言っても、なかなかうまくいかないんだよ」というのが現実だと思います。
業界内でよく聞く笑い話に、データアナリストが成長する企業の特徴を出そうとデータの分析をしたところ、自社ビルを持っている会社は業績が伸びているという関連性を発見し「自社ビルを作ると業績が伸びる」というレポートを作ったというものがあります。そこまで極端な「結果」を出してくる人はなかなかいないですが、実はこのエピソードを笑えないような、因果関係の逆転した結果が出てくることはよくあります。
ベンダーロックインとPoC疲れ
そもそも、データ分析の前にデータの収集に時間がかかっているという問題もあります。この要因としてよく聞くのは、データのソースがサイロ化し、分散しているということです。企業の情報システムは、長い時間をかけて建て増しで作られてきたケースが多いので、そもそもシステム自体がサイロ化していて、データが一つに集まっていない。その状況で、必要なデータを取得しようと思った場合、まずどこのシステムにこのデータがあるのかを確認して探し、そこにアクセスして持ってくる必要があります。さらにはシステムが厳重なセキュリティで守られているため、アクセスの許可を取るのに1週間かかるなんていうことも。つまり分析に必要なデータを特定して集めてくるということ自体が、非常に手間がかかる作業になっているのです。
またそういった状況では、ベンダーロックインや担当ロックインが発生しやすくなります。 IT部門で業務が属人化していたり、外部ベンダーに業務を委託していたりすると、ちょっとしたデータを取得するのに「2週間ください」だとか「200万かかります」という答えが返ってくる。自分たちのデータにもかかわらず、IT担当者やベンダーの都合に左右されるということですね。
そのような経過を経てようやく集まったデータの分析をしてみようとするわけですが、そのデータを分析する人は外部のデータサイエンティストやデータアナリストだったりします。彼らに「データ分析のPoCをやってみましょう」と言われてやってみる。しかしながらそういったデータの専門家が事業ドメインの専門家であるケースはかなり少ないです。結果として、現場の人から見ると当たり前のことを、さも珍しいことを発見したかのようなPoCとして提出したり、因果関係が逆転した結果を出してしまったりするわけです。
そういったPoCを100回、200回とやっても、事業変革に繋がるインサイトは出てきません。そうしてPoCにばかり現場が付き合わされて疲弊してしまうというようなケースも、現実には起こっているのではないかと思います。
データの民主化で、全社員がイノベーションを起こせるように
そういった状況に対して我々三菱総研グループが提唱するのが、データの民主化と言う概念です。ここで提唱しているデータの民主化というのは、一部のデータ分析者だけではなく全社員にデータを開放し、全社員でビジネスアイディアの実現やイノベーションの創出を目指すことです。
まず真ん中の集合・統合されたデータストレージに、各ソースや外部から発生するデータを集めておきます。IT担当者の役割は、このデータストレージに、継続的にデータが溜まるようにメンテナンスすることです。つまり全ての必要なデータが予め集まっているという状況を作りましょうということです。そしてそのデータは、各事業現場が、自分たちで好きな分析のツールを使って見られるようにします。そして気づきを得て、リアリティのある改善策を立案できるというわけです。こういった状況を、DXの文脈における企業の データの民主化と我々は定義をしています。
ポイントは「データへのアクセスを開放し、データの主権を取り戻すこと」
これからデータの民主化を検討しようという際に押さえておきたいポイントは「データへのアクセスを開放し、データの主権を取り戻すこと」です。
まず一丁目一番地はオンプレミスやクラウドなど各所に点在してしまっているデータを関連付けて活用できるように、一カ所に集めるということです。物理的に実際に集約してしまうというやり方もありますし、データ仮想化という技術を使って論理的に集約し、物理的にバラバラなものをまるで一つのストレージのようにアクセスするという方法もあります。 ただし後者の論理集約型の手法を用いる場合はトランザクションの整合性を意識する必要がありますし、透過的にシステムにアクセスするために、性能による影響も考慮する必要があります。 コスト的に成り立つのであれば、最初から物理的に集約してしまった方がシステムとしてはシンプルです。
続いて、各ユーザーが利用するツールに対して寛容性を持つということです。データを民主化して開放する以上、ツールに対しての自由度は最大限に高める必要があるでしょう。今はクラウドの分析ツールが主流なので、各種外部クラウドからのアクセスを確保し、外のクラウドに対して開かれたものにする必要があります。ただ、データ基盤をクラウドの上に置く場合、参照されるデータは基本的に外に流れていきますので、アウトバウンド課金に注意をしてクラウドを選ぶ必要があります。
データを集めたけれど 溜めるだけで使われないというのが、こういった取り組みをした時のバットケースです。何のデータなのかを知るデータカタログ、またデータがどこから来ていつ変更されたものが分かるデータトレーサビリティを、ユーザー自身が見えるようにして使えるかどうか判断ができるようにしておくことがポイントです。
デモクラティックとセキュアの両立は最重要ポイントです。つまりデータガバナンスの維持ですが、いかにアクセスコントロールを効かせて、トレーサビリティ、つまり誰が触ったかということを記録しておくかが大事です。ポイントは、トータルでのセキュリティマネジメント。さまざまな角度からアクセスを許容するということは、境界防御の考え方が通用しないということです。基本的にはゼロトラストの考え方を採用し、環境ではなくユーザーごとにデータへのアクセス権をコントロールすることをお勧めします。しかしながら実はこれは非常に複雑な構成になるので、知見のあるコンサルサービスを活用することも視野に入れて検討し、データの民主化を実現していただきたいと思います。
※この記事は、2023年5月31日に実施したオンラインイベント「データ民主化の方法論(Democratic Data Day Spring2023)」 における矢沢氏の講演の一部を記事としてまとめたものです。
(Modern Times編集部)