田口勉

田口勉

アレッポ城を見学にきた子どもたち。シリアの世界遺産であり、古代都市アレッポの聖域であった。2009年ごろ撮影。

(写真:佐藤秀明

データ駆動型社会を実現する思考とストレージ

データ駆動型社会が標榜され、急速に変化する社会環境に対応するためのDX(デジタルトランスフォーメーション)が求められている。そうした時代には、そもそもデータをどのように蓄積しておくことが重要なのか。オンプレミスからでもクラウドからでも統合してデータを蓄積できるクラウド接続ストレージ「Neutrix Cloud」を提供するNeutrix Cloud Japanで、代表取締役社長 CEOを務める田口勉氏にデータとDXの関係を尋ねる連載の第1回では、「データをどこに置くべきか」という疑問に答えてもらった。

Updated by Tsutomu Taguchi on April, 6, 2022, 8:50 am JST

過去3年に蓄積されたデータの総量は、それまでの30年間の蓄積データ量を超えている

デジタルデータは、その容量が急速に増加している。これは多くの人が感覚的に理解していることだが、その増加の勢いは想像を上回っているかもしれない。Neutrix Cloud Japan CEOの田口勉氏はこう説明する。

「すでに膨大なデジタルデータが蓄積され、さらにそのデータの蓄積は増加していきます。IDCの調べによると、2020年には全世界で59ZB(ゼータバイト、ZBはTB(テラバイト)の10億倍)のデータが蓄積されています。実は、過去3年に蓄積されたデータの総量は、それまでの30年間の蓄積データ量を超え、今後5年間に直近5年間の3倍以上のデータが蓄積されると予測されています。データの蓄積は急拡大しています」

実際、スマートフォンとSNS(交流サイト)の広がりが、カメラのデータを急増させていることは明らかだ。何を食べた、どこへ行ったということが、データ量の多い写真や動画というメディアになり、ネットワークを経由してデータとして蓄積されている。さらにはスマートフォンのカメラで撮影できる写真の品質が高まっていることも、蓄積データの増加を後押ししている。1枚当たりのデータ量が増加しているだけでなく、用途も広がっているのだ。

企業のビジネスシーンでも、こうした性能向上に伴うカメラの役割の変化がある。企業活動をする上で、様々なセンサーから得たデータを活用するIoT(モノのインターネット)が普及し、センサーからのデータが多く蓄積されるようになっている。そうしたIoT用途でも、カメラの利用は拡大している。

「カメラの性能向上により、多様なIoTセンサーでリアル世界の状況を部分的に把握するのではなく、カメラを1つ設置して画像を分析すれば、部屋の状態や人の動きなど様々なデータを得られるようになりました。このような映像IoTといった分野での用途も、データを増大させていく要因になっています」

wp-image-2797
Neutrix Cloud Japan代表取締役社長(CEO)の田口勉氏

ここでは、カメラによるデータの増加を考えてみた。古くは、情報システムは企業が先行して利用し、その一部がコンシューマーに広がっていった。メインフレームからパソコンへの流れはそうした方向性だった。ところがスマートフォン時代では、コンシューマーからITツールが広がり、企業が後追いで利用していくケースが見られる。データの増大も、後者の道を歩んでいる。

「Neutrix Cloudを開発、提供しているINFINIDATがまとめたデータでは、2010年代半ばまでのデータ蓄積はコンシューマーによるものが過半数を占めていました。ところが、IoTやDXが加速することで、徐々に蓄積するデータは企業由来のものが増え、2025年には8割を超えるデータが企業のデータになると予測しています。DXやIoTだけでなく、これまでにはなかったような新しい映像の商用利用も増えるでしょう」

個人がデータを生み出していたときは、そのデータは個々のスマートフォンやパソコン、家庭のハードディスク、そしてiCloudやGoogleDrive、Dropboxなどのクラウドストレージサービスに蓄積されていた。万が一、データがなくなったとしても、残念ではあるが気持ちを切り替えれば立ち直れるかもしれない。しかし、8割以上のデータの蓄積が企業に由来するようになると、個人のデータの蓄積とは異なるストレージ環境が求められる。

田口氏は、「企業にデータ生成がシフトしたとき、ポイントは『そのデータをどこに置くのか?』ということになります。データを蓄積する場所を適切に考えないと、データがリスクにさらされたり価値を生み出せなかったりするのです」と指摘する。

ソフト化、仮想化するストレージ

それではデータを蓄積、保管するストレージについて、技術面からその動向を見てみよう。ストレージの物理的な本質は、HDD(ハードディスクドライブ)やSSD(ソリッドステートドライブ)、DRAM(ダイナミックRAM)などが担う。これらをハードウエア的に構成した装置がストレージ機器で、その容量はGBからTB、PB(ペタバイト、1000TB)と増大してきた。それでもデジタルデータの増加は顕著であり、膨大にスケールしていくデータをどのように処理し、蓄積していくかは課題だった。

これまでのコンピューターの世界は、ハードウエアの世界の中でスケールしてきた。CPUの集積度が高まってバスやネットワークの速度が上がり、ストレージが高密度化して、求められる性能を達成してきた。しかし、と田口氏は語る。「性能向上は、ハードウエアの世界だけでは無理になってきました。そこで、ITの世界はソフトウエアデファインドによる仮想化が進みました。サーバーはVMwareなどがソフト化を進め、ネットワークもソフト化しています。高額なハードウエアのアプライアンス製品が必要だった機能が、ソフト化されて格段に安くなりました。同様に、ストレージもソフト化によってスケールする時代が到来しています」

いわゆるソフトウエアデファインドストレージ(SDS)であり、ストレージをハードウエアとソフトウエアで分離して、仮想化して取り扱えるようにする技術である。物理的な装置としてのストレージのハードウエアは、できることの限界がある。例えば大規模にスケールさせようとすると、ハードウエアコストがリニアにかかってしまい、大きなコスト削減が難しい。膨大なデータを処理できるような機能をソフトウエアで定義した、ソフト化したストレージへの要求は必然的な流れだった。

「そうした背景で、Neutrix Cloudを提供するINFINIDATはソフトウエアデファインドストレージを開発してきました。スケーラブルなストレージを低コストで提供するためには、ストレージのソフト化、仮想化が不可欠でした」

wp-image-2799
進化したクラウドストレージで高いパフォーマンスを得ることが可能。

こうしてソフト化、仮想化によってストレージが膨大なデータ蓄積の需要に対してスケールできるようになったとしても、改めてどこに企業データを保存すれば良いかを考える必要がある。自分の会社の内部なのか、外部のデータセンター、クラウドサービスなのか。

田口氏は、「一般のファイル共有サービスであるDropboxやBoxなどは、ハイパースケーラーのクラウドサービスや、Neutrix Cloudのようなクラウド接続ストレージサービスの基盤の上で動いています。1つの例を上げると、あるファイル共有サービスが、大手のクラウド事業者の基盤の利用から離れて、自前のデータセンターにデータを移行しようとしたことがありました。その際、大手クラウド事業者はデータを外部に移行するときには高額な料金を設定しているので、多額なコストをかけないと自前のデータセンターへの移行ができなかったのです」と語る。

一般的に商用のストレージサービスは、どこかの基盤の上で動いている。表面的にどのサービスを選ぶかということだけでなく、実際にどの基盤の上にデータを保存するかを考える必要があるとの指摘だ。

クラウドストレージの7ステップを確認

企業のデータが今後もますます増加し、ソフト化したストレージを有効に活用しないと対応できなくなっていくとすると、企業はクラウドストレージをどのように取り扱っていったらいいのだろうか。田口氏は、クラウドストレージの進化には7つのステップがあるという。

【ステップ1】
最初のステップ1は、クラウドストレージをデータのバックアップやアーカイブ、保全に用いるもの。そこでは安価なストレージが好まれる。安心を買うことはできるが、クラウドストレージからデータを戻して利用するには労力が必要になる。

【ステップ2】
ステップ2では、企業の蓄積するデータ量が増大し、オンプレミスで保管していたストレージデータの一部をクラウドに展開するようになる。とは言え、この段階でもまだアーカイブやデータの保全が中心の用途になる。

【ステップ3】
次いでステップ3に進む。企業の利活用するデータがさらに膨大になり、データベースなどで日々アクセスするデータをどのように保管するかが課題になる。このようにホストマシンから直接アクセスを求められるストレージを「プライマリーストレージ」と呼ぶ。オンプレミスにハイパフォーマンスストレージを導入する方法もあるが、運用管理には高度な技術を持つストレージ技術者が不可欠で、雇用や育成が難しい。

そのため、「プライマリーストレージにクラウドストレージを利用するようになってきています」(田口氏)。企業のプライムストレージもクラウドに出したほうが、合理性が高くなってきているという指摘だ。もちろんクラウドストレージの費用がかかるが、運用管理のコストはそれ以上にかさみ、クラウドに出すことが選ばれる。その際に、アプリケーションの処理も同時にクラウドに移行することが多いという。

【ステップ4】
ステップ4からは、高度なクラウドストレージの利用のステップに入る。パブリッククラウドにデータを移行することで生じる、データロックインやデータのガバナンスといった問題を回避して利用できる環境を整備するステップである。

課題の1つはデータロックインで、パブリッククラウドを提供するクラウド事業者がデータを自社のサービス内に囲い込もうという力が働くことだ。データは自社が主体的に利用できるべきであり、クラウド事業者の意向に依存しないような体制が求められる。もう1つの課題がデータガバナンスだ。パブリッククラウドの利用では、データをどこに物理的に保管しているかわからないという問題が起きる。クラウド事業者は最適化するために、多くの国にデータセンターを分散している可能性があり、必然的にデータが海外に流出してしまう。自社の「データ主権」を守るための対応が必要になるステップである。

【ステップ5】
ステップ5が、マルチクラウドへの対応である。「マルチクラウドの流れは、米国では当たり前になってきています。日本でも時間の問題で、どこかのタイミングでマルチクラウド化が進むでしょう。データロックインからの回避や、1社に依存することの共倒れの危機への対応がマルチクラウド化を加速させます。ただし、今のクラウドサービスはマルチクラウドを実現しにくく、次に進化する際の障壁になる懸念があります」(田口氏)。

【ステップ6】
マルチクラウド化が進んだ先には、ステップ6が待っている。膨大に増加したデータを処理して、データから新しい価値を生み出して企業の競争力につなげるステップだ。「今は、各企業がデータサイエンティストを多く採用して、データ分析から価値を生み出そうとしています。今後は、データサイエンティストではなく誰もがデータをうまく扱えるような仕掛けが必要になるでしょう」(田口氏)。

【ステップ7】
最後のステップ7が、複数データ拠点をシームレスに連携できるクラウドストレージの利用形態だ。オンプレミス、プライベートクラウド、パブリッククラウドと、データ拠点が多様化する。それらに存在するデータを、透過的でシームレスに扱えるようにできることで、クラウドストレージを活用する意義が高まる。田口氏は、「INFINIDATは透過的でシームレスなストレージの世界を目指していて、Neutrix Cloudはそれを具体化した1つのサービスです」という。

データをどこに、どのように蓄積するのか。その際に、クラウドストレージを活用するステップのどこに自分たちの会社がいるのかを見極めることで、最適なデータの置き方が見えてくる。DXを実現する基盤として、クラウドストレージ利用の進化の方向性を明確にするために、自社の立ち位置を確認してみたい。

(聞き手・文:岩元直久)

シームレスなストレージを実現するNeutrix Cloudとは?