田口勉

田口勉

INFINIDAT’s Global Footprint is 7.1EB

ストレージの神様と言われるMoshe Yanai(モシェ・ヤナイ)は、EMCでSymmetrixをつくった方です。Symmetrixによって、IBMのメインフレームからストレージを切り離すことができました。EMCを辞めたあと、R&D拠点がイスラエルにありましたので、それを自分で全部買収して、新たにXIVをつくって、これは2008年にIBMに引き継がれました。このときにも、EMCから彼を慕ってストレージの技術者が大多数こちらに移る、ということがありました。
さらに2011年に、いわゆる第三世代のストレージ、すなわちクラウド対応のための大容量ストレージを開発すべくINFINIDATを設立します。そこで開発したのがInfini Boxというストレージです。「人類の英知を蓄えて、新たなコンピューティングの形を実現する」を目標に、ストレージの神様が本格的なクラウド時代のストレージをつくったのです。

Updated by Tsutomu Taguchi on September, 13, 2022, 5:00 am JST

INFINIDATの成長の軌跡

その後、Infini Boxを始めとするハードウェアのストレージアプライアンスを数多く手がけ、2018年には、マルチクラウドを実現するクラウド接続ストレージを米国でローンチしています。そしてその開発拠点が日本のNeutrix Cloudに移行し、我々が本格的なクラウド接続ストレージを継続的に開発しています。2021年にはウェスタンデジタルでデータセンター事業部門を担当していたPhil BullingerがINFINIDATの新たなCEOになりました。米国INFINIDAT に対しては、TPGパートナーズやゴールドマン・サックスが巨額の投資をしています。

Neutrix Cloudがクラウド接続ストレージを継続的に開発。
Neutrix Cloudがクラウド接続ストレージを継続的に開発。

INFINIDAT’s Global Footprint is 7.1EB

INFINIDATのストレージアプライアンスのワールドワイドでのフットプリントは、容量では7EB(1EBは1ペタバイトの1,000倍)を超えました。ただ、これは去年の既報のデータなので、またもう少し増えているでしょうね。ストレージ単体としては、既に世界で3,000社以上の大手企業に使われています。IT業界で言えば、IBM、エクイニクス、ラックスペース、タタ・コンサルタンシーなどの企業が使っています。金融ですと、Visa、シティ、フィデリティ、PayPal、MAFG(日本では三菱UFJ銀行)、チューリッヒ、バークレーズ等が使っています。通信などでは、ブリティッシュテレコム(BT)、AT&T、ベライゾン、スプリント、エリクソンなど、錚々たる企業群ですね。さらに電気自動車で有名なテスラもユーザーですし、コロナの医療データの分析で有名なジョンズ・ホプキンズ大学では、医療データの分析・活用に既に32ペタバイトのInfini Boxを使っています。企業がペタバイトクラスのデータを保有して、その企業経営に活用するという動きが活性化しているのです。

INFINIDATの世界的なフットプリントは7EBを超える。

INFINIDATの優位性

INFINIDATストレージの優位性を、オールフラッシュのエンタープライズのストレージと比較してみましょう。INFINIDATのストレージは、9割以上がハードディスクで構成されているにもかかわらず、実はオールフラッシュのストレージよりもレイテンシーも良く、安定した速さを実現しています。これは(後述する)優れたメモリキャッシュの技術と特別なソフトウエアによるものです。加えて大容量です(ワンラックで10ペタバイトのストレージ)。そして高信頼性ですね。事実上、100%のデータ保証をしています。完全無停止で高可用性を実現できるアーキテクチャがあります。そしてこれらを、極めて低コストで実現しています。オールフラッシュのストレージよりも何倍もの容量単価で展開しています。当然、消費電力も少ない。リソースの9割がハードディスクなのに、なぜこんなことができるのでしょうか。

INFINIDATストレージの優位性は大きく4点挙げられる。
INFINIDATストレージの優位性は大きく4点挙げられる。

高性能、高信頼性、低価格クラウドストレージ

図をご覧ください。下からハードディスク、SSD、DRAM、CPUとあります。それぞれの処理速度が下段に対して何倍か、ということが書いてあります。ハードディスクとSSDを比較すると、ハードディスクよりも1,000倍速いのがSSDですね。そのSSDよりも、さらに1,000倍速いのがDRAMです。最近は、このDRAMとSSDの間にSSDの100倍速いSCMのストレージクラスメモリが出たりもしていますけれども、基本的にはこのような構造だとお考えください。

クラウドストレージの構造とパフォーマンス。

図の中央を見ていただくと、INFINIDATのストレージでは、データ容量の94%がハードディスク、4%がSSD、DRAMに至ってはわずか2%です。例えば筐体が4ペタバイトのストレージだとしますと、ハードディスクが3.7ペタバイト、SSDが160テラバイト、それからDRAMが80テラバイトという構成になります。

一方、データのアクセスを見てみますと、Read、Write、すべてのアクセスの93%がDRAMだけで完結します。SSDでさえ6%、ハードディスクには1%(つまり100回に1回)しかアクセスしていません。これを実現しているのが、INFINIDATストレージの独自のデータアクセスデザインであるTrie(トライ)という特許取得済みの技術を含めたテクノロジーです。安価なハードディスク(NL-SAS)を使いつつ、性能としてはほとんどがDRAMで処理されるので、オールフラッシュのストレージよりも速く処理ができると同時に、大量なハードディスクにより、低価格なストレージが提供できているわけです。

先ほど「100%のデータ保証」と申し上げましたが、このハードディスクでは64Kのチャンク、14Ddate、2Parityで分散書き込みをしています。ここがポイントです。64Kの小さなチャンクに加え4Kバイトのメタデータが付加され、この単位にデータを分割して、複数コピーを打ちながら、480本のディスクのほぼすべてに分散で書き込むのです。複数のドライブの障害にも対応できますし、リビルド置換はわずか数分、スペアディスクも不要です。

DRAMの中にもこの64Kのチャンクが無数にありまして、この64Kのチャンクはハードディスクの中にデステージするためのストライプを構成するのですが、64K×14倍=896キロバイトのストライプをつくって、同一の動作パターン等を実行します。後述するNeural Cashも含めて最適配置し、データアクセスをソフトウェアですべてコントロールしています。結果的にアクセスの93%をDRAMで捌く、ということができるわけです。

高性能処理を実現するストレージ「Infini Box」の内部。
高性能処理を実現するストレージ「Infini Box」の内部。

この右側のInfini Boxのストレージの内部を見ますとストレージが480本入っていて、その上部に3Nodeのサーバーを設置します。ここでDRAMとSSDを構成していますが、その中でNeural Cashと言われる新しいCashのソフトウェアで処理し、機械学習や先読みを施すことで、I/Oの99%をDRAMとSSDで処理します。シーケンシャルRead、Writeという形で実行することで、WriteでもDRAMに一発で100%書き込みができます。データも圧縮していません。最終的なデータ保護層のハードディスクでは、最適なデータ配置と高機能なダブルパリティで安全性を確保しています。