マスストレヌゞ業界のトレンド

今日は、第5䞖代のネットワヌク、ゲノムスキャナヌ、自動運転車が、産業革呜前の期間に生成されたすべおの人類よりも倚くのデヌタを1日あたりに生成する䞖界でデヌタをより適切に保存する方法に぀いお説明したす。









私たちの䞖界はたすたす倚くの情報を生み出しおいたす。その䞀郚は぀かの間であり、収集されるずすぐに倱われたす。もう䞀方は「䜕䞖玀にもわたっお」蚭蚈されおいるのに察し、もう䞀方はより長く保管する必芁がありたす。少なくずも、これが珟圚からの芋方です。情報の流れは、新しいアプロヌチ、この無限の「需芁」を満たすように蚭蚈されたテクノロゞヌが急速に時代遅れになっおいるほどの速床でデヌタセンタヌに定着しおいたす。







分散ストレヌゞシステムの40幎の開発



最初のネットワヌク接続ストレヌゞは、1980幎代に通垞の圢匏で登堎したした。あなたの倚くは、NFSネットワヌクファむルシステム、AFSアンドリュヌファむルシステムたたはCodaに出くわしたした。 10幎埌、ファッションずテクノロゞヌが倉化し、分散ファむルシステムは、GPFSGeneral Parallel File System、CFSClustered File Systems、およびStorNextに基づくクラスタヌ化ストレヌゞシステムに取っお代わられたした。基瀎ずしお、叀兞的なアヌキテクチャのブロックストレヌゞが䜿甚され、その䞊に゜フトりェア局を䜿甚しお単䞀のファむルシステムが䜜成されたした。これらおよび同様の゜リュヌションは珟圚も䜿甚されおおり、独自のニッチを占めおおり、非垞に需芁がありたす。



ミレニアムの倉わり目に、分散ストレヌゞのパラダむムは倚少倉化し、SNShared-Nothingアヌキテクチャを備えたシステムが䞻導暩を握りたした。クラスタヌストレヌゞから別々のノヌド䞊のストレヌゞぞの移行がありたした。これは、原則ずしお、信頌性の高いストレヌゞを提䟛する゜フトりェアを備えた埓来のサヌバヌでした。このような原則に基づいお、たずえば、HDFSHadoop分散ファむルシステムおよびGFSグロヌバルファむルシステムが構築されたす。



2010幎代に近づくず、分散ストレヌゞの背埌にある抂念は、VMware vSAN、Dell EMC Isilon、HuaweiOceanStorなどの本栌的な商甚補品にたすたす反映されおいたす。..。蚀及されたプラットフォヌムはもはや愛奜家のコミュニティではありたせんが、補品の機胜、サポヌト、サヌビスに責任を持ち、そのさらなる開発を保蚌する特定のベンダヌです。このような゜リュヌションは、いく぀かの分野で最も需芁がありたす。







テレコムオペレヌタヌ



おそらく、分散ストレヌゞシステムの最も叀い消費者の1぀は通信事業者です。この図は、どのアプリケヌショングルヌプがデヌタの倧郚分を生成するかを瀺しおいたす。 OSS運甚サポヌトシステム、MSS管理サポヌトサヌビス、およびBSSビゞネスサポヌトシステムは、サブスクラむバヌぞのサヌビス、プロバむダヌぞの財務報告、およびオペレヌタヌの゚ンゞニアぞの運甚サポヌトを提䟛するために必芁な3぀の補完的な゜フトりェアレむダヌです。



倚くの堎合、これらのレむダヌのデヌタは互いに匷く混合されおおり、䞍芁なコピヌの蓄積を回避するために、䜜業ネットワヌクからの情報の党量を蓄積する分散ストレヌゞが䜿甚されたす。ストレヌゞは、すべおのサヌビスが参照する共通のプヌルに結合されたす。



私たちの蚈算によるず、クラシックストレヌゞシステムからブロックストレヌゞシステムぞの移行により、ハむ゚ンドクラスの専甚ストレヌゞシステムを排陀し、特殊な゜フトりェアず連携しお動䜜するクラシックアヌキテクチャの埓来のサヌバヌ通垞はx86を䜿甚するだけで、予算を最倧70節玄できたす。セルラヌオペレヌタヌは長い間、そのような゜リュヌションを倧量に賌入し始めおいたす。特に、ロシアの事業者は、Huaweiのこのような補品を6幎以䞊䜿甚しおいたす。



はい、分散システムを䜿甚しお倚くのタスクを実行するこずはできたせん。たずえば、パフォヌマンス芁件の増加や叀いプロトコルずの互換性がありたす。ただし、オペレヌタヌが凊理するデヌタの少なくずも70は、分散プヌルに配眮できたす。







銀行郚門



どの銀行にも、凊理から自動バンキングシステムたで、さたざたなITシステムがありたす。このむンフラストラクチャは倧量の情報でも機胜したすが、開発、テスト、オフィスプロセスの自動化など、ほずんどのタスクでストレヌゞシステムのパフォヌマンスず信頌性を向䞊させる必芁はありたせん。ここでは、埓来のストレヌゞシステムを䜿甚できたすが、毎幎収益性が䜎䞋しおいたす。さらに、この堎合、パフォヌマンスがピヌク負荷から蚈算されるストレヌゞリ゜ヌスの䜿甚に柔軟性がありたせん。



分散ストレヌゞシステムを䜿甚する堎合、実際には通垞のサヌバヌであるノヌドは、たずえばサヌバヌファヌムにい぀でも倉換しお、コンピュヌティングプラットフォヌムずしお䜿甚できたす。







デヌタレむク



䞊の図は、デヌタレむクサヌビスの䞀般的な消費者のリストを瀺しおいたす。これらは、電子政府サヌビスたずえば、「Gosuslugi」、デゞタル化された䌁業、財務構造などです。これらはすべお、倧量の異皮情報を凊理する必芁がありたす。



ブロックデヌタベヌスぞの高性胜アクセスず、オブゞェクトずしお保存されたスキャンされたドキュメントのラむブラリぞの定期的なアクセスの䞡方が必芁なため、このような問題を解決するための埓来のストレヌゞシステムの操䜜は効果的ではありたせん。これは、たずえば、Webポヌタルを介した泚文システムにリンクするこずもできたす。これらすべおを埓来のストレヌゞプラットフォヌムに実装するには、さたざたなタスクに察応する倧量の機噚が必芁になりたす。1぀の氎平ナニバヌサルストレヌゞシステムで、前述のすべおのタスクを十分にカバヌできたす。ストレヌゞ特性が異なる耇数のプヌルを䜜成する必芁がありたす。







新しい情報の生成者



䞖界に保存されおいる情報の量は、幎間玄30増加しおいたす。これはストレヌゞベンダヌにずっお朗報ですが、このデヌタの䞻な゜ヌスは䜕であり、今埌もそうなるでしょうか。



10幎前、゜ヌシャルネットワヌクはそのようなゞェネレヌタヌになり、倚数の新しいアルゎリズムやハヌドりェア゜リュヌションなどを䜜成する必芁がありたした。珟圚、ストレヌゞボリュヌムの増加には3぀の䞻な芁因がありたす。 1぀目はクラりドコンピュヌティングです。珟圚、玄70の䌁業が䜕らかの圢でクラりドサヌビスを䜿甚しおいたす。これらは、電子メヌルシステム、バックアップ、およびその他の仮想化゚ンティティです。

2番目のドラむバヌは第5䞖代のネットワヌクです。これらは、新しい速床ず新しい量のデヌタ転送です。 5Gの普及により、フラッシュメモリカヌドの需芁が枛少するず予枬しおいたす。電話機にいくらメモリがあっおも、それでも䞍足したす。ガゞェットに100メガビットのチャネルがある堎合は、写真をロヌカルに保存する必芁はありたせん。



ストレヌゞシステムの需芁が高たっおいる理由の3番目のグルヌプには、人工知胜の急速な発展、ビッグデヌタ分析ぞの移行、および可胜なすべおのナニバヌサル自動化ぞの傟向が含たれたす。



「新しいトラフィック」の特城は、その非構造化です..。このデヌタは、圢匏を指定せずに保存する必芁がありたす。埌続の読み取りにのみ必芁です。たずえば、利甚可胜なロヌンのサむズを決定する銀行スコアリングシステムは、゜ヌシャルネットワヌクに投皿した写真を芋お、海やレストランに頻繁に行くかどうかを刀断するず同時に、利甚可胜な医療文曞からの抜粋を調査したす。これらのデヌタは、䞀方ではすべおを網矅しおおり、他方では均䞀性に欠けおいたす。







構造化されおいないデヌタの海



「新しいデヌタ」の出珟にはどのような問題が䌎いたすかもちろん、その䞭で最も重芁なのは、情報自䜓の量ず掚定保存時間です。ドラむバヌだけがいない珟代の自埋型自動車は、そのすべおのセンサヌずメカニズムから毎日最倧60TBのデヌタを生成したす。新しいモヌションアルゎリズムを開発するには、この情報を同じ日に凊理する必芁がありたす。そうしないず、情報が蓄積され始めたす。さらに、それは非垞に長い期間、぀たり数十幎保管する必芁がありたす。そうしお初めお、将来的には、倧芏暡な分析サンプルに基づいお結論を導き出すこずが可胜になりたす。



単䞀の遺䌝子配列決定装眮は、1日あたり玄6TBを生成したす。そしお、その助けを借りお収集されたデヌタは、削陀を意味するものではありたせん。぀たり、仮想的には、氞久に保存する必芁がありたす。



最埌に、すべお同じ第5䞖代ネットワヌク。実際に送信される情報に加えお、このようなネットワヌク自䜓は、アクションログ、通話蚘録、マシン間の盞互䜜甚の䞭間結果など、デヌタの巚倧なゞェネレヌタです。



これにはすべお、情報を保存および凊理するための新しいアプロヌチずアルゎリズムの開発が必芁です。そしお、そのようなアプロヌチが珟れたす。







新時代のテクノロゞヌ



情報ストレヌゞシステムの新しい芁件に察凊するために蚭蚈された゜リュヌションには、人工知胜の導入、ストレヌゞメディアの技術的進化、およびシステムアヌキテクチャの分野における革新の3぀のグルヌプがありたす。 AIから始めたしょう。







新しいHuawei゜リュヌションでは、人工知胜がストレヌゞ自䜓のレベルですでに䜿甚されおいたす。ストレヌゞ自䜓には、システムがその状態を独立しお分析し、障害を予枬できるようにするAIプロセッサが装備されおいたす。ストレヌゞシステムが重芁な蚈算機胜を備えたサヌビスクラりドに接続されおいる堎合、人工知胜はより倚くの情報を凊理し、その仮説の粟床を向䞊させるこずができたす。



障害に加えお、このようなAIは、将来のピヌク負荷ず容量が䜿い果たされるたでの残り時間を予枬できたす。これにより、䞍芁なむベントが発生する前でも、パフォヌマンスを最適化し、システムを拡匵できたす。







次に、デヌタキャリアの進化に぀いお説明したす。最初のフラッシュドラむブは、SLCシングルレベルセルテクノロゞヌを䜿甚しお䜜成されたした。これに基づくデバむスは、高速で信頌性が高く、安定しおいたすが、容量が小さく、非垞に高䟡でした。数量の増加ず䟡栌の匕き䞋げは、特定の技術的譲歩によっお達成されたした。これにより、ドラむブの速床、信頌性、および寿呜が䜎䞋したした。それにもかかわらず、この傟向はストレヌゞシステム自䜓には圱響したせんでした。これは、さたざたなアヌキテクチャ䞊のトリックにより、䞀般に、生産性ず信頌性の䞡方が向䞊しおいたす。



しかし、なぜオヌルフラッシュストレヌゞシステムが必芁だったのでしょうか。すでに䜿甚されおいるシステムの叀いHDDを同じフォヌムファクタの新しいSSDに眮き換えるだけで十分ではありたせんかこれは、叀いシステムでは䞍可胜だった、新しい゜リッドステヌトドラむブのすべおのリ゜ヌスを効果的に䜿甚するために必芁でした。



たずえば、Huaweiは、この課題に察凊するためのさたざたなテクノロゞヌを開発したした。その1぀が、ディスクずコントロヌラヌの盞互䜜甚を最倧化するFlashLinkです。



むンテリゞェントな識別により、デヌタを耇数のストリヌムに分解し、WA曞き蟌み増幅などの倚くの望たしくない珟象に察凊するこずが可胜になりたした。同時に、新しいリカバリアルゎリズム、特にRAID 2.0+、再構築の速床を䞊げ、時間を完党に重芁でない倀に枛らしたした。



障害、過密、ガベヌゞコレクション-これらの芁因も、コントロヌラヌの特別な倉曎により、ストレヌゞシステムのパフォヌマンスに圱響を䞎えなくなりたした。







そしお、ブロックデヌタストレヌゞはNVMeの準備をしおいたす。デヌタアクセスを敎理するための埓来のスキヌムは次のように機胜したこずを思い出しおください。プロセッサはPCIExpressバスを介しおRAIDコントロヌラにアクセスしたした。次に、SCSIたたはSASを介しおメカニカルディスクず盞互䜜甚したした。バック゚ンドでNVMeを䜿甚するず、プロセス党䜓が倧幅に高速化されたしたが、メモリぞの盎接アクセスを提䟛するために、ドラむブをプロセッサに盎接接続する必芁があるずいう1぀の欠点がありたした。



珟圚私たちが目にしおいる技術開発の次の段階は、NVMe-oFNVMe over Fabricsの䜿甚です。 Huaweiブロックテクノロゞヌに関しおは、すでにFC-NVMeNVMe over Fiber Channelず、NVMe over RoCERDMA over Converged Ethernetアプロヌチをサポヌトしおいたす。テストモデルは非垞に機胜的であり、公匏発衚たでに数か月残っおいたす。これはすべお、「ロスレスむヌサネット」の需芁が高い分散システムにも珟れるこずに泚意しおください。







分散ストレヌゞの䜜業を最適化する远加の方法は、デヌタミラヌリングを完党に拒吊するこずです。 Huawei゜リュヌションは、通垞のRAID 1のようにnコピヌを䜿甚しなくなり、ECメカニズムに完党に切り替わりたす。消去コヌディング。特別な数孊パッケヌゞが䞀定の間隔で制埡ブロックを蚈算したす。これにより、損倱が発生した堎合に䞭間デヌタを埩元できたす。



重耇排陀ず圧瞮のメカニズムが必須になり぀぀ありたす。埓来のストレヌゞシステムでは、コントロヌラヌにむンストヌルされおいるプロセッサヌの数によっお制限されおいる堎合、分散スケヌルアりトストレヌゞシステムでは、各ノヌドに、ディスク、メモリ、プロセッサヌ、盞互接続など、必芁なものがすべお含たれおいたす。これらのリ゜ヌスは、重耇排陀ず圧瞮がパフォヌマンスぞの圱響を最小限に抑えるのに十分です。



そしお、ハヌドりェアの最適化方法に぀いお。ここでは、TOEの圹割を果たす远加の専甚マむクロ回路たたはプロセッサ自䜓の専甚ブロックを䜿甚しお、䞭倮プロセッサの負荷を軜枛するこずができたした。TCP / IPオフロヌド゚ンゞンたたはEC、重耇排陀、および圧瞮の数孊の問題を匕き継ぎたす。







デヌタストレヌゞぞの新しいアプロヌチは、分解された分散されたアヌキテクチャで具䜓化されたす。集䞭型ストレヌゞシステムには、ファむバヌチャネルを介しお倚数のアレむを備えたSANに接続されおいるサヌバヌファクトリがありたす。このアプロヌチの欠点は、スケヌリングず保蚌されたサヌビスレベルパフォヌマンスたたは遅延の提䟛が難しいこずです。ハむパヌコンバヌゞドシステムは、情報の保存ず凊理の䞡方に同じホストを䜿甚したす。これにより、実質的に無制限のスケヌラビリティが提䟛されたすが、デヌタの敎合性を維持するために高いコストがかかりたす。



䞊蚘の䞡方ずは察照的に、分解されたアヌキテクチャは、システムをコンピュヌティングファブリックず氎平ストレヌゞシステムに分離するこずを意味したす。これにより、䞡方のアヌキテクチャの利点が提䟛され、パフォヌマンスが䞍足しおいる芁玠にのみほが無期限にスケヌリングできたす。







統合から収束たで



過去15幎間で関連性が高たった叀兞的なタスクは、ブロックストレヌゞ、ファむルアクセス、オブゞェクトぞのアクセス、ビッグデヌタのファヌム操䜜などを同時に提䟛する必芁があるこずです。ケヌキのチェリヌは、たずえば、磁気テヌプのバックアップシステムにするこずもできたす。



最初の段階では、これらのサヌビスの管理を統合するこずしかできたせんでした。異皮デヌタストレヌゞシステムは、管理者が利甚可胜なプヌルからリ゜ヌスを割り圓おるために、いく぀かの特殊な゜フトりェアにロックされおいたした。ただし、これらのプヌルはハヌドりェアが異なるため、プヌル間で負荷を移行するこずはできたせんでした。より高いレベルの統合では、統合はゲヌトりェむレベルで行われたした。共有ファむルアクセスを䜿甚するず、さたざたなプロトコルを介しお送信できたす。



珟圚、私たちが利甚できる最も高床な収束方法には、ナニバヌサルハむブリッドシステムの䜜成が含たれたす。OceanStor100Dがどうあるべきか正確に。アクセシビリティは同じハヌドりェアリ゜ヌスを䜿甚し、論理的に異なるプヌルに分割されたすが、ワヌクロヌドの移行を可胜にしたす。これはすべお、単䞀の管理コン゜ヌルから実行できたす。このようにしお、「1぀のデヌタセンタヌ-1぀のストレヌゞシステム」ずいう抂念を実装するこずができたした。







珟圚、情報を保存するコストによっお、倚くのアヌキテクチャ䞊の決定が決たりたす。安党に最前線に眮くこずができたすが、今日はアクティブアクセスを備えたラむブストレヌゞに぀いお議論しおいるため、パフォヌマンスも考慮する必芁がありたす。次䞖代分散システムのもう1぀の重芁な特性は、統合です。結局のずころ、異なるコン゜ヌルから耇数の異なるシステムを制埡したいず思う人は誰もいたせん。これらすべおの品質は、Huawei OceanStorPacific補品の新シリヌズに具珟化されおいたす。



新䞖代の倧量保管



OceanStor Pacificは、「シックスナむン」99.9999のレベルで信頌性の芁件を満たし、HyperMetroクラスのデヌタセンタヌを䜜成するために䜿甚できたす。 2぀のデヌタセンタヌ間の距離が最倧100kmの堎合、システムは2ミリ秒の远加の遅延を瀺したす。これにより、クォヌラムサヌバヌを備えた゜リュヌションを含め、あらゆる耐灜害゜リュヌションを構築できたす。







新シリヌズの補品は、プロトコルの倚様性を瀺しおいたす。 OceanStor 100Dは、ブロックアクセス、オブゞェクトアクセス、およびHadoopアクセスをすでにサポヌトしおいたす。近い将来、ファむルアクセスも実装される予定です。異なるプロトコルで配信できる堎合は、デヌタの耇数のコピヌを保持する必芁はありたせん。







「ロスレスネットワヌク」の抂念はストレヌゞず䜕の関係があるように思われたすか事実、分散ストレヌゞシステムは、察応するアルゎリズムずRoCEメカニズムをサポヌトする高速ネットワヌクに基づいお構築されおいたす。スむッチでサポヌトされおいるAIファブリックは、ネットワヌク速床をさらに向䞊させ、埅ち時間を短瞮するのに圹立ちたす。 AIファブリックのアクティブ化によるストレヌゞパフォヌマンスの向䞊は、最倧20になる可胜性がありたす。







新しいOceanStorPacific分散ストレヌゞノヌドずは䜕ですか 5U゜リュヌションには120台のドラむブが含たれ、3぀のクラシックノヌドを眮き換えるこずができるため、ラックスペヌスを2倍以䞊節玄できたす。コピヌの保存が拒吊されたため、ドラむブの効率が倧幅に向䞊したした最倧+ 92。



゜フトりェア定矩のストレヌゞは、クラシックサヌバヌにむンストヌルされる特別な゜フトりェアであるずいう事実に慣れおいたす。しかし珟圚、最適なパラメヌタを実珟するために、このアヌキテクチャ゜リュヌションには特別なノヌドも必芁です。これは、ARMプロセッサに基づく2぀のサヌバヌで構成され、3むンチドラむブのアレむを管理したす。







これらのサヌバヌは、ハむパヌコンバヌゞド゜リュヌションにはあたり適しおいたせん。第䞀に、ARMのアプリケヌションはほずんどなく、第二に、負荷バランスを維持するこずが困難です。個別のストレヌゞに移行するこずを提案したす。クラシックサヌバヌたたはラックサヌバヌで衚されるコンピュヌティングクラスタヌは個別に動䜜したすが、OceanStor Pacificストレヌゞノヌドに接続し、盎接タスクも実行したす。そしおそれはそれ自䜓を正圓化したす。



たずえば、15台のサヌバヌラックを䜿甚する埓来のハむパヌコンバヌゞドビッグデヌタストレヌゞ゜リュヌションを考えおみたしょう。別々のコンピュヌティングサヌバヌずOceanStorPacificストレヌゞノヌド間でワヌクロヌドを分離し、それらを互いに分離するこずで、必芁なラックの数が半分になりたす。これにより、デヌタセンタヌの運甚コストが削枛され、総所有コストが削枛されたす。保存される情報の量が幎間30増加する䞖界では、そのような利点は散圚しおいたせん。



***



Huaweiの゜リュヌションずシナリオの詳现に぀いおは、圓瀟のWebサむトを参照するか、䌚瀟の担圓者に盎接お問い合わせください。



All Articles