「ドミノ効果」、またはデータセンターのクラウドソフトウェアを更新する方法





Linxdatacenterデータセンターでクラウドをサポートおよび開発する実践は、興味深い事例を示しました。クラウドプラットフォームの1つの要素だけを更新するというかなり日常的な操作により、大規模なディープアップグレードが行われました。 



すべてがどのように始まったのか、そしてクラウドの「デジタルツイン」がどのように役立つのかを説明します。 




vCloudDirectorを取得して更新することはできません



Linxdatacenterクラウドの主なコンポーネントは、vCloudDirector仮想インフラストラクチャコントロールパネルを実装するVMwareテクノロジースタックです。これは、シスコのコンポーネントとWindows ActiveDirectoryなどのサービスインフラストラクチャに基づいて展開されます。



2020年の終わりのある時点で、問題が発生しました。vCloudDirector9.5は現在のタスクの詳細に遅れを取り始め、バージョン10.1または10.2へのアップグレードを手に入れることができませんでした。 



これにはひどいことは何もありませんでしたが、2021年の初めに、ブラウザでのFlashのサポートが停止しました。



正直なところ、Flashやブラウザメーカーがこのような残酷さを行うとは思っていませんでした。つまり、誰もが長い間サポートの終了を聞いていましたが、1月12日からオペレーティングシステムから物理的に削除され、ブラウザで完全にブロックされるというニュースは非常に不快な驚きになりました。



事実、vCloudDirectorは2つのポータルを介してアクセスできます。最初のものはFlashにあり、それはメインのものであり、たとえば、非常に幅広い機能と多くの可能性を備えたオリジナルのものでした。 



HTMLポータルの開発はバージョン8.20から始まり、Flashを廃止するという観点から、徐々に新しい機能が追加されていきました。現在3つのサイトで公開されているvCloudDirector 9.5のバージョンは、機能の面で顧客の要求の大部分を満たしていますが、管理の観点からは、かなり重大な問題が発生し始めました。



中間的な解決策として、Flashアクセスがまだ残っているブラウザー構成を見つけることができました。そして、経営の観点から、私たちは状況を管理し続けており、問題はありません。 



ただし、ユーザーにとって、バージョン9.5の機能は理想的ではありません。ユーザーはすでにFlashでの作業に慣れており、Flashがないと不便になります。「しかし、この前に そうだったけど、どうすれば今できるの ?」10バージョンでは、機能が著しく向上し、Flashに可能な限り近いものになっています。したがって、vCloud Directorの更新がタスク#1であることが決定されました。



重い遺産



サンクトペテルブルクのデータセンターとワルシャワのパートナーサイトのクラウドプラットフォームは、2013年に導入したシステムインテグレーターの「レガシー」であるため、状況は複雑になりました。 2017年までは、同じ会社が完全にメンテナンスとアップグレードを実行し、その後、完全に自分たちの手で制御できるように、十分な量の独自の専門知識を増やしました。 



すでに状況の予備分析では、バージョン9.5から10.2にアップグレードするだけでは不十分であることが示されています。互換性マトリックスを使用して、さまざまなクラウド要素のすべてのソフトウェアバージョンの段階的な更新計画を作成するには、アーキテクトが2週間以上タスクを担当しました。 



これは、ソフトウェアバージョンの依存関係の複雑な構造によるものであり、そのロジックでは、クラウド全体の円滑な運用を維持するために、新しいバージョンへの段階的かつ厳密な順次移行が必要です。  



無実の、一見、vCloud Directorのアップグレードの必要性により、Active Directoryを備えたWindowsサーバーから始まり、すべての追加コンポーネントで終わる、完全なプラットフォームアップグレードを開始する必要がありました。 vCloud Directorでターゲットバージョンへの計画されたアップグレードを完了するには、システム全体を4回アップグレードする必要があります。クラウドプラットフォームのアップグレードは、3回の完全なラウンドまたはキューで実行されます。 



ワルシャワの独自のクラウドから始め、サンクトペテルブルクとモスクワのサイトが続きます。これらの工事の完成予定日は2021年5月です。 



しかし、最初に、クラウドの「デジタルツイン」で練習しましょう。 



クラウド向けデジタルツイン



3人の専門家からなるプロジェクトチームのリソースを考慮すると、1つのサイトのみの作業計画は単純に巨大です。 



この制限、タイミング、中間ステップの数、インフラストラクチャの複雑さにより、仮想モックアップ(仮想ラボのクラウドのデジタルツイン)でプロジェクトの実際の実装を徹底的にテストする必要がありました。 



クラウドデジタルツインは、トリガーされるシステム変更の品質と期待される結果の達成に自信を与えてくれます。さらに、このようなツインでプラットフォームを操作するためのさまざまなシナリオを作成するのは非常に便利であり、エラーや障害が発生した場合は、仮想マシンのスナップショットにロールバックして修正する機会が常にあります。エラー。これにより、更新プロセスが高速化され、システム全体の品質を損なうことなく実行できるようになります。



すべての更新はデジタルツインで事前に実行され、プラットフォームのすべての要素の新しいバージョンへの段階的な移行のプロセスが成功した場合、実際のターゲットインフラストラクチャの詳細な作業計画が調整されます。 



デジタルツインは、プラットフォームインフラストラクチャをすべてのシステムの最新コンポーネントまで完全に複製します。実際のインフラストラクチャへのすべての変更(設定、構成、ソフトウェアの更新)は、最初にそのインフラストラクチャで処理されます。 



すべての要素がどのように1つの図にまとめられるかを確認し、リスクを判断し、更新のこの段階またはその段階にかかる時間を計算します。これに基づいて、詳細な作業計画が作成されます。 



ツインは、ネストされた仮想化のテクノロジーであるネストされた仮想化を使用して作成されます。 VMwareでは、ハイパーバイザーを内部で作成できます。また、これらのハイパーバイザーで仮想マシンを実行することもできます。 



ワルシャワクラウドのフレームワーク内で、リソースは「ツイン」の作成に割り当てられ、ハイパーバイザー、仮想マシン、およびネットワークがそれらにデプロイされました。すべてのOSバージョン、パッケージに準拠して、クラウドを最初から「再構築」しました。それらを単一のソリューションに接続するソフトウェアとアーキテクチャ。



これは「Ctrl + C / Ctrl + V」ではありません。つまり、既存のシステムをコピーしただけではありません。システムの主要コンポーネントとそれらの相互作用のロジックのみが、通信チャネルの帯域幅NGINXまで再現されました。リバースプロキシおよびトラフィック登録の「設定」として。



ツインは、月額650ドルでサイトのリソースを「食い尽くします」。たとえば、「ダブル」が消費するRAMのサービスプロバイダーとしてVMwareに支払い、20台以上の仮想マシンが展開されています。 。



これらはかなりのコストですが、一方で、アップグレードスクリプトを段階的に安全に実行することで、実際のインフラストラクチャでアップグレードする際の障害や予期しない瞬間に対する100%の保護が保証されます。システムの誤動作によって発生する可能性のある損失は、「ツイン」を維持するためのコストよりも桁違いに高くなります。 



私たちの期待



予備計算によると、更新後のシステムリソースは、少なくとも2021年の終わりまで、グローバルな再構築は言うまでもなく、プラットフォームが変更を必要とせずに適切なレベルで機能するのに十分です。 



主要システムのほとんどの主要なソフトウェアバージョンの更新に関する現在の準備の一環として、サポート終了インジケータは2023年の終わりにさかのぼります。また、かなりの数のシステムで、ソフトウェアバージョンのサポートが終了するタイミングは今のところ宣言されていません。 



つまり、全体的な安全マージンは1〜2年間で十分であり、現在と同等のグローバルな更新について話している場合、今日はさらに長い期間の基盤を築いています。 



クラウドプラットフォームのライフサイクルは、主要なシステム要素の最新のソフトウェアバージョンを常に持つ必要があることを意味します。 



作業のこの領域について一般的に言えば、そのような再構築の全体的な複雑さと苦痛は、バージョンの互換性の追跡をやめただけでなく、それを起動するのがどれほど難しいかに常に依存することに注意することができますクラウドが構築されているさまざまな要素、テクノロジー、プロトコル、およびソフトウェアの「動物園」がどれほど多様であるか。



ここで何を目指すべきでしょうか?統合に向けて:リリースされたグローバルアップデートは、最終的に私たちの生活を大幅に簡素化し、クラウド全体の信頼性を向上させます。 



このすべてのインフラストラクチャを展開したインテグレータの遺産から完全に脱却することができます。クラウドバリューチェーンには、可用性、設定の柔軟性、信頼性、およびSLAに影響を与えるその他のパラメーターという形で、盲点や潜在的な弱点はありません。 



すべてのクラウドコンポーネントがすべてのサイトで同じソフトウェアバージョンで動作するとすぐに、その後のアップグレード、拡張、統合は、グローバルな管理および技術プロジェクトではなく、技術コンポーネント、ルーチンの適切な管理の問題になります。 



将来的にはクラウドのデジタルツインを利用する予定です。これは、インフラストラクチャのアップグレードプロセスをより安全かつ迅速にするのに役立つ便利なツールです。



All Articles