「光がありますように!」、またはパンデミックの最中にデータセンターのUPSシステムをどのように変更したか





- COVID-19 – , . , , -. 



, - . 





Delta Linxdatacenter





サンクトペテルブルクにあるデータセンターの無停電電源システム(UPS)は、もともと2Nモデルに従って設計されました。 



これは、一方のUPSに障害が発生した場合(またはメンテナンスのためにシャットダウンされた場合)、もう一方が全負荷を引き継ぐことを意味します。したがって、ペアの1つの無停電電源(UPS)の実際の使用電力は、使用可能な最大電力の50%を超えてはなりません。これにより、システムの信頼性が保証されます。 



通常の操作では、UPSは必要な100%の電力を供給し、負荷を均等に分担します。 



ただし、データセンターの負荷の増大により、最新化の必要性が生じました。容量消費のレベルが最大許容しきい値に近づいていました。 



サイトのリソースに対する需要が高いため、現時点でのデータセンター開発の課題に最適に対応し、将来的に容量を増やすことができる形式として、モジュラーUPSを採用することを決定しました。 



同時に、モノブロックソリューション上に構築されたモジュラーUPSをUPSに実装することは不可能であることが判明しました。一部の機器を切断する必要があり、クライアントのITシステムのダウンタイムにつながるため、このシナリオをすぐに破棄しました。 



根本的に新しいUPSを作成し、既存のモノブロックUPSと新しいモジュラーUPSの間で負荷を再配分する必要がありました。同時に、負荷の監視に関してUptime Instituteの要件に準拠することが重要でした(UPSユニットあたりの最大値の最大50%)。 



賛成の選択



選択はDeltaElectronicsの機器に委ねられました。必要なUPSモデルDeltaDPH 500 kVAはサンクトペテルブルクの倉庫で入手可能であり、ソリューションインテグレーター(Tempesto Group of Companies)も、ロシアのベンダーのモノブランドディストリビューターのステータスを持っていました。事業。 



UPSのモジュラー形式を使用すると、データセンターの電源に関連する多くの問題を解決できます。その主な原因は、耐障害性の向上です。 



事実、モノブロックUPSは完全に故障し、SLAフルフィルメントのチェーン全体に沿って「ドミノ効果」を引き起こします。対照的に、緊急時にモジュラーUPSがモジュラーで「飛び出し」、それぞれ50 kWを失います。これにより、UPSアーキテクチャが適切に構成されているため、このような障害の結果を感じることができず、場合によっては、このような事故の影響がゼロになる傾向があります。 



さらに、モジュラーソリューションは、「ホット」な障害のあるモジュールの交換を可能にし、コンピュータールームの変動する負荷に簡単に拡張でき、はるかにコンパクトです(モジュラーUPSは、モノブロックデバイスの2.5ラックに対して1ラックを占有します)。経済的要因も重要です。モジュラーソリューションは、市場をリードするモノブロックモデルと比較してほぼ半分の価格です。  



要するに、それはかなり簡単な選択でした。 



働くために



プロジェクトチームは15人で構成されました。チームは、10人の設置者、チーフエンジニア、およびさまざまな分野(自動化、電気など)の彼の代理人で構成されていました。 



作業は2020年4月に開始され、6月までの完了を目指しています。しかし、計画に従うのはそれほど簡単ではありませんでした。COVID-19の大流行により、作業が複雑になりました。そのため、サプライヤーの1つが、ヨーロッパからパネル機器に必要な回路ブレーカーを時間どおりに納品できませんでした。 



この時点で、すべての事前設計調査はすでに完了しており、設計文書が準備され、必要なUPSとほとんどの材料が購入されています。状況が通常に戻るのを待つことは不可能でした。更新されたサーバー容量は、データセンターの新しいクライアントとの契約の条件に基づいて、所定の時間枠で起動する必要がありました。 



そのため、計画された作業段階に合わせるために、現場での設置を進めることにしました。





LinxdatacenterデータセンターのUPSバッテリーアレイ



COVID-19を打ち負かす:柔軟性、チーム、およびGUI要素の計画



まず第一に、私たちはチームのよく調整された仕事、特に「フォアマンアセンブラー」チームに依存しました。請負業者の貢献に注目したいと思います。テンペストのスペシャリストは、困難な状況の中で私たちと、そして彼らの間で最高の柔軟性を提供することができました。



たとえば、ある電源から別の電源に電源を切り替える必要がある場合、通知にもかかわらず、顧客は常にこの手順の準備ができていませんでした。適切に準備する時間がなかったため、多くの場合、機器の電源を切ることを許可しませんでした。バックアップを作成せず、システムをバックアップサイトに転送しませんでした。 



それにもかかわらず、ダウンタイムはほぼ完全に回避されました。 「プランB」は常にそのような場合に備えており、現在のタスク内でインストーラーをビジー状態に保つためのものです。 



プロジェクトを時間通りに完了するために、週末に休憩することなく、毎日作業が行われました。従業員は、PPEを常に着用し、パンデミックのために距離を保つなど、かなり珍しい状況で作業する必要がありました。 





Linxdatacenterデータセンターの配電パネル



チームの適切な時間管理と将来のソリューションのアーキテクチャの明確な理解は、大幅な時間の損失を回避するのに役立ち、ケーブル、パネル機器、UPSの設置は時間どおりに完了しました。



ベンダーの製品の請負業者の公式ディストリビューターのステータスも役立ちました。開梱後にUPSの1つが破損していることが判明したとき、サプライヤーとの直接の接触のおかげで、交換は1週間で完了しました。機器の供給者が1人で、設置者が別の場合、この問題でのみ2〜4週間の損失が発生します。 



結果



4つの追加のDeltaDHP 500kVAシリーズUPSを含むアップグレードの結果、電力は部分的に新しい機器に再分配され、UPSユニットあたりの最大負荷は最終的に49%から43%に減少しました。



全体として、データセンターの耐障害性はすでに満足のいくものでしたが、アップグレードによって改善されました。以前は、1つのUPSの負荷が最大値の50%を超えた場合、緊急時にシャットダウンが避けられませんでした。たとえば、モノブロックUPSでコンデンサアセンブリがクラッシュすると、それに接続されているすべてのシステムが落下します。モジュラーUPSでは、1つのモジュールのみが故障し、残りの要素は引き続き機能します。 



最も重要なこと:結論



プロジェクトチームのメンバーは、予期せぬ危機に直面した複雑なタスクに対処する上で重要な経験を積んでいます。 



どのような結論に達しましたか:



  • 通常の状態でも供給の問題が発生する可能性があります。パンデミックやその他の力の威嚇の状況では、イベントの発生について最もネガティブなシナリオに備える必要があります。配信時間はより頻繁に、より長期間中断される可能性があります。
  • 作業は、リスクが事前に計算されているスケジュール計画に従って実行する必要があります。ステージが交差する節点には特別な注意を払う必要があります。
  • 納期違反の場合は、中断に関係なく実行できる作業を行う必要があります。すべてのコンポーネントが受信されるまでプロジェクトのすべての作業を中断すると、作業が遅れたり、「攻撃」に変わったりするリスクがあります。
  • – ,   . . 



All Articles