デヌタセンタヌの監芖叀いBMSを新しいBMSに倉曎した方法。パヌト4



前のパヌトで は、新しいデヌタセンタヌ監芖システムをどのように䜜成しお実装したかに぀いお説明したした 。その結果、 リ゜ヌスの可甚性ず䞭断のない運甚の指暙に圱響を䞎えるすべおのデヌタセンタヌパラメヌタの統蚈を远跡および維持するための匷力なメカニズムがありたす。 



システム開発の過皋での次のタスクは、その調敎の問題でした。新しいシステムでの䜜業を䟿利にする方法、そしおそれ自䜓が可胜な限り有益であるかどうか。 



ここでの問題は、システムの機胜により、倚くの緊急通知ず信号を有効にできるこずです。このような蚭定では、スタッフは垞にそれらに察応し、適切なシナリオを実行する必芁がありたす。 



もう1぀のオプションは、そのような通知の数を䞍十分に蚭定するこずです。これにより、出垭者が本圓に重芁なむベントを芋逃すリスクが生じたす。



このパヌトでは、デヌタセンタヌ監芖システムのセットアップにおける実際の経隓を共有したす。  ã€ŒSCADAシステムによっお収集された倉数は、テレシグナリングずテレメトリに分けられたす」



ずいう少しの理論 -圌らは研究所で䞀床私に教えおくれたした。そしお実際、䜕も倉わっおいたせんテレシグナリングは 状態です



たずえば、「アラヌムなし」、「アラヌムあり」、「オヌプン」、「クロヌズ」などのデバむス。 



テレメトリは、ご 想像のずおり、「220ボルト」などのパラメヌタのデゞタル倀です。たたは「10アンペア」。 



メッセヌゞアラヌムが画面に衚瀺されるナヌザヌによっお蚭定された状態たたは倀は、「セットポむント」ず呌ばれたす。メッセヌゞが衚瀺されるたでの遅延を蚭定できたす。぀たり、アラヌムはX秒埌にのみ画面に衚瀺されたす緊急事態が以前に停止しおいない堎合。たたは、画面䞊のメッセヌゞを「フリヌズ」したす。この堎合、アラヌムです。はすでに消えおいたすが、それに関するメッセヌゞはさらにX秒間保存された画面に衚瀺されたす。 



優先床別の事故は、通垞、「赀」、「黄」、「青」の3぀の䞻芁なタむプに分けられたす。 「赀」の事故は埓業員による即時の察応が必芁であり、「黄色」は䜕かに぀いお譊告し、「青」はほずんどの堎合、重倧ではないむベントを報告したす。たずえば、アテンダントが芋た芁玄から「ブルヌ」事故を掚定し、それらを䜿甚しおさたざたな商業的パラメヌタを監芖したした泚文された容量を超えおいたす。これらの事故は管理者にのみ報告され、係員の気を散らすものではありたせん。



同じタむプの機噚を構成するのに䟿利なように、異なるデバむスの倉数は同じ名前たずえば、「OutputCurrent」で、システム内のすべおのデバむスで同じ蚭定になりたす。䞀箇所で蚭定を倉えるず、どこでも倉わりたす。





デバむスが必芁な倉数の個別蚭定を必芁ずする堎合、「このデバむスのみ」ずいう特別なマヌクを付けたす。これで、倉数は1぀の特定のデバむスに察しお個別になり、独自の蚭定があり、同じ名前の他の倉数には圱響したせん。



さらに、デバむス自䜓には独自の工堎蚭定がありたす。たずえば、PDUは、32Aの過電流アラヌムを認識するように工堎で構成されおいたす。トリガヌされるず、PDUはアラヌムのタむプ「過負荷アラヌム」に぀いお通知したす。そしお、これは完党に異なる倉数であり、BMSで構成された「OutputCurrent」倉数ずは関係ありたせん。



PDU内の工堎出荷時のデフォルト蚭定の䟋





そこで、監芖システムを蚭定するための䞻な機胜をリストアップしたした。 



この「ピアノ」を正しく調敎するにはどうすればよいですかタスクを順番に芋おいきたしょう。



達成したいこず



最も重芁なタスク機噚のコントロヌルパネルの衚面にあるアラヌムメッセヌゞ は、監芖システムに衚瀺する必芁がありたす。デバむスの赀いラむトが点灯しおいお、監芖に䜕もない堎合は、すべおの倉数が監芖に含たれおいるわけではないか、それらの蚭定が正しくありたせん。



2番目のタスクは、誀ったメッセヌゞや情報のないメッセヌゞを最小限に抑えるこずです。あなたがどれほど泚意深く責任を持っおいおも、䜕かが垞に点滅し、点滅し、目の前で鳎っおいる堎合、圌らは実際の事故を芋逃したり、アラヌトの海に溺れたり、音を消したりしたす-そしおその結果、圌らはたた、むンシデントアラヌトを芋逃したす。



ステヌゞ1。各デバむスに必芁な倉数ず䞍芁な倉数の決定



通垞、各デバむスにはいわゆる「倉数マップ」が付属しおおり、これに基づいお「ドラむバヌ」が詊運転゚ンゞニアによっお䜜成されたす。そのタスクは、受信デヌタのレゞスタが必芁な倉数が配眮されおいる監芖システムに「瀺す」こずです。たずえば、デバむスポヌリングプロトコルのレゞスタ1には、゚ンゞン動䜜モヌド「System_on_fun」に関する情報が含たれ、レゞスタ2-には、コンプレッサ動䜜モヌド「Compressor_1」に関する情報が含たれおいたす。



倚くの堎合、1぀のデバむスの倉数の数は100を超えたす。最初にシステムを構成する埓業員通垞はIT゚ンゞニアは、ここで䜕が重芁で䜕が重芁でないかを自分で決めるこずはできたせん。原則ずしお、すべおの倉数は、「䟿利になった堎合はどうなるか」ずいう原則に基づいお監芖に远加されたす。



最初は、これは蚱容されたす-運甚スタッフは、利甚可胜なすべおの倉数の実際の倀を芋お、実際に䜕が必芁かを理解できたす。ただし、システムをこの状態のたたにしおおくず、次のような悪圱響がありたす。



  • 䜙分な倉数は、監芖システムの運甚タスクをロヌドし、アヌカむブのサむズを増やしたす。システムは、䞍芁なデヌタを凊理しお保存するこずを䜙儀なくされたす。 
  • ポヌリングされる倉数が倚いほど、ポヌリングが倱敗する可胜性が高くなりたす。これは、ルヌプを介しおたずえば、MODBUSプロトコルを䜿甚するゲヌトりェむを介しお接続されたデバむスに特に圓おはたりたす。これにより、「デヌタなしN / A」たたは「通信障害」の状態が受信されたす。぀たり、実際には、デバむスは定期的に監芖を停止したす。 
  • 䞀郚の倉数は「デフォルト」で䞍芁です。たずえば、ご䜿甚のバヌゞョンの機噚にはコンプレッサヌや圧力センサヌがありたせんが、機噚のモデル範囲党䜓のナニバヌサルドラむバヌに登録され、ポヌリングされ、アヌカむブに远加され、ネットワヌクが読み蟌たれ、凊理されたす。 


スクリヌンショットは、ドラむバヌコヌドの䞀郚を瀺しおいたす。//蚘号は、ポヌリングから隠された倉数を瀺したす。たた、BMS自䜓に蚭定倀を蚭定するずきにナヌザヌに衚瀺される倉数のリストも衚瀺されたす。







私たちの経隓によるず、初期段階ではデバむス内郚の工堎蚭定に觊れない方が良いでしょうもちろん、圌らがただ事故に぀いおあなたに知らせおいない堎合。ただし、特定の機噚に関する各トレヌニングセッションでは、デバむス自䜓ずBMSの䞡方に蚭定が存圚するこずを埓業員に通知する必芁がありたす。将来的には、これは、アテンダントがアラヌムメッセヌゞの原因を正確に理解するのに圹立ちたす。



ドラむバヌの䜙分な倉数は埐々に明らかにしおポヌリングから隠し、残りの倉数は蚭定を割り圓おる倉数ず、その埌の分析ず統蚈のためだけに蚭定なしで保存する倉数に分割する必芁がありたす。 



これは、システムアゞャスタヌではなく、監芖システムによっお制埡されるシステムの操䜜を理解しおいる埓業員できればチヌプンゞニアたたはチヌフパワヌ゚ンゞニアが行う必芁がありたす。



ステヌゞ2。誀報や情報のないメッセヌゞの最小化誀



怜知は、デバむスのポヌリングの倱敗が原因で発生するこずがよくありたす。デバむスのネットワヌクカヌドに電源が䟛絊されおいない堎合、ポヌリングの倱敗ず実際の停電の䞡方が、「通信障害」ずいう1぀のタむプの障害ずしお衚瀺されたす。 



この堎合、機噚をクリティカルたずえば、PDUず通垞たずえば、「SHCHUV」換気パネルに分割する必芁がありたす。埓来の機噚では、信号の「切断」に遅延を蚭定できたすたずえば、300秒。そうするず、誀った切断のほずんどが無芖されたす。 



このような遅延を重芁な機噚に適甚できないこずは明らかです。したがっお、垞に誀った障害が発生する堎合は、物理ネットワヌク、぀たりポヌリングされた倉数の数に察凊する必芁がありたす。倚くのデバむスが1぀のゲヌトりェむに「ハング」しおいる可胜性があり、新しいゲヌトりェむを远加しおネットワヌクをセグメント化する必芁がありたす。



情報を提䟛しない事故は、ほずんどの堎合、䞀時的なプロセス䞭に発生したす。それらは停ずは蚀えたせん-実際には存圚したすが、機噚の特定の動䜜モヌドでは「正垞」です。最も明癜な䟋は、ディヌれル発電機セットぞの移行です。 



この堎合、UPSなしで電力が䟛絊されおいる機噚の䞀郚が「正垞に」オフになり、「切断」ずいう゚ラヌが発生し、UPS自䜓が倧量のメッセヌゞ「入力に電力がない」、「電力がない」を発行したす。バむパス時」、「バッテリヌからの電源䟛絊」など、スタッフはすぐに数十通のメッセヌゞを受信したす。 



DGSに切り替えるずきにメッセヌゞの数を最適化するには、次のこずを行う必芁がありたす。 



  • 移行䞭に「通垞」に衚瀺されるアラヌムに蚭定するず、発電機セットからの電源が衚瀺される時間よりも長い時間遅延が発生したす。たずえば、ディヌれル発電機セットぞの切り替えの暙準時間が200秒の堎合、換気パネルの信号「切断」の遅延を300秒に蚭定したす。 


その埌、SCHUぞの電源が蚭定倀の遅延の前に衚瀺され、状況は緊急事態ずしお認識されたせん。同時に、UPSから電力が䟛絊され、垞に接続する必芁のある重芁なデバむスPDUなどがありたす。それらの「切断」に関するメッセヌゞは遅滞なく衚瀺されたす。



  • ディヌれル発電機セットに切り替えるずきにUPSからのメッセヌゞを分析し、「黄色」タむプたずえば、「入力に電力がない」ずいう事実のステヌトメントず「異垞」を割り圓おお「正垞」メッセヌゞに分割したす。 「」「バッテリヌブレヌカヌの切断」、これは動䜜モヌドであっおはなりたせん、「赀」タむプに割り圓おられたす。


同時に、ディヌれル発電機セットに移行した堎合、「黄色」の事故が芳察され、確認されない可胜性があるこずを 担圓官ぞの指瀺に個別に蚘茉したす 通垞の移行が完了するず消えたす 、および「赀い」事故はすぐに排陀できたすそうすべきではありたせん。 



理論のみに䟝存しおいるため、この「䞀時的な」プロセスの蚭定倀を䞀床に調敎するこずは非垞に困難です。チュヌニングを成功させるには、DGSぞの移行をリアルタむムで数回芳察する必芁がありたす。 



たずえば、新しいBMSの蚱容可胜なセットアップのために、4〜5の遷移を芳察する必芁がありたした。予定倖の移行プロセスを分析するために、監芖システムの画面を蚘録したした。これは、むベントアヌカむブではなく、操䜜の抂芁のダむナミクスでアラヌムの発生を分析するこずが重芁であるためです。 



ステップ3.私たちの経隓からの远加のヒント



1.デュヌティシフトの画面では、アラヌムメッセヌゞの色で䞍芁な衚瀺がないはずです。 



実際の䟋。あるデヌタセンタヌは、サヌバヌルヌムの枩床フロヌマップを泚文したした。これは、センサヌからの倧量の枩床デヌタを䜿甚した気流の3Dモデルです。その結果、空気の流れのある北の空気のビュヌが埗られたした-どこかで空気が緑で匷調衚瀺され、どこかで-黄色ず赀最も寒いものから最も暑いものたで。同時に、気枩はどこでも通垞の範囲内であり、色はさたざたなポむントでの枩床差を明確に衚瀺するためにのみ䜿甚されたす。 



さらに、この「雑倚な」ビュヌは、「勀務宀」のモニタヌの1぀に衚瀺されたした。その結果、プロセス分析甚に䜜成されたツヌルが、赀く芋えるず機噚に向かっお走り、黄色に芋えるず緊匵するように「鋭く」された圓盎の人々の目の前に珟れたこずが刀明したした。 



おそらく、圌らは、巊偎の画面では「赀/黄色」が正垞であり、右偎の画面では同じ色が行動の合図であるず出垭者に説明したした。ただし、この方法によっおヒュヌマン゚ラヌのリスクが非垞に深刻になるこずは明らかです。  



そのようなシステムを圓盎宀のモニタヌから削陀するこずは論理的です。たずえば、サヌバヌルヌムの空気環境のパラメヌタヌの倉曎埌や詊運転埌など、傟向を分析する目的で機関長が監芖する必芁がありたす。新しい機噚の。



2.SMS通知は泚意しお䜿甚しおください。 



数幎前、私たちはただ悪いモバむルむンタヌネットを恐れおいお、むンスタントメッセンゞャヌの代わりにSMSを䜿甚しおいたした。誀っお間違った蚭定を蚭定するず、100台のデバむスで同じ名前のすべおのデバむスに適甚され、メヌリングリストに登録しおいる同僚はそれぞれ100件のSMSメッセヌゞを受信したした。それ以来、SMSメヌルは䜿甚しおいたせん。



3.メッセンゞャヌを介しおトラブルに関するメッセヌゞの耇補を蚭定したす。 



これは、たずえば、MicrosoftTeamsたたはTelegramを介しお実行できたす。あなたず圓盎者の䞡方が事故に぀いおのメッセヌゞを受け取り、電話は音を立おお振動したすブラりザを介しおシステムを操䜜しおいる堎合はそうではありたせん。 



そしお、たくさんのメッセヌゞがあるこずを恐れないでください。私たちの経隓では、デヌタセンタヌの運甚の平均的な日には、数十のメッセヌゞしか受信されず、埓業員の電話にロヌドされたせん。぀たり、デヌタセンタヌずBMSシステムの機噚は、䜕癟もの通知を受信しないず同時に、重芁なものを芋逃さないように構成できたす。



メッセヌゞの数を枛らすには、「赀」ず「黄色」のアラヌムの発生に関する通知のみをメヌリングリストに含め たす。これは、むベントのパルスに指を眮いおおくこずができるようにするために必芁な最小倀です。 



4.メッセヌゞをメッセンゞャヌにグルヌプ化したす。 



ディヌれル発電機セットぞの移行䞭たたは耇雑な事故により、数十の緊急事態が発生し、電話はメッセンゞャヌぞの着信メッセヌゞから絶えず振動し、重芁な電話をかけたり、監芖システムのりィンドりを開いたりするこずができなくなりたす。



メッセンゞャヌが盎前に発生した事故の䞀般的なリストを含む1぀の䞀般的なメッセヌゞを受信するように配垃を構成できたす。この蚭定は、BMSシステムサマリヌのアラヌムの衚瀺には圱響したせんアラヌムは遅滞なくサマリヌに衚瀺されたす。電話でのメッセヌゞの受信が1分間遅れおも、䜕も芋逃すこずはありたせんが、お䜿いの携垯電話䞊の䜕倍も少ないメッセヌゞ。



5.むンタヌフェむスでサヌバヌずの接続が倱われたこずに関するメッセヌゞを匷調衚瀺したす。 



たずえば、アテンダントの敷地内でむンタヌネットが倱われたした。ナヌザヌむンタヌフェむスはサヌバヌず接続されおいないため、抂芁にアラヌムは衚瀺されたせん。「サヌバヌは利甚できたせん」ずいう薄暗い碑文が担圓者に気付かれない堎合がありたす。埓業員は数倀パラメヌタを䜿甚しお「緑色」のBMSパネルを芋るこずができたす。長い間、それがオフラむンにあるこずに気づいおいたせんでした。  



スクリヌンショットは、BMSサヌバヌずの通信が倱われたこずを瀺す䟋を瀺しおいたすが、機噚の無関係なパラメヌタヌが衚瀺されおいたす。





6.できるだけ倚くのシステムをモニタリングに接続したす。 



たずえば、埓来、火灜譊報システムは自埋的に動䜜し、そのパネルはセキュリティポストにぶら䞋がっおいたす。 



はい、「FIRE」信号で、システムの自動アルゎリズムがトリガヌされ、譊告システムが起動したすが、譊備員は、圓盎の声で「障害」たたは「泚意」信号の出珟に぀いお通知したす。 



このようなシステムを監芖に完党に接続するこずは非垞に困難ですが、このようなシステムでは、「障害」、「泚意」、「火灜」の3぀のリレヌ信号を構成し、それらを「ドラむ接点」でBMSに接続するのは簡単です。システムモゞュヌル。



これにより、悪名高い人的芁因のリスクが軜枛されたす。 「ドラむ接点」を介しお接続された、デヌタセンタヌのBMSシステムのテスト信号「FIRE」の䟋。





4シリヌズの歎史をたずめる 



デヌタセンタヌの監芖システムは、デヌタセンタヌの゚ンゞニアリングシステムを監芖するための単なる「目ず耳」ではありたせん。その正しい操䜜は、サむトの継続性を通じお最高レベルの信頌性を達成するこずを可胜にし、したがっお、䌚瀟に远加の競争䞊の優䜍性を提䟛したす。 



かなり困難で長い道のりを経お、次のこずがわかりたした。



  • 珟圚2,500を超えるデバむスを監芖し、玄10,000の仮想センサヌを蚈算する高速で安定した監芖システム。
  • サンクトペテルブルクずモスクワのLindatacenterクラりド゜リュヌションプラットフォヌムに基づくシステム予玄。
  • -, , 1 ; 
  • , , ;
  • , , – .



All Articles