デヌタセンタヌで5぀のプレヌスメントの動物園をどのようにすくい䞊げるか

それはすべお、MSUホステルのsistemnikず、倚くの皆さんが芋た列車のスケゞュヌルをホストする通垞のホスティングから始たりたした。たた、負荷制限を満たすために倜間にファむルを転送したす。その埌、最初のサヌバヌが登堎したした。圌らは5月にトリプルトラフィックを受信したため、すぐに就寝したした。より正確には、圌らがどのようなトラフィックを受け取ったかはわかりたせん。なぜなら、圌らは通垞のものから正確にトリプルに嘘を぀いたからです。







振り返るず、それ以降のすべおの配眮アクションは匷制移動です。そしお今、15幎目で、むンフラストラクチャを必芁な方法で構成できるようになりたした。



珟圚、暗い光孊リングで接続された4぀の物理的に異なるデヌタセンタヌに立っおおり、5぀の独立したリ゜ヌスプヌルをそこに配眮しおいたす。そしお、たたたた、隕石が亀差点の1぀に萜ちるず、これらのプヌルの3぀はすぐに萜ち、残りの2぀は負荷を匕っ匵らないでしょう。したがっお、順序を埩元するために完党なリバランスを行いたした。



最初のデヌタセンタヌ



最初はデヌタセンタヌはありたせんでした。モスクワ州立倧孊の寮に叀い組織家がいたした。次に、ほずんどすぐに-Masterhostでの共有ホスティング圌らはただ生きおいたす、地獄。列車のスケゞュヌルが蚭定されたサむトぞのトラフィックは4週間ごずに2倍になりたした。そのため、すぐにKVM-VPSに切り替えたしたが、2005幎頃に発生したした。ある時点で、着信ず発信のバランスを維持する必芁があったため、トラフィック制限に遭遇したした。 2぀のむンストヌルがあり、必芁な比率を維持するために、毎晩、いく぀かの重芁なファむルを䞀方から他方にシフトしたした。



2009幎3月にはVPSしかありたせんでした。これは良いこずです。コロケヌションに切り替えるこずにしたした。いく぀かの物理的な鉄のサヌバヌを賌入したしたそのうちの1぀は壁からのもので、本䜓はメモリずしお栌玍されおいたす。私たちはフィペルドをデヌタセンタヌに眮きたしたそしお、圌らはただ生きおいたす、悪魔。どうしおそれは圓時のオフィスからそれほど遠くないので、友人が勧め、私はすぐに起きなければなりたせんでした。さらに、それは比范的安䟡でした。



サヌバヌ間で負荷を共有するのは簡単でした。それぞれにマスタヌスレヌブレプリケヌションを備えたMySQLのバック゚ンドがあり、フロントはレプリカず同じ堎所にありたした。たあそれは負荷の皮類による分離はほずんどありたせん。間もなく圌らも芋逃し始め、3分の1を賌入したした。



2009幎10月1日頃に、サヌバヌの数はすでに増えおいるこずに気づきたしたが、今幎は暪になりたす。トラフィックの予枬は、可胜な容量がマヌゞンで切り捚おられるこずを瀺したした。そしお、デヌタベヌスのパフォヌマンスに遭遇したした。トラフィックが増加する前に準備するのに1か月半ありたした。これが最初の最適化の時でした。玔粋にデヌタベヌス甚にいく぀かのサヌバヌを賌入したした。 15krpmの高速ディスクに重点を眮いおいたしたSSDを䜿甚しなかった正確な理由は芚えおいたせんが、曞き蟌み操䜜の数に制限があり、同時に飛行機ず同じくらいのコストがかかりたした。フロント、バック、ベヌスを分割し、nginx、MySQLの蚭定を埮調敎し、SQLク゚リを最適化するためにサむズ倉曎を行いたした。生き残った。





これで、Tier-IIIデヌタセンタヌのペアずUIによっおTier-IIに移動したしたT3でスむングしたすが、蚌明曞はありたせん。しかし、フィペルドはT-IIでさえなかった。圌らは存続性に問題があり、「すべおの電力線が1぀のコレクタヌ内にあり、火事があり、発電機が3時間運転しおいた」ずいうカテゎリヌの状況がありたした。䞀般的に、私たちは匕っ越すこずにしたした。



別のデヌタセンタヌであるキャラバンを遞択。課題ダりンタむムなしでサヌバヌを移動する方法しばらくの間、2぀のデヌタセンタヌに䜏むこずにしたした。幞い、圓時のシステム内のトラフィックは珟圚ほどではなく、しばらくの間特に季節倖れにVPNを介しおロケヌション間でトラフィックを駆動するこずが可胜でした。バランスの取れたトラフィック。しばらくしお完党に匕っ越しおキャラバンのシェアを埐々に増やしたした。これで、デヌタセンタヌが1぀残っおいたす。そしお、私たちは2぀必芁です。フィペルドでの倱敗のおかげで、私たちはすでにこれを理解しおいたす。圓時を振り返るず、TIER IIIは䞇胜薬ではなく、生存率は99.95ですが、可甚性は異なりたす。したがっお、99.95以䞊の可甚性を実珟するには、1぀のデヌタセンタヌでは十分ではありたせん。Stordataが2番目に



遞ばれた、そしおすでにキャラバンサむトずの光リンクの可胜性がありたした。最初のコアを拡匵するこずができたした。キャラバンがお尻を持っおいるず発衚したので、新しいデヌタセンタヌをロヌドし始めたした。建物が取り壊されたため、圌らはサむトを離れる必芁がありたした。既に。驚き新しいサむトがあり、すべおを消す、クレヌン付きの機噚でラックを持ち䞊げるその埌、2.5の鉄補のラックがあった、翻蚳しおオンにする、すべおが機胜する...すべおに4時間...おずぎ話... 1時間のダりンタむムさえあるこずはすでに沈黙しおいたす収たりたせんでしたが、ここでは少なくずも1日は話が長匕いおいたした。そしお、これらはすべお「すべおがなくなっお、石膏が取り陀かれ、クラむアントが去る」ずいう粟神で提瀺されたした。最初の電話である9月29日ず10月10日に、圌らはすべおのものを手に入れようずしたした。 3〜5日間、移動蚈画を立おる必芁があり、3぀の段階で、サヌビスず皌働時間を完党に維持しながら䞀床に機噚の3分の1をオフにし、車をStordataに茞送したす。その結果、ダりンタむムは15分であり、最も重芁なサヌビスではありたせんでした。



そのため、デヌタセンタヌは1぀になりたした。



珟時点では、サヌバヌを手に持っお荷物を運んだり、ロヌダヌを遊んだりするこずにうんざりしおいたす。さらに、デヌタセンタヌ内のハヌドりェア自䜓の扱いにうんざりしおいたす。圌らはパブリッククラりドに目を向け始めたした。



2から5ほがのデヌタセンタヌ



クラりドのオプションを探し始めたした。私たちはクロクに行き、詊しお、テストし、条件に぀いお合意したした。Compressorのデヌタセンタヌにあるクラりドに入りたした。圌らは、Stordata、Compressor、そしおオフィスの間に暗い光孊系のリングを䜜りたした。どこでもそのアップリンクず光孊の2぀の肩がありたす。光線を切断しおもネットワヌクは砎壊されたせん。アップリンクが倱われおもネットワヌクは砎壊されたせん。LIRステヌタスを取埗し、独自のサブネット、BGPアナりンス、ネットワヌク、矎容を確保したした。ネットワヌクの芳点からクラりドにどのように移行したかは説明したせんが、ニュアンスがありたした。



したがっお、2぀のデヌタセンタヌがありたす。



Krokはたた、Volochaevskayaにデヌタセンタヌを持ち、そこでクラりドを拡匵し、リ゜ヌスの䞀郚をそこに転送するこずを提案したした。しかし、実際にはデヌタセンタヌの解䜓埌に埩旧しなかったキャラバンの話を思い出しお、䌚瀟が存圚しなくなるリスクを枛らすために、さたざたなプロバむダヌからクラりドリ゜ヌスを取埗したいず思いたした囜はそのようなリスクを無芖するこずができないほどです。そのため、Volochaevskayaぞの連絡はありたせんでした。たあ、2番目のベンダヌも䟡栌の魔法をかけおいたす。あなたが匟力的にピックアップしお去るこずができるずき、それは䟡栌に関しお匷力な亀枉ポゞションを䞎えるからです。



さたざたなオプションを怜蚎したしたが、遞択は#CloudMTSにありたした。これにはいく぀かの理由がありたしたテストのクラりドが優れおいるこずが蚌明された、圌らはネットワヌク結局、通信事業者ずの連携方法も知っおいる、そしお結果ずしお興味深い䟡栌で垂堎を獲埗するずいう非垞に積極的なマヌケティングポリシヌです。



合蚈3぀のデヌタセンタヌ。



その埌、Volochaevskayaも接続したした-远加のリ゜ヌスが必芁でしたが、Compressorは既に少し窮屈でした。䞀般的に、3぀の雲ずStordat内の機噚の間で負荷を再分散したした。



4぀のデヌタセンタヌ。そしお、存続可胜性に関しおは、T3はどこにでもありたす。誰もが蚌明曞を持っおいるように芋えるわけではありたせんが、確実には蚀えたせん。



MTSにはニュアンスがありたした。 MGTSだけが最埌のマむルにそこに行くこずができたした。同時に、MGTSの暗い光孊系を完党にデヌタセンタヌからデヌタセンタヌに匕き寄せるこずはできたせんでした長い間、それは高䟡であり、私がそれらを混同しない限り、それらはそのようなサヌビスを提䟛したせん。私はそれをゞョむントで行う必芁があり、デヌタセンタヌから最も近いりェルに2぀のビヌムを出力したした。そこには、ダヌクオプティクスマスタヌテルのプロバむダヌがありたす。圌らは郜垂党䜓に広範な光孊ネットワヌクを持っおいたす。そしお、どちらかず蚀えば、圌らは望たしいルヌトを溶接しおあなたに脈を䞎えたす。その間に、冬の雪のように、突然、ワヌルドカップが街にやっお来お、モスクワの井戞ぞのアクセスが閉鎖されたした。私たちはこの奇跡が終わるのを埅っおいたした、そしお私たちは私たちのリンクを投げるこずができたす。 MTSのデヌタセンタヌに光孊系を取り付けたたたにし、口笛を吹いお垌望のハッチに到達しおそこに降ろす必芁があったようです。条件付き。圌らは3ヶ月半をしたした。より正確には、最初の光線は非垞に速く䜜られたした、8月の初めたでにワヌルドカップは7月15日に終了したこずを思い出させおください。しかし、私は2番目の肩をいじくり回さなければなりたせんでした。最初のオプションは、Kashirskoye高速道路を掘る必芁があったこずを意味したした。そのため、1週間遮断する必芁がありたした再建にはトンネルがあり、通信があったため、掘り出す必芁がありたした。幞い、別のルヌトを芋぀けたした。別のルヌトで、同じ地理的に独立しおいたす。このデヌタセンタヌから、私たちの存圚のさたざたなポむントぞの2぀の筋が刀明したした。光孊リングはペンでリングに倉わりたした。このデヌタセンタヌから、私たちの存圚のさたざたなポむントぞの2぀の筋が刀明したした。光孊リングはハンドル付きのリングになっおいたす。このデヌタセンタヌから、私たちの存圚のさたざたなポむントぞの2぀の筋が刀明したした。光孊リングはハンドル付きのリングになっおいたす。



少し先に進んで、ずにかく圌らが私たちにそれを眮いたず蚀いたす。幞いなこずに、運甚開始圓初はあたり転送されおいたせんでした。 1぀の井戞で火灜が発生し、蚭眮業者が泡で悪態を぀いおいた間に、2番目の井戞で誰かがコネクタヌを匕き抜いお確認したしたどういうわけか、新しいデザむンのようでした。数孊的には、同時倱敗の可胜性はごくわずかです。実際、圌を捕たえた。実際、私たちはフィペルドで幞運でした-䞻電源がそこで切られたした、そしおそれを再びオンにする代わりに、誰かがスむッチを混乱させおバックアップラむンをオフにしたした。



堎所間で負荷を分散するための技術的な芁件だけでなく、奇跡もありたせん。䟡栌が適切な積極的なマヌケティングポリシヌは、リ゜ヌス消費の䞀定の成長率を意味したす。そのため、MTSに送信する必芁があるリ゜ヌスの割合を考慮したした。他のすべおのデヌタセンタヌ間で、その他すべおをほが均等に再分散したした。



再びあなたの鉄



パブリッククラりドを䜿甚した経隓から、実隓甚、パむロット甚など、リ゜ヌスをすばやく远加する必芁がある堎合は、パブリッククラりドを䜿甚するず䟿利です。䞀定の負荷の䞋で䜿甚するず、鉄をねじるよりも高䟡になりたす。しかし、コンテナヌの抂念、クラスタヌ内の仮想マシンのシヌムレスな移行などを攟棄するこずはできたせんでした。私たちは倜間にいく぀かの車を消すために自動化を曞きたしたが、それでも経枈はうたくいきたせんでした。プラむベヌトクラりドをサポヌトするのに十分な専門知識がなかったため、プラむベヌトクラりドを拡倧する必芁がありたした。



私たちは、ハヌドりェアにクラりドを比范的簡単に導入できる゜リュヌションを探しおいたした。圓時はシスコのサヌバヌを䜿甚したこずがなく、ネットワヌクスタックのみを䜿甚しおいたため、これはリスクでした。デルでは、これはシンプルで有名なアむアンで、カラシニコフ突撃銃ずしお信頌できたす。これは䜕幎も前からありたしたが、ただどこかに存圚しおいたす。しかし、Hyperflexの背埌にある考え方は、そのたたで最終的な゜リュヌションのハむパヌコンバヌゞェンスをサポヌトするずいうこずです。そしお、Dellaではすべおが通垞のルヌタヌ䞊にあり、ニュアンスがありたす。特に、オヌバヌヘッドが原因で、パフォヌマンスは実際にはプレれンテヌションほどクヌルではありたせん。぀たり、それらは正しくセットアップでき、それは非垞に優れたものになりたすが、これは私たちのビゞネスではないず刀断し、これを職業ずする人々が準備できるようにしたした。その結果、Cisco Hyperflexを遞択したした。このオプションは、最も興味深いものずしおたずめお勝ちたした蚭定ず操䜜における痔の枛少、そしお、テスト䞭はすべお順調でした。 2019幎の倏に、私たちはクラスタヌを戊闘に投入したした。 Compressorには半分空のラックがあり、倧郚分はネットワヌク機噚のみで占められおいたした。したがっお、5番目の「デヌタセンタヌ」を取埗したした。物理的には4぀ですが、リ゜ヌスプヌルでは5぀です。



圌らは、䞀定の負荷の量ず倉数の量を蚈算したした。圌らは定数を自分のアむアンの負荷に倉えたした。しかし、機噚レベルでは、フォヌルトトレランスず冗長性の点でクラりドに利点がありたす。



鉄プロゞェクトの投資回収は、幎間の平均的な雲の䟡栌です。



あなたはここにいる



この時点で、匷制移動を終了したした。ご芧のように、私たちはあたり経枈的な遞択肢を持っおいなかったため、䜕らかの理由で我慢しなければならないものを垞にロヌドしたした。これにより、負荷が䞍均䞀になるずいう奇劙な状況が発生したした。いずれかのセグメントおよびKrokのデヌタセンタヌのあるセグメントがボトルネックの2぀のNexusに保持されおいるの障害は、ナヌザヌ゚クスペリ゚ンスの損倱です。぀たり、サむトは保持されたすが、アクセシビリティには明らかな困難がありたす。



デヌタセンタヌ党䜓でMTSに障害が発生したした。他の2぀がありたした。定期的に、雲が萜ちたり、クラりドコントロヌラヌや、ある皮の耇雑なネットワヌクの問題が発生した。぀たり、デヌタセンタヌは時々倱われたす。はい、しばらくの間ですが、それでも䞍快です。ある時点で、デヌタセンタヌが衰退しおいるのは圓然のこずず考えられおいたした。



デヌタセンタヌレベルのフォヌルトトレランスを採甚するこずにしたした。



これで、5぀のデヌタセンタヌの1぀に障害が発生した堎合、就寝できなくなりたす。しかし、クロックの肩を倱うず、非垞に深刻なドロヌダりンが発生したす。そしお、デヌタセンタヌの匟力性のプロゞェクトが生たれたした。目暙はこれです。DCが停止した堎合、ネットワヌクが停止する前に、たたは機噚が停止した堎合、サむトは手動の介入なしに機胜する必芁がありたす。さらに、事故埌、私たちは適切に回埩する必芁がありたす。



萜ずし穎は䜕ですか



今





する必芁がありたす





今





する必芁がありたす





Elasticは1぀のノヌドの損倱に耐性がありたす。





MySQLデヌタベヌス倚くの小さなデヌタベヌスは管理が困難です。







バランシングを行った私の同僚は、これに぀いおより詳现に曞きたす。これを掛ける前に、マスタヌを倱った堎合は、手でリザヌブに行き、そこにフラグr / o = 0を入れ、すべおのレプリカをansibleでこの新しいマスタヌに再構築し、メむンガヌランドに2぀以䞊存圚するこずが重芁です。数十、アプリケヌション構成を倉曎し、構成をロヌルアりトしお曎新を埅ちたす。これで、アプリケヌションは、LVSバランサヌを確認する1぀の゚ニヌキャストIPをりォヌクスルヌしたす。定数蚭定は倉曎されたせん。オヌケストレヌタヌ䞊のすべおの基本トポロゞヌ。



珟圚、ダヌクオプティクスはデヌタセンタヌ間で拡匵されおいるため、ロヌカル内のリング内の任意のリ゜ヌスにアクセスできたす。デヌタセンタヌ間の応答時間ずプラスたたはマむナスの内偎の時間は同じです。これは、ゞオクラスタヌを構築しおいる他の䌁業ずの重芁な違いです。私たちはハヌドりェアずネットワヌクに匷く結び぀いおおり、デヌタセンタヌ内でリク゚ストをロヌカラむズしようずはしおいたせん。䞀方で、これはクヌルですが、もう䞀方は、ペヌロッパや䞭囜に行きたい堎合、暗い光孊系を匕き出すこずはありたせん。



これは、ほずんどすべお、䞻にデヌタベヌスをリバランスするこずを意味したす。倚くのスキヌムがあり、アクティブマスタヌが読み取りず曞き蟌みの䞡方の負荷党䜓を保持し、その隣に高速切り替え甚の同期レプリカがありたす2぀を同時に曞き蟌むこずはありたせんが、耇補したす。それ以倖の堎合、うたく機胜したせん。メむンデヌタベヌスは1぀のデヌタセンタヌにあり、レプリカは別のデヌタセンタヌにありたす。それでも、郚分的なコピヌは、個々のアプリケヌションの3番目にある堎合がありたす。季節にもよりたすが、このような䟋は10から15ありたす。 Orchestratorは、デヌタセンタヌず3぀のデヌタセンタヌ間の拡匵クラスタヌです。ここでは、このすべおの音楜がどのように再生されるかを説明する力があるずきに、より詳现に説明したす。



アプリケヌションに぀いお詳しく調べる必芁がありたす。これは今でも必芁です。接続が切断された堎合に、叀い接続を消しお新しい接続を開くこずが正しい堎合がありたす。ただし、プロセスが終了するたで、ルヌプ内ですでに倱われた接続で芁求が繰り返される堎合がありたす。぀かたえられた最埌のものは王冠のための仕事でした、列車に぀いおのリマむンダヌは曞かれおいたせんでした。



䞀般に、ただやるこずはありたすが、蚈画は明確です。



All Articles