GoogleはKubernetesの耇雑さを認識したため、「自動操瞊」モヌドを開発したした

新しいGKEモヌドは、より高䟡で柔軟性が䜎くなりたすが、よりシンプルで安党です





GKEAutopilotがポッドを管理する



Kubernetesクラスタヌに぀いおよく知られおいるこずが2぀ありたす。 1぀目は、コンテナオヌケストレヌションのミッションクリティカルなタスクに最適なツヌルであるずいうこずです。そしお第二に、その耇雑さは実装の障壁であり、゚ラヌの䞀般的な原因です。 Kubernetesの発明者でありメむンプロモヌタヌであるGoogleでさえ、これを認めおいたす。



クラスタヌの展開ず管理を簡玠化するために、同瀟はすべおのGKEの顧客に、Googleが独自のBorgクラスタヌで長い間䜿甚しお きたオヌトパむロットサヌビスぞのアクセスを提䟛しおいたす 。機械孊習に基づく自動リ゜ヌス構成です。



「6幎の進歩にもかかわらず、Kubernetesは䟝然ずしお非垞に耇雑です 」ずGoogle Kubernetes EngineGKEの補品責任者であるDrewBradstockはTheRegisterに語りたした。 「近幎、倚くの䌁業がKubernetesを採甚しおいたすが、その埌困難に盎面しおいたす。」



GKEは、䞻にGoogle Cloud PlatformGCPで実行されるKubernetesプラットフォヌムです。他のクラりドでも、Anthosの䞀郚ずしおロヌカルでも利甚できたす 。



オヌトパむロット- 新しい動䜜モヌドGKEは、クラスタヌ管理の運甚コストを削枛し、本番環境ず高可甚性のためにクラスタヌを最適化するために、より自動化および事前構成されおいたす。 ゜ヌスKubernetesは





、Google独自のむンフラストラクチャでオヌトパむロットを䜿甚し



お、クラスタヌ物理サヌバヌたたは仮想サヌバヌのコレクション、ノヌド個々のサヌバヌ、ポッドノヌド䞊の1぀以䞊のコンテナヌを衚す制埡ブロック、およびコンテナヌ自䜓の抂念を持っおいたす。GKEは、クラスタヌレベルで完党に管理されたす。オヌトパむロットはこれをノヌドずポッドに拡匵したす。



オヌトパむロットの機胜ず制限を理解する最も簡単な方法は、システムの説明から です。..。倉曎できない「事前蚭定枈み」パラメヌタに泚意しおください。



オヌトパむロットモヌドず暙準モヌドの比范


基本的に、これはGKEリ゜ヌスを予玄および管理する別の方法であり、利䟿性のために柔軟性を犠牲にしたす。Googleはほずんどの構成を管理しおいるため、耇数のゟヌンを持぀自動操瞊ポッドで99.9の高い皌働時間を保蚌したすSLAを参照 。



Googleクラりドでは、リヌゞョンは3぀以䞊のゟヌンで構成されおいたす。すべおのリ゜ヌスを1぀のゟヌンに配眮するこずは、耇数のゟヌンよりも信頌性が䜎く、耇数の領域に拡匵するず、最倧のフォヌルトトレランスが埗られたす。オヌトパむロットのクラスタヌは、ゟヌンではなく、垞にリヌゞョンごずに分散されたす。信頌性は高くなりたすが、コストが高くなりたす。



Autopilotのもう1぀の制限は、「コンテナヌ甚に最適化された」ContainerdがプリむンストヌルされたLinuxオペレヌティングシステムです。LinuxをDockerたたはWindowsServerで䜿甚する方法はありたせん。ノヌドあたりのポッドの最倧数は32であり、暙準のGKEのように110ではありたせん。



ノヌドぞのSSHアクセスはなく、自動操瞊ノヌドはブロックされたす。GPUおよびTPUTensor Processing Unitのサポヌトは、将来的に蚈画されおいたすが、利甚できたせん。「SSHを廃止するこずは難しい決断でした」ずBradstockは蚀いたす。もちろん、これは制埡オプションを制限したす。しかし、ブラッドストック氏によるず、この決定は、クラスタヌ構成で重倧な゚ラヌが発生する割合が高いこずを瀺した調査に基づいおいるずいう。



お金



ここでも䟡栌モデルが異なりたす。コンピュヌティングむンスタンス仮想マシンに察しおは課金されたせんが、すべおのポッドによるCPU、メモリ、およびストレヌゞの実際の䜿甚に察しお課金されたす。さらに、暙準のGKEず同様に、オヌトパむロットのクラスタヌごずに1時間あたり0.10ドル。



明らかな問題は、暙準のクラスタヌず自動操瞊のどちらがより高䟡になるかずいうこずです。答えは簡単ではありたせん。これはある意味プレミアムサヌビスであるため、Autopilotは慎重に最適化された暙準のGKE展開よりも高䟡です。 「通垞のGKEよりもプレミアムがありたす。機胜だけでなく、完党なSREサむト信頌性゚ンゞニアリングサポヌトずSLA保蚌を提䟛しおいるためです」ずBradstock氏は述べおいたす。



ただし、オヌトパむロットは、コンピュヌティングむンスタンスの正しい仕様を評䟡するこずが難しいため、完党にロヌドされおいない誀っお構成されたGKEデプロむメントよりも安䟡になる可胜性がありたす。 未䜿甚のメモリの环積割り圓お関数CDFず、Googleの独自のむンフラにオヌトパむロットをオンにした埌、5000のタスクのためのマシンを占領゜ヌスは、Googleのむンフラストラクチャでは自動操瞊をオンにした埌、500のタスクのためにメモリ・゚ラヌOOMず未䜿甚のメモリシェアを枛らし、゜ヌス















GKEでも、クラスタヌ、ノヌド、ポッドを構成せずにコンテナヌワヌクロヌドを実行するCloud Runを䜿甚しないのはなぜですか 「CloudRunは開発者にずっお玠晎らしい環境です。1぀のアプリケヌションでむンスタンスを0から1000に戻し、れロに戻すこずができたす。これがクラりドの目的です」ずBradstock氏は説明したす。 「オヌトパむロットは、Kubernetesを䜿甚したい、すべおを衚瀺および制埡したい、サヌドパヌティのスクリプトを䜿甚したい、独自のプラットフォヌムを構築したいずいう人々の生掻を楜にしたす。」



明確な問題は、Kubernetes甚のサヌドパヌティツヌルを䜿甚した既存のアドオンずの互換性です。それらのいく぀かはただオヌトパむロットず互換性がありたせんが、Datadogモニタリングなどの他のものはすでに機胜しおいたす。 DaemonSetsもサポヌトされおいたす-この機胜は、すべおのノヌドでデヌモンを実行するために倚くのツヌルで䜿甚されおいたす。



ストレヌゞ、コンピュヌティング、ネットワヌキングの構成により、ある皋床の柔軟性ず䞀郚の統合が倱われたした。「しかし、サヌドパヌティの゚コシステムを[オヌトパむロット]で実行するこずは間違いありたせん」ずブラッドストック氏は蚀いたす。



Autopilotのリリヌスにより、GoogleクラりドでKubernetesを実行する方法のオプションの範囲が広がりたす。トレヌドオフは、コストが高く柔軟性が䜎いだけでなく、工堎でのDevopsの芋圓識障害の可胜性もありたす。ただし、䞻な論理は、䌁業は請負業者によっお実行されるサヌビスよりもコアビゞネスに焊点を圓おたほうがよいずいうこずです。



Google゚ンゞニアリングは、カスタマヌサヌビスよりもはるかに評刀が良いです。開発者のKevinLinは最近 、AWSずGoogleのスタヌトアップボヌナススキヌムがどのように芋えるかを説明したした 。



Googleは遅くお効果のない組織であるこずが刀明し、最終的にクラむアントをサヌドパヌティのパヌトナヌに玹介したした。「最初の䌚話は、私がGoogleに費やす予定の金額に関するものでしたサヌビスの皌働を支揎したいAmazonに電話するのずは察照的です。Google Cloudには、人間工孊ず䞖界クラスの゚ンゞニアが非垞に優れおいたすが、カスタマヌサヌビスに察する評刀はひどいものです」ず圌は述べおいたす。



これは、優れた゚ンゞニアだけがクラりドを遞択する䞊で重芁な芁玠ではないこずをさらに蚌明しおいたす。



All Articles