🕺🏾 🙇🏻 👨🏻‍💻 私たちは隣人の間の最大の違いを探しています。アルゴリズムによる問題のユーザーフレンドリーな分析 👂🏾 👨🏿‍✈️ 🗾

こんにちは、Habr！

アルゴリズムについて話しましょう。初心者は、それらを困難で、複雑で、理解できないものとして認識することがよくあります。これは部分的には真実ですが、アルゴリズムが基本です。そして、あなたが自分の専門分野の基本をよく知っているほど、あなたはそれに優れている可能性が高くなります。

今日は、1つの美しいアルゴリズムの問題を見ていきます。最初からアルゴリズムを使用することから人々を怖がらせることはないので、分析では、セグメントのツリーの広がり、ナップザック問題のさまざまな最適化、または単純化のための確率的テストはありません。ユーザーフレンドリーなアルゴ。

ここに課題があります：隣人の間の最大の違いを見つけてください。

N個の整数の配列が与えられます。順序付けはされておらず、番号を繰り返すことができます。それをソートし、連続する要素の各ペア間の差を計算したとします。そのような最大の違いを見つけて、それを最適な方法で行う必要があります。

複雑ですか？ [続きを読む]をクリックする前にこれを試してから、解決策を確認してください。

じゃあ行こう。隣人間の最大差。

例を考えてみ

ましょう。N= 11個の要素の配列が与えられたとします。

最初に、単純な問題を解決させ、それはしばしば役立ちます。問題が私たちに要求することを正確に行うことができます-番号を並べ替えて、隣接する要素間の違いを見つけます。ソリューションの複雑さは、使用する並べ替えによって異なります。 qsortまたは mergesortを使用する場合

A = [- 1, - 3, 10, 20, 21, 4, 3, 22, 10, - 2, 15]

$A = [-1, -3, 10, 20, 21, 4, 3, 22, 10, -2, 15]$

、時間の複雑さは

O (N l o g N)

$O(N log N)$ 。数値が整数のセットにかなり密に分布していることがわかっている場合は、カウントソートを使用できます。次に、

O (U + N)

$O(U + N)$ 、ここでUは最大要素と最小要素の差です。このケースは比較的まれですが、この可能性を覚えておく価値があります。

ソート後、配列を取得します。

A s = [- 3, - 2, - 1, 3, 4, 10, 10, 15, 20, 21, 22]

$As = [-3, -2, -1, 3, 4, 10, 10, 15, 20, 21, 22]$

差異の配列アウトレッツライト：

私たちが得る最大の差は6であることを今度は、考えてみましょう、それはより速く、問題を解決することができますか？隣接する要素のペアを反復処理する場合、わずかな違いで多くのペアを検討します。そのようなペアは決して最大の違いを与えることができないかもしれません。確かに、ソートされた配列には

D = [1, 1, 4, 1, 6, 0, 5, 5, 1, 1]

$D = [1, 1, 4, 1, 6, 0, 5, 5, 1, 1]$

対の隣接する番号、最大値と最小値の差を

N - 1

$N-1$

。次に、最大の違いは少なくとも

U

$U$

。この見積もりは、ディリクレの原則によって当てはまります。

U / (N - 1)

$U / (N - 1)$

ハトがケージに配置され、ハトの数がセルの数よりも多い場合、ケージの少なくとも1つに複数のハトが含まれます。

9個の細胞は10羽のハトが含まれている、ディリクレの原理に従って、少なくとも1つのセルが複数の鳩（含まれているウィキペディア）

してみましょうを

、...

D [1] = A s [2] - A s [1]

$D[1] = As[2]-As[1]$

、

D [n - 1] = A s [n] - A s [n - 1]

$D[n - 1] = As[n] - As[n - 1]$

-ソートされた配列のi番目の要素。次に

A s [i]

$As[i]$

。すべてのD [i]の最大値が小さいと仮定すると

D [i] >= 0, D [1] + \dots + D [N - 1] = U

$D[i] >= 0, D[1] + … + D[N-1] = U$

U / (N - 1)

$U/(N-1)$ 、次いで全体和

D [1] + \dots + D [N - 1]

$D[1] + … + D[N-1]$ 厳密に小さいU、矛盾よりあろう。

素晴らしい、最大差の下限があります！次に、互いに近すぎる要素を何らかの方法でローカライズしてみましょう。セグメントを最小要素から最大要素まで、長さの半分の間隔に分割します。

L = U / (N - 1)

$L=U/(N-1)$ 。各要素はちょうど1つの半間隔に分類されます。すべての要素を重複しないグループに分割します。これらはバッチとも呼ばれます。

要素xがどの要素に該当するかを判断するのは非常に簡単です-1+ int（（x --a_min）/ L）（1から数えます）を計算する必要があります。ここで、a_minは配列Aの最小要素であり、1回のパスで見つけることができます。元の配列。唯一の例外は最大要素です-そのような値を持つ要素を別のバッチで作成することをお勧めします。

この図は、上記の例の分布を示しています。わかりやすくするために、これを手で行いましょう。

U = 22 - (- 3) = 25, N = 11 => L = 25 / (11 - 1) = 2.5

$U = 22 - (-3) = 25, N = 11 => L = 25/(11-1) = 2.5$

A = [- 1, - 3, 10, 20, 21, 4, 3, 22, 10, - 2, 15]

$A = [-1, -3, 10, 20, 21, 4, 3, 22, 10, -2, 15]$

(- 1 - (- 3)) / 2.5 = 0.8 => b a t c h = 1

$(-1 - (-3)) / 2.5 = 0.8 => batch = 1$

(- 3 - (- 3)) / 2.5 = 0 => b a t c h = 1

$(-3 - (-3)) / 2.5 = 0 => batch = 1$

(10 - (- 3)) / 2.5 = 13 / 2.5 = 5.2 => b a t c h = 6

$(10 - (-3)) / 2.5 = 13/2.5 = 5.2 =>batch = 6$

(20 - (- 3)) / 2.5 = 23 / 2.5 = 9.2 => b a t c h = 10

$(20 - (-3)) / 2.5 = 23/2.5 = 9.2 => batch = 10$

(21 - (- 3)) / 2.5 = 24 / 2.5 = 9.6 => b a t c h = 10

$(21 - (-3)) / 2.5 = 24/2.5 = 9.6 => batch = 10$

(4 - (- 3)) / 2.5 = 7 / 2.5 = 2.8 => b a t c h = 3

$(4 - (-3)) / 2.5 = 7/2.5 = 2.8 => batch = 3$

(3 - (- 3)) / 2.5 = 6 / 2.5 = 2.4 => b a t c h = 3

$(3 - (-3)) / 2.5 = 6/2.5 = 2.4 => batch = 3$

(22 - (- 3)) / 2.5 = 10 => b a t c h = 11

$(22 - (-3)) / 2.5 = 10 => batch = 11$

(10 - (- 3)) / 2.5 = 5.2 => b a t c h = 6

$(10 - (-3)) / 2.5 = 5.2 => batch = 6$

(- 2 - (- 3)) / 2.5 = 0.4 => b a t c h = 1

$(-2 - (-3)) / 2.5 = 0.4 => batch = 1$

(15 - (- 3)) / 2.5 = 7.2 => b a t c h = 8

$(15 - (-3)) / 2.5 = 7.2 => batch = 8$

バッチ配布は線形時間で実行され、

O (n)

$O(n)$ 追加メモリ。1つのバッチのアイテムでは、2つのアイテムの間に最大の差を与えることはできないことに注意してください。このようにサイズを特別に選択しました。

2つの隣接する要素はどこにありますか？もちろん、隣接する空でないバッチでは！たとえば、この図では、3番目と6番目のバッチの要素は、それらの間のバッチが空であるため、並べ替えられた配列の行に配置できます。2つの要素のみが隣接することは明らかです。3番目のバッチからの最大値と6番目からの最小値です。同様に、差が最大のペアの候補は、最初のバッチの最大要素と3番目のバッチの最小要素になります。

最大の違いをもたらす可能性のある要素のすべてのペアを書き留めましょう。 min（i）-i番目のグループの最小要素、max（i）-最大要素として表します。

最大（1）= -1分（3）= 3

最大（3）= 4分（6）= 10

最大（6）= 10分（8）= 15

最大（8）= 15分（10）=

最大20 （10）= 21分（11）= 22

検討する価値のあるペアを特定しました。実際には、すべてのバッチを1回通過し、最後の空でないバッチとその最大値を維持する必要があります。次の空でないバッチに出くわしたとき、その中の最小値を見つけて、答えを更新しようとします。

私たちは喜ぶでしょう-私たちは時間内に問題を解決しました

O (N)

$O(N)$ 。

実際、私たちはかなりよく知られたアイデアを使用し、実際にはポケットソートの最初のステップを実行しました。元々はバケットソートと呼ばれていました。

アイテムはバスケットに配置され、次に各バスケット内のアイテムが並べ替えられます

。最悪の場合、

O (n^{2})

$O(n^2)$ ですが、十分な数のバッチと要素の均一な分布がある場合の平均実行時間は

O (n)

$O(n)$ 。

「でも待ってください。でも、

U = 0

$U=0$ 、なぜあなたはそれを考慮しなかったのですか？」-注意深い読者は尋ねます。このケースは縮退しているため、考慮していませんが、完全を期すために今すぐ実行しましょう。

最小値と最大値の差がゼロの場合、最大差もゼロになります。実際、それだけです。

私たちは隣人の間の最大の違いを探しています。アルゴリズムによる問題のユーザーフレンドリーな分析

More articles: