かなり奇妙な問題が1つあります。これは、長い間数学の民間伝承に含まれており、インタビューでもお気に入りのテストになっています。その条件は単純であり、解決策はそれ自体を示唆しているように見えますが、結論に急いではいけません。鉛筆と白紙の紙を取り、座ってそれを理解しましょう。
実際、タスクは何ですか
まったくなじみのない街に到着し、そこで最初に出会ったトラムが17番だったと想像してみてください。この街にトラムのルートがいくつあるかをどのように見積もることができますか?
簡単にするために、市内のトラムルートは1からNまでの番号でギャップなしに番号が付けられていると考えてください。最初は、同じ確率でこれらの番号のそれぞれが最初に表示されるトラム番号である可能性があります。
サンクトペテルブルクの数学者の友人であるニコライ・ニコラエヴィッチ・ヴァシリエフから「偶然の路面電車」の問題を初めて聞いた。それから彼は、彼がこの問題を話し、そしてためらうことなく答えを求めた人々の中で、ほとんどの人が番号34、つまり17から「x2」と呼んだという観察を私と共有しました。私の経験では、最も贅沢なのは私の友人の答えでした「メックマット」:17。ほんの一週間後、私は彼が彼の脳の皮質下のどこかで眠っていた可能性最大化の原理に感動したことに気づきました。わかりました。17と34、つまり「x1」と「x2」は素朴で思慮のない答えですが、正解は何ですか。一般に、この問題には1つありますか。
落とし穴とファンタジーの領域
普遍的に正しい答えの存在を疑う価値があるのはなぜですか?このアイデアは、架空ではありますが、いくつかの単純な宇宙を考えると簡単に思い浮かびます。たとえば、地球上のすべての都市に正確に30のトラムルートがあると想像してください。 「30」がこの宇宙で唯一の正解でしょうか?ここで、別の宇宙に地球上に1000の都市があり、そのうち999に30のトラムルートがあり、残りの1つに正確に17のルートがあると想像してください。今回はどちらの答えが正しいでしょうか。また、 30のルートがたくさんありますが、17のルートは1つだけですか?ルートの数を見積もる人は、現在訪れている都市が偶然に地図上で選ばれたかどうかわからないため、ここで確率論的考察を使用することは非常に難しいとすぐに言わなければなりません。または、この選択には何らかの理由があり、誰かの計算があります。
極端な数学的悲観論の原理
述べられた困難にもかかわらず、数学には私たちの問題に答えることができるという原則があり、それは最も奇妙な世界でも意味があります。
ゲームに関しては、この原則は保証された賞金の最大化と呼ばれ、
その本質を理解するために、1つの簡単な例を見てみましょう。
ゲームを想像してみてください。こぶしの1つであなたから密かに小さなオブジェクトを隠し、それを乾いたエンドウ豆にします。次に腕を前に伸ばして、このエンドウ豆がどれにあるかを推測してもらいます。非常に長いゲームをプレイする時間がありますが、最初は私があなたを打ち負かそうとしているのか、故意に屈服しようとしているのか、それともあなたの成功に無関心なのかがわかりません。あなたの目標ができるだけ多くのゲームに勝つことだとしましょう。この場合、どのような戦略に従う必要がありますか?
まず、次の4つの簡単な戦略の長所と短所を分析してみましょう。
- 常に右手を選択してください。
- 右手から始めて、最後にエンドウ豆が見つかった手を選択します。
- , , . «1» «2», , «3», «4», «5» «6» — .
- , . , «», , «» — .
戦略1)を使用することを決定し、同時に私が常に右手にエンドウ豆を隠す場合、すべてのゲームはあなたに有利に終了します。エンドウ豆を右手だけに隠すというパーティー展開のシナリオは、1)に最適だと言えます。ただし、最悪のシナリオでは、エンドウ豆を左手だけに隠すシナリオ、戦略1)では、ゲームの長さに関係なく、1つのゲームに勝つことはできません。
戦略2)は同じ「悪」に苦しんでいることは容易に推測できます。つまり、最悪のシナリオでは、次の各ゲームで左手から始めて交互に手を組むと、どれだけ長くても勝つことができません。私たちのパーティーは続きました。
それでは、リストの3番目に来る戦略に取り掛かりましょう。それを使用すると、エンドウ豆が右手に隠されているすべてのゲームで勝つ可能性は1/3になり、エンドウ豆が左手にあるゲームでは-2/3になります。3)の最悪のシナリオは、右手だけにエンドウ豆を隠す習慣がある場合であることは明らかです。ただし、この場合でも、十分に長いゲームのセットでは、それらの約3分の1が勝利に終わります。もちろん、理論的には運が悪いかもしれませんし、右手を推測することは決してありませんが、実際には、たとえば1000ゲームのゲームでは、勝利数が以下になる可能性はほとんどありません。
リストの4番目の戦略を使用した場合、ゲームは興味深い機能を獲得します。実際、それはあなたにとって重要ではなくなります。今回は、エンドウ豆を右手に隠したり、左手に置いたりします。どちらの状況でも、勝つ可能性は同じであり、正確に50%になります。私がエンドウ豆を隠す場所について概説した一連の手は、あなたにとってパーティーを発展させるための最良のシナリオと最悪のシナリオの両方になるとさえ言えます。いずれにせよ、かなり長いゲームのバッチでは、それらの約半分があなたの勝利で終わるはずであることがわかります。この意味で、戦略4)は、ここですでに検討した他のすべての戦略と比較して、最大の保証を提供します。
保証されたペイオフを最大化する原則は、ゲームのすべての可能な戦略を列挙することを規定します。それぞれについて、最悪のシナリオでペイオフ値を計算し、このペイオフの金額が最大になる最適な戦略を宣言します。エンドウ豆の位置を推測するゲームでは、リストの最良のものだけでなく、最適なものが戦略番号4であることを示すことができます。本質的に、保証された勝利を最大化することは、常に最悪の事態を予想する傾向がある人々の人生の信条に似ていますが、それでもどういうわけか人生における彼らの立場を改善しようとしています。
「ランダムな」トラムの問題は最終的な形を取ります
形式主義
保証された賞金を最大化するという原則を使用するために、運命があなたとゲームをしていると想像してください:それはあなたを未知の宇宙にある未知の都市に何度も送り、そこで最初のトラムに会うまで待ってから、いくらを尋ねますこの街でも同じようにトラムルートしかありません。あなたが名前を付けた数だけが上向きと下向きの両方で本当の数と2倍未満しか異ならない場合、あなたの答えは受け入れ可能であると見なされ、ゲームはあなたに有利に終了すると見なされます。また、これは非常に長いゲームのバッチであり、一生続くと想定します。
今、質問をすることは非常に正当です:「説明されたゲームのどの戦略が、保証された許容可能な答えの最大数を提供できるという意味であなたにとって最適でしょうか?」
最も単純な戦略の詳細な分析
提起された問題との「最初の戦い」として、素朴な戦略「x1」と「x2」がどれほど優れているかを調べてみましょう。
それで、運命は私たちを別のなじみのない都市に投げ込みました。前と同じように、手紙
戦略「x1」によると
ここで、「x2」戦略を使用することにしたとします。この戦略のルールによると、トラムの番号を見ると
星へのとげを通して
最適な戦略を探している物語の主要部分に進む前に、私は問題の条件を少し修正し、
誰かが写真フィルムの長いストリップを撮ったと想像してみてください
簡単な演習として、条件が変更されたにもかかわらず、「x1」戦略では約50%が保証され、「x2」ストラテジストでは、どのシナリオの運命が選択されたかに関係なく、それぞれ同じ約75%の許容可能な見積もりが保証されることを示します。
完璧への長い道のり
事前スクリーニング
最後に、すべての準備が完了し、このセクションでは、最適な戦略を探し始めることができます。ただし、簡単にするために、すべての戦略を検討するわけではありませんが、見積もりが行われる戦略に限定します。
ある実験で、粒子の衝突点からフィルムの左端までの距離が次のようになったと想像してください。
許容できると考える回答を分析すると、別の
制限があります。
陛下の公式次
に、保証されたゲインの値を、任意の戦略に対する特定の一般的な分析公式の形式で表現しようとします。
それで、宇宙粒子の登録に関する次の実験では、長さの写真フィルム
なぜなら
図 1
これで、最大値が簡単にわかります。
またはより詳細に:
のための最悪のことは明らかなはずです
これで、最適な戦略を最大化する必要があると主張できます。
したがって、最適な推定値を見つける問題は、関数がどのように見えるかという問題に軽減されました。
間隔で 定義されたすべての連続的に強く増加する関数のクラスの最大値
もっともらしい推論の芸術
おそらく最初に最も簡単なことは、フォームのどの機能を理解することです。
ご覧のように、
距離をセンチメートルではなく、たとえばメートル、インチ、または光年で測定するとどうなるかを考えてみましょう。関数の形式はどのように変化するのでしょうか。
センチメートルで見積もりましょう
一般的に、長さのスケールを扱います
最後の方程式の形式は、関数が
私たちと遠い宇宙文明の代表者が、長さの測定単位が異なるという理由だけで、ここで解決されている問題に対して異なる答えを受け取ることはもっともらしいと思いますか?おそらくそうではありません!したがって、それは
何が起こるかを見てください:私たちの多くの仮定のすべてが正しい場合、最適な機能
厳密な結論:x2の最適性
わかりました、関数によって与えられた推定値について多くのヒントがあります
任意の連続的な厳密に増加する関数を取ります
図:2
関数グラフの場合
今では、その機能を示すことはもはや難しくありません
私は2つの予備的な発言から始めます:
、 そう
つまり、関数のグラフ
グラフの上にない
- 値値
に依存しません
と等しい
、派生物
すべての点で等しい
..。
後で矛盾するように、最初に次のことを仮定しましょう
いくつかのための
派生物以来
図 3
同時に、ポリラインの頂点を覚えておく必要があります
厳密な結論:一意性
今提示した証明で、軸から無限に離れるのではなく、そのような一連の頂点に沿って破線を作成するとどうなりますか
関数があるとしましょう
図:4
記号を示しましょう
- その時点で
値
関数値と一致します
- 派生物
にもかかわらず
同じで等しい
関数の値がどのように変化するかを見てみましょう。
なぜなら
ディスカッションの質問
「ランダム粒子」問題の解決策を「ランダムトラム」問題の条件に個別に適合させてみてください。あなたの結果は何ですか?
フィルム
を10センチメートルより短くすることができない宇宙で「ランダム粒子」の問題を解決していると想像してみてください。これらの条件が推定することを示す
対戦相手があなたを倒したくないことがわかっている場合、保証された賞金を最大化する原則について多くの不満があります。たとえば、この原則は、ゲームのパーティーが気象条件に対して、または世界の株式市場に対して「反対」に行われる場合、正当化されるとはほとんど考えられません。これらの場合の戦略の選択のどの原則を代わりに提案できますか、それらのどれが「ランダムトラム」の問題に適用できますか?
ご意見・ご感想をお待ちしております。
セージ・コワレンコ
2020
magnolia@bk.ru