エージェントと環境の間の相互作用-AGIへの道

画像



ニューラルネットワークに人間のように考えるように教えることはできますか?または少なくとも動物のように?動物はどう思いますか?猫の頭の反射で何が起こっているのかを言うことができますか?そして、結局のところ、意識の秘密は何ですか?以下では、これらすべての問題を理解しようとします。



ニューラルネットワークが任意の関数を近似できることは周知の事実であり、これを証明する定理さえあります。入力レイヤー、非表示レイヤー、および出力レイヤーがあります。強化学習の場合、入力層は環境がエージェントにどのように作用するかです。そして、出力層は、環境に対するエージェントのアクションです。十分にスマートなエージェントを取得するには、3つのものが必要です。隠れ層に十分な数のニューロン、補強を受けることができる十分に精巧な環境、そして環境との相互作用を最大化するための多数の入力および出力ニューロンも必要です。



人間の脳を考えてみましょう-1000億ニューロン。正式には、これは100億ニューロンの約10層です。この量を計算するために必要な電力量をコメントに書き込んでください。実験では、10〜100分の1のニューロン数を使用できます。



環境は私たちの周りの世界と同じくらい多様でなければなりません。ロボットエージェントを現実にすることも、仮想現実で教えることもできます。その際、彼に実行してもらいたい機能(エージェントのアクション)からの補強を求めます。



入力ニューロンと出力ニューロンを別々に調べたいと思います。彼らの目標は環境との相互作用です。猫の入力ニューロンは、目、耳、皮膚、その他多くの受容体です。出力ニューロンは主にさまざまな筋肉に接続されており、クリーチャーは環境と相互作用することができます(エージェントの環境へのフィードバック)。より多くの入力ニューロンと出力ニューロン-より良い、より広い、そしてより良い相互作用「environment-agent-environment」



いくつかの例を見てみましょう。受容体は空気の不足を検出します-脳は肺に呼吸を強制します。胃の受容体は空腹について話します-脳は与えられた環境で食物を得る機能を果たします。または針を使った例-何かが皮膚を刺すと、信号は脳に送られ、そこで処理され、脳はこの問題を取り除く方法を手に命令します。それはすべて単純なことです-受容体が乱されていないとき、行動はありません。しかし、受容体が興奮している場合、脳はこの受容体の興奮を取り除くのに役立つ解決策を探します。目的のチェーンが見つかり、受容体がその励起を失うとすぐに、このチェーンの神経接続が強化されます。そして次回は、この一連の行動が優先されます。これは私たちの生活のすべての行動で起こります。したがって、あらゆる環境、および必要なあらゆる機能のためのエージェントを作成できます。問題は、生産能力だけにあります。



All Articles