ユニバーサルインテリジェンスの問題設定:共通言語がない

はじめにまたはどのAIについて話しているのか

私は主に、複雑な目標を達成するためのマシンとしてのユニバーサルAIに興味があります。つまり、ある種のハードウェアとソフトウェアの複合体であり、100ドルの費用がかかる飛行機を作り、時速800 kmの速度で1000キロメートルを飛行し、5人を運ぶということです。またはこのように:末期の癌からそのような人を治療します。





AIは、物理的に可能であれば、そのようなタスクに対処できるはずです。そしてそれが不可能な場合は、与えられたものに可能な限り近い結果を達成してください。





現時点では、ユニバーサルAIを取得する方法が2つあります。 





最初の方法は、強化学習のようなシステムです。それらはいくつかのロボットのセンサーとアクチュエーターに接続し、報酬信号も持っています。強化学習(以下、RL)は、平均して可能な限り多くの報酬を受け取るように機能します。そして、報酬チャネルは、AIに何が欲しいかを伝えるための主要な方法です。





一般化されたRLスキーマ
一般化されたRLスキーマ

- , GPT-3, . . - , . , … GPT-3 “ - ” - . “ - ” - , . “ ?” GPT-3 , . GPT-3 .





Reinforcement Learning





- , RL , , , .





- . , .





,

, RL . - , 224224, , - . , , , , , . , - , , , - , , , . .





. :





1) , . , . ~1000-2000 . , , .





2) . - , “ ”, . , . , “ ”, , .





RL , .





RL . . RL - . - .





, RL . . RL , , .





?





  1. -, RL . , , . - . .





  2. - . RL , . , Doom, , , . RL , . RL - - , , . - - , , - ,   "" "".





, RL : Doom. .





RL , . , , - Exit.





RL , - , , , , , , Exit. , .





, , .





?





  1. RL . . , .





  2. , RL . , - - .





  3. : RL , . , - , - . , RL - .





  4. : , . , - . , RL , Exit. , “” - - , 5%, . , - , .





. , RL , . , , … : RL , , . , , , , , .





, RL , . . .





RLは目的のために促された
RL,

, , . - . : . -, . -, , , .





-. - Model-Based . “ ” - , , . ( , ) . , , -.









- , , ->, (, )-> .





.





. , . . RL , . , , , - . , RL , : , , .









, , , , , .





, , . , - RL.





? RL , , . , , . , - .





, . , , - , , . , - , - .





- - . , , .





- , . . , RL .





: ? , ?





: - , , … , .





: , , . , , , . , , , , 110 - , .





?





, : , , ( ). , “” “”.





, , . , , . “ , ”, - .





“ ” - , , . . , . , , . , , , . , -, “” , .





? ?





- . , -, , . , , RL . - , , - .





ビデオを観察しているニューラルネットワークの観点から、手は黄色いボールに近いです。 実際、彼らは同じ線上にあります
, .

, . , . , RL “” - , , . ?





, . , - .





, , GAN. ( , - RL) , , . , . “” “” - , , - . .





, RL , - . , .





-

, , . , , , , - , .





, - RL - , . RL, . - - , RL.





RL . ( --) - : , , … , .





, . , , , .





彼は何が彼を殺したのかさえ理解していませんでした
,

, . , . . - “ ”, .





, , , , , . , , , - .





, RL . , . , RL - , , . , . . 





ニューラルネットワークが最もよく気づいたことに注意してください。 シャドウ、ハイライト、HUD、スカイライン
, . , , HUD,

, , , . , , -, . , . : 1000$ 100$ . ? , , . , . , . , - , - - . , , , . , , RL, , , , RL .





- , ( ) - , . , - , . RL - , . , - RL . , .





, , , . , .





, , .





私はこの記事を対話を誘発する方法として意図しました。確かに私はどこかで間違っていて、私が何とか考えていたよりも多くの狡猾な解決策があります。だから詳細なコメントや興味深い議論は大歓迎です!








All Articles