↩️ 🍤 🕡 ユニバーサルインテリジェンスの問題設定：共通言語がない〰️ 🕘 👩🏽‍⚖️

はじめにまたはどのAIについて話しているのか

私は主に、複雑な目標を達成するためのマシンとしてのユニバーサルAIに興味があります。つまり、ある種のハードウェアとソフトウェアの複合体であり、100ドルの費用がかかる飛行機を作り、時速800 kmの速度で1000キロメートルを飛行し、5人を運ぶということです。またはこのように：末期の癌からそのような人を治療します。

AIは、物理的に可能であれば、そのようなタスクに対処できるはずです。そしてそれが不可能な場合は、与えられたものに可能な限り近い結果を達成してください。

現時点では、ユニバーサルAIを取得する方法が2つあります。

最初の方法は、強化学習のようなシステムです。それらはいくつかのロボットのセンサーとアクチュエーターに接続し、報酬信号も持っています。強化学習（以下、RL）は、平均して可能な限り多くの報酬を受け取るように機能します。そして、報酬チャネルは、AIに何が欲しいかを伝えるための主要な方法です。

- , GPT-3, . . - , . , … GPT-3 “ - ” - . “ - ” - , . “ ?” GPT-3 , . GPT-3 .

Reinforcement Learning

- , RL , , , .

- . , .

,

, RL . - , 224224, , - . , , , , , . , - , , , - , , , . .

. :

1) , . , . ~1000-2000 . , , .

2) . - , “ ”, . , . , “ ”, , .

RL , .

RL . . RL - . - .

, RL . . RL , , .

-, RL . , , . - . .
- . RL , . , Doom, , , . RL , . RL - - , , . - - , , - , "" "".

, RL : Doom. .

RL , . , , - Exit.

RL , - , , , , , , Exit. , .

, , .

RL . . , .
, RL . , - - .
: RL , . , - , - . , RL - .
: , . , - . , RL , Exit. , “” - - , 5%, . , - , .

. , RL , . , , … : RL , , . , , , , , .

, RL , . . .

, , . - . : . -, . -, , , .

-. - Model-Based . “ ” - , , . ( , ) . , , -.

- , , ->, (, )-> .

. , . . RL , . , , , - . , RL , : , , .

, , , , , .

, , . , - RL.

? RL , , . , , . , - .

, . , , - , , . , - , - .

- - . , , .

- , . . , RL .

: ? , ?

: - , , … , .

: , , . , , , . , , , , 110 - , .

, : , , ( ). , “” “”.

, , . , , . “ , ”, - .

“ ” - , , . . , . , , . , , , . , -, “” , .

? ?

- . , -, , . , , RL . - , , - .

ビデオを観察しているニューラルネットワークの観点から、手は黄色いボールに近いです。実際、彼らは同じ線上にあります — , .

, . , . , RL “” - , , . ?

, . , - .

, , GAN. ( , - RL) , , . , . “” “” - , , - . .

, RL , - . , .

-

, , . , , , , - , .

, - RL - , . RL, . - - , RL.

RL . ( --) - : , , … , .

, . , , , .

, . , . . - “ ”, .

, , , , , . , , , - .

, RL . , . , RL - , , . , . .

ニューラルネットワークが最もよく気づいたことに注意してください。シャドウ、ハイライト、HUD、スカイライン — , . , , HUD,

, , , . , , -, . , . : 1000$ 100$ . ? , , . , . , . , - , - - . , , , . , , RL, , , , RL .

- , ( ) - , . , - , . RL - , . , - RL . , .

, , , . , .

, , .

私はこの記事を対話を誘発する方法として意図しました。確かに私はどこかで間違っていて、私が何とか考えていたよりも多くの狡猾な解決策があります。だから詳細なコメントや興味深い議論は大歓迎です！

ユニバーサルインテリジェンスの問題設定：共通言語がない

はじめにまたはどのAIについて話しているのか

Reinforcement Learning

,

-

More articles: