はじめにまたはどのAIについて話しているのか
私は主に、複雑な目標を達成するためのマシンとしてのユニバーサルAIに興味があります。つまり、ある種のハードウェアとソフトウェアの複合体であり、100ドルの費用がかかる飛行機を作り、時速800 kmの速度で1000キロメートルを飛行し、5人を運ぶということです。またはこのように:末期の癌からそのような人を治療します。
AIは、物理的に可能であれば、そのようなタスクに対処できるはずです。そしてそれが不可能な場合は、与えられたものに可能な限り近い結果を達成してください。
現時点では、ユニバーサルAIを取得する方法が2つあります。
最初の方法は、強化学習のようなシステムです。それらはいくつかのロボットのセンサーとアクチュエーターに接続し、報酬信号も持っています。強化学習(以下、RL)は、平均して可能な限り多くの報酬を受け取るように機能します。そして、報酬チャネルは、AIに何が欲しいかを伝えるための主要な方法です。
- , GPT-3, . . - , . , … GPT-3 “ - ” - . “ - ” - , . “ ?” GPT-3 , . GPT-3 .
Reinforcement Learning
.
- , RL , , , .
- . , .
,
, RL . - , 224224, , - . , , , , , . , - , , , - , , , . .
. :
1) , . , . ~1000-2000 . , , .
2) . - , “ ”, . , . , “ ”, , .
RL , .
RL . . RL - . - .
, RL . . RL , , .
?
-, RL . , , . - . .
- . RL , . , Doom, , , . RL , . RL - - , , . - - , , - , "" "".
, RL : Doom. .
RL , . , , - Exit.
RL , - , , , , , , Exit. , .
, , .
?
RL . . , .
, RL . , - - .
: RL , . , - , - . , RL - .
: , . , - . , RL , Exit. , “” - - , 5%, . , - , .
. , RL , . , , … : RL , , . , , , , , .
, RL , . . .
, , . - . : . -, . -, , , .
-. - Model-Based . “ ” - , , . ( , ) . , , -.
- , , ->, (, )-> .
.
. , . . RL , . , , , - . , RL , : , , .
, , , , , .
, , . , - RL.
? RL , , . , , . , - .
, . , , - , , . , - , - .
- - . , , .
- , . . , RL .
: ? , ?
: - , , … , .
: , , . , , , . , , , , 110 - , .
?
, : , , ( ). , “” “”.
, , . , , . “ , ”, - .
“ ” - , , . . , . , , . , , , . , -, “” , .
? ?
- . , -, , . , , RL . - , , - .
, . , . , RL “” - , , . ?
, . , - .
, , GAN. ( , - RL) , , . , . “” “” - , , - . .
, RL , - . , .
-
, , . , , , , - , .
, - RL - , . RL, . - - , RL.
RL . ( --) - : , , … , .
, . , , , .
, . , . . - “ ”, .
, , , , , . , , , - .
, RL . , . , RL - , , . , . .
, , , . , , -, . , . : 1000$ 100$ . ? , , . , . , . , - , - - . , , , . , , RL, , , , RL .
- , ( ) - , . , - , . RL - , . , - RL . , .
, , , . , .
, , .
私はこの記事を対話を誘発する方法として意図しました。確かに私はどこかで間違っていて、私が何とか考えていたよりも多くの狡猾な解決策があります。だから詳細なコメントや興味深い議論は大歓迎です!