ニュヌラルネットワヌクの䞖界が向かっおいるずころiPavlovの䜜成者ぞのむンタビュヌ

カットの䞋で-深い孊習、AI開発の珟圚の方向性、GPTニュヌラルネットワヌクを䞖界の論理的なビュヌにリンクするこず、スタッフの䞍足、そしおiPavlovがどのように始たったかに぀いお口頭の人工知胜プロゞェクト。







今日、MIPTのニュヌラルネットワヌク研究所の責任者であるMikhailBurtsevず物理的および技術的な䌚話をしおいたす。圌の研究察象には、ニュヌラルネットワヌク孊習モデル、神経認知およびニュヌロハむブリッドシステム、適応システムず進化アルゎリズムの進化、ニュヌロコントロヌラヌずロボティクスが含たれたす。これはすべお議論されたす。









-Phystechのニュヌラルネットワヌクずディヌプラヌニングの研究所の歎史はどのように始たったのですか



-2015幎に、私は「Foresight Fleet」ず呌ばれる、Agency for Strategic InitiativesASIのむニシアチブに参加したした。これは、National TechnicalInitiativeの䞋で議論するためのこのような数日間のプラットフォヌムです。重芁なトピックは、䌁業が䞖界垂堎で䞻導的な地䜍を占める可胜性のあるロシアに登堎するために開発する必芁のある技術に関するものでした。䞻なメッセヌゞは、圢成された垂堎に参入するこずは非垞に難しいずいうこずでしたが、テクノロゞヌは新しい領域ず新しい垂堎を開き、私たちが参入する必芁があるのはたさにそれらです。



そこで、私たちはノォルガに沿っお自動車で航海し、そのような垂堎を創造し、珟圚の技術的障壁を打砎するのにどのような技術が圹立぀かに぀いお話し合いたした。そしお、将来に぀いおのこの議論では、パヌ゜ナルアシスタントずのトピックが成長したした。 Alexa、Alice、Siriなど、すでにそれらを䜿い始めおいるこずは明らかであり、人間ずコンピュヌタヌの間の理解には技術的な障壁があるこずは明らかでした。䞀方で、䟋えば匷化孊習の分野では、自然蚀語凊理においお倚くの研究開発が蓄積されおきたした。そしお、明らかになりたした。倚くの困難なタスクは、ニュヌラルネットワヌクの助けを借りおたすたす改善されおいたす。 



そしお、私はちょうどニュヌラルネットワヌクアルゎリズムの研究をしおいたした。先芋の明のある艊隊の議論の結果に基づいお、私たちは近い将来の技術開発プロゞェクトのコンセプトを策定し、それは埌にiPavlovプロゞェクトに倉換されたした。これがPhystechずのやりずりの始たりでした。 



より詳现には、3぀のタスクを策定したした。むンフラストラクチャ-ナヌザヌずの察話を行うためのオヌプンラむブラリを䜜成したす。 2぀目は自然蚀語凊理の研究です。さらに、特定のビゞネス䞊の問題の解決策。



Sberbankがパヌトナヌずしお機胜し、プロゞェクト自䜓はNational TechnicalInitiativeの翌の䞋で圢成されたした。



, 2015 -: deephack.me — , , - , . Open Data Science. 



2018幎の初めに、オヌプンラむブラリDeepPavlovの最初のリポゞトリを公​​開したした。過去2幎間で、ナヌザヌの着実な増加が芋られたしたロシア語ず英語に焊点を圓おおいたす。むンストヌルの玄50は米囜から、20〜30はロシアからのものです。党䜓ずしお、それはかなり成功したオヌプン゜ヌスプロゞェクトであるこずが刀明したした。 私たちは、䌚話型AIに関するグロヌバルな研究課題を開発するだけでなく、貢献しようずしおいたす。この分野での孊術競争の必芁性を認識し、䞻芁な機械孊習䌚議であるNeuIPSの䞀環ずしお、䌚話型AIチャレンゞシリヌズを立ち䞊げたした。  







たた、倧䌚の開催だけでなく、参加も行っおいたす。そこで、昚幎、私たちの研究宀のチヌムは、アマゟンからのAlexa Prizeずいうコンテストに参加したした。これは、20分間話すこずに興味を持぀チャットボットを䜜成するこずです。 





次の倧䌚は11月に始たりたす。 



これは倧孊の倧䌚で、参加者の䞭心は孊生ず倧孊職員でした。合蚈350チヌムがあり、昚幎の結果に基づいお7チヌムがトップに遞ばれ、3チヌムが招埅されたした。私たちはトップになりたした。



私たちの察話システムは、米囜のナヌザヌず玄10䞇回の察話を行い、最終的に5段階䞭玄3.35〜3.4の評䟡を埗たした。これは非垞に良いこずです。これは、MIPTでかなり短い時間で䞖界クラスのチヌムを結成できたこずを瀺しおいたす。


珟圚、研究所はさたざたな䌁業ずプロゞェクトを実斜しおいたす。倧芏暡な䌁業の䞭には、HuaweiずSberbankがありたす。さたざたな方向ぞのプロゞェクトAutoML、ニュヌラルネットワヌク理論、そしおもちろん、私たちの䞻な方向-NLP。





-機械孊習では困難だった課題に぀いおなぜこれらの問題を解決するために深局孊習が始たったのですか



-わかりにくい。ここで、私の盎感を少し簡単に説明したす。重芁なのは、モデルに倚くのパラメヌタヌがある堎合、驚くべきこずに、結果を新しいデヌタにうたく䞀般化できるずいうこずです。パラメヌタの数は䟋の数に芋合ったものにできるずいう意味で。同じ理由で、叀兞的なMLは長い間、ニュヌラルネットワヌクの圧力に抵抗しおきたした。この状況では、良いこずは䜕も起こらないようです。





深局孊習モデルにおけるパラメヌタヌの䞊昇出兞



驚くべきこずに、これは圓おはたりたせん。私たちの研究宀のIvanSkorokhodovは.pdf、ほずんどすべおの2次元パタヌンが神経回路網喪倱関数の空間に芋られるこずを瀺したした。



この平面䞊の各点が1セットのニュヌラルネットワヌクパラメヌタに察応するように平面を遞択できたす。そしお、それらの損倱は任意のパタヌンに察応するため、この図に盎接圓おはたるようなニュヌラルネットワヌクを遞択できたす。


ずおも面癜い結果です。これは、そのようなばかげた制限があっおも、ニュヌラルネットワヌクはそれに割り圓おられたタスクを孊習できるこずを瀺唆しおいたす。それはここでの䞀皮の盎感に぀いおです、はい。





IvanSkorokhodovによる蚘事のパタヌンの䟋





-近幎、深局孊習の分野で倧きな進歩が芋られたすが、指暙の限界に身を投じる地平線はすでに芋えおいたすか





AIモデルのサむズずそれらが消費するリ゜ヌスの増加出兞openai.com/blog/ai-and-compute /



-私たちのNLPでは、制限はただ感じられおいたせんが、たずえば、匷化孊習では、䜕かがすでに始たっおいるようですスリップ。぀たり、過去2幎間、質的な倉化はありたせんでした。モンテカルロツリヌサヌチずのハむブリダむれヌションにより、アタリからアルファゎぞの倧きなブヌムがありたしたが、今では盎接的なブレヌクスルヌはありたせん。



しかし、NLPでは、それは逆です。再垰ネットワヌク、畳み蟌みネットワヌク、そしお最埌に、トランスアヌキテクチャずGPT自䜓テキストの生成によく䜿甚される、最新で最も興味深いトランスモデルの1぀-著者のメモすでに玔粋に倧芏暡な開発です。そしお、䜕か新しいこずを成し遂げる䜙地はただあるようです。したがっお、NLPでは、䞊からのバヌはただ衚瀺されおいたせん。もちろん、ここで䜕かを予枬するこずはほずんど䞍可胜ですが。





-機械孊習のための蚀語ずフレヌムワヌクの開発を想像するず、玔粋なnumpy、scikit-learnからtensorflow、kerasで条件付きで曞くこずから-抜象化のレベルが高たりたした。次は䜕ですか



— , : - . , , low level high level code: numpy . , , NLP : .



  • Tensorflow / Pytorch — : . 
  • : NLP- — DeepPavlov. 
  • : — DeepPavlov Dream .
  • DeepPavlov゚ヌゞェントを含むスキル/パむプラむンを切り替えるためのシステム。 


 



䌚話型AIテクノロゞヌスタック



アプリケヌションやタスクが異なれば、ツヌルの柔軟性も異なる必芁があるため、この階局の芁玠がなくなるこずはないず思いたす。䜎レベルシステムず高レベルシステムの䞡方が、必芁に応じお進化したす。たずえば、プログラマヌが利甚できないビゞュアルラむブラリだけでなく、開発者向けの䜎レベルのラむブラリもどこにも行きたせん。





-瀟䌚実隓は珟圚、神経回路網が自分の前にあるのか人の前にあるのかを人々が理解しなければならない叀兞的なチュヌリングテストずの類掚によっお行われおいたすか



-このような実隓は定期的に実斜されたす。Alexaチャレンゞでは、ボットず人のどちらず話しおいるのかわからないたた、䌚話の質を評䟡する必芁がありたした。これたでのずころ、ラむブ䌚話の芳点からは、機械ず人の違いは倧きいですが、幎々枛少しおいたす。ちなみに、  これに関する蚘事はAIMagazineに掲茉されたした。



科孊界の倖では、これは定期的に行われたす。最近、誰かがGPTモデルをトレヌニングし、圌女のTwitterアカりントを蚭定しお、回答を投皿し始めたした。倚くの人がサむンアップし、アカりントが人気を博し、それがニュヌラルネットワヌクであるこずを誰も知りたせんでした。 



Twitterのように、定匏化が䞀般的で「深遠」である堎合のこのような短い圢匏は、ニュヌラルネットワヌク掚論システムにぎったりです。




-飛躍を期埅できる最も有望な分野はどこだず思いたすか 







-笑飛躍するのは、私の奜きな方向性をすべお統䞀したこずだず蚀えたす。問題化の枠組みの䞭で、より詳现に説明しようず思いたす。珟圚のトランスフォヌマヌベヌスのGPTモデルがありたす。これらのモデルには人生の目的はなく、人間のようなテキストを生成するだけで、完党に目的がありたせん。そしお、圌らはそれを䞖界自䜓の文脈での状況や目暙に結び付けるこずはできたせん。 



そしお、その方法の1぀は、䞖界の論理ビュヌをGPTにバむンドするこずです。これは、倚くのテキストを読み、実際、すでに倚くの論理接続がありたす。たずえば、「Wikidata」ずのハむブリダむれヌションこれは、䞖界に関する知識を説明するグラフであり、その頂点はWikipediaの蚘事です。



GPTがナレッゞベヌスを䜿甚できるように2぀を接続できれば、それは飛躍的な進歩になりたす。



NLPモデルの無目的性の問題に察する2番目のアプロヌチは、人間の目暙の理解をモデルに統合するこずに基づいおいたす。知識グラフに関連付けられた生成蚀語モデルを駆動できるモデルがあれば、それをトレヌニングしお、人が目暙を達成できるようにするこずができたす。そしお、そのようなアシスタントは、NLPを通じおその人、その人の目暙、そしお状況を理解する必芁がありたす-そしお、圌は行動を蚈画する必芁がありたす。そしお蚈画では、匷化孊習が最も効果的です。



これらすべおをどのように組み合わせお最適化するかは、未解決の問題です。



そしお最埌は、ニュヌラルネットワヌクアヌキテクチャの怜玢です。たずえば、進化的アプロヌチを䜿甚する堎合、特定のタスクに最適なアヌキテクチャの空間を探しおいたす。しかし、これらすべおが今日決定されるわけではありたせん。怜玢するスペヌスが倚すぎたす。 



良いニュヌスからハヌドりェアは非垞に急速に進化しおおり、おそらくこれにより、5〜10幎で、ニュヌラルネットワヌク蚀語モデル、知識グラフ、匷化孊習を組み合わせるこずができるようになりたす。そしお、機械による人間の理解に飛躍的な進歩を遂げたす。


そのようなアシスタントの助けを借りお、他のタスクの゜リュヌションを開始するこずが可胜になりたす画像分析、医療蚘録たたは経枈状況の分析、商品の遞択。



したがっお、科孊的な芳点から、今埌5幎間で、ハむブリダむれヌションの分野で急速な発展が芋られるず思いたす。クヌルなタスクがたくさんありたす。



みんな、スタッフ䞍足は甚倧で、新しくお面癜い結果を埗る絶奜のチャンスがあり、たた業界の発展に圱響を䞎えるでしょう。接続する-あなたは瞬間を぀かむ必芁がありたす
著者はそのようなシステムだけを扱っおいるので、この答えを積極的に支持しおいたす。 





-深い孊習に飛び蟌むにはどうすればよいですか



-私には、最も簡単な方法は、深局孊習孊校でコヌスを受講するこずです。圓初は高校生を察象ずしおいたしたが、孊生には非垞に適しおいたす。䞀般的に、これは玠晎らしい仕事です。私はそこでスケゞュヌリングず入門講矩を手䌝いたした。 



たた、倧孊の入門コヌスを芋たり、タスクを実行したりするこずをお勧めしたす。むンタヌネットにはたくさんのこずがありたす。 「再生」するためのすべおのツヌルの䞭で最も優れおいるのは、GoogleのColabです。タスクの䟋は数癟䞇あり、コンピュヌタヌに゜フトりェアをたったくむンストヌルしなくおも、最新の゜リュヌションを芋぀けお実行できたす。



別の方法は、Kaggleで競争するこずです。たた、ロシア語を話すデヌタサむ゚ンスのコミュニティであるOpen DataScienceにも参加しおください。、いく぀かの深い孊習チャネルがありたす。アドバむスやコヌドを手䌝う準備ができおいる人は垞にそこにいたす。



これらが䞻な方法です。








Leader-ID友人、AIプロゞェクトを掚進するためのアクセラレヌタヌの遞択が開始されたため、むンディヌ開発者向けのログむンオプションを怜蚎したした。いいえ、これはチヌムのみが集䞭的に参加する基本的な条件を倉曎するものではありたせん。しかし、珟圚自分のプロゞェクトを持っおいないが参加したいずいう個人からの質問がたくさんありたすそしお、これらはプログラマヌだけでなく、デザむナヌはAIプロゞェクトに倧きな関心を持っおいたす。そしお、私たちは解決策を芋぀けたした。無料のオンラむンハッカ゜ンを通じお、チヌムや志を同じくする人々を集める手助けをしたす。10月10日12:00に開始し、ちょうど1日埌に終了したす。その䞊で、ボットはあなたをチヌムに分配し、次に圌のリヌダヌシップの䞋で、あなたはプロゞェクト開発の䞻芁な段階を通過し、それを矀島20.35に提出したす。すべおの詳现はあなたの個人アカりントにありたす、あなたはただ時間内に登録する必芁がありたす。






All Articles