人工知胜研究における再珟性の危機

AIの研究はハむテクの巚人によっお支配されおいたすが、真のブレヌクスルヌず商品広告の境界線は埐々に曖昧になっおいたす。䞀郚の科孊者は、これをやめる時が来たず考えおいたす。







先月、ゞャヌナルNatureは、31人の科孊者によっお眲名された虐埅的なレビュヌを発衚したした。圌らは、同じゞャヌナルに以前に掲茉されたGoogleHealthの調査が気に入らなかった。その䞭で、Googleは、医療写真で乳がんの兆候を探す人工知胜AIテストの成功した結果に぀いお説明したした。批評家によるず、Googleチヌムはコヌドずテストに関する情報をほずんど提䟛しおいないため、この調査は閉鎖的なプラむベヌトテクノロゞヌの宣䌝甚の説明のように芋えたした。



「私たちはもはやそれを受け入れるこずができたせんでした」ず、トロント倧孊で蚈算ゲノミクスを研究しおいる䞻任査読者であるベンゞャミン・ハむベ・ケむンズは蚀いたす。「そしお、それはこの特定の研究に぀いおではありたせん-私たちは䜕幎も続けお同様の傟向を芳察しおきたした、そしおこれは私たちを本圓に苛立たせたす。」



Haibe-Kainsらは、AI研究の透明性の明らかな欠劂に抵抗する科孊者の数が増えおいたす。 「Googleからこの䜜品を芋た埌、これは科孊ずは䜕の関係もない、非垞に尊敬されおいるゞャヌナルの䞀連の熱狂的な出版物の単なる別の䟋であるこずに気づきたした」ず圌は蚀いたす。 -これはクヌルなテクノロゞヌの宣䌝です。それに぀いおは䜕もできたせん。」



科孊は信頌に基づいおおり、他の人が調査結果を耇補しお怜蚌するために十分に詳现に研究が行われおいる方法の詳现を開瀺するこずを含みたす。これは、科孊がそれ自䜓を修正し、未確認の結果を根絶する方法です。再珟性により、他の人はそれらの結果に基づいお䜜業を行うこずができ、知識の分野を前進させるのに圹立ちたす。再珟できない科孊は、歎史の傍芳者になっおいたす。



少なくずも理論的には。実際には、ほずんどの研究者は叀い結果を繰り返すよりも新しい結果を埗るこずに関心があるため、完党に再珟可胜な研究はほずんどありたせん。ただし、生物孊、物理孊、コンピュヌタヌサむ゚ンスなどの分野では、研究者は、著者が共有するのに十分な情報を提䟛しお、これらの実隓を繰り返すこずができるようにするこずを期埅しおいたす。



野心的な初心者



AIはいく぀かの理由で叱られたす。たず、初心者です。 Facebook AIResearchずMcGillUniversityのコンピュヌタヌ科孊者であるJoelPignoは、この苊情の共著者であるず、過去10幎間で実隓科孊になりたした。 「最初は玔粋に理論的な領域でしたが、今ではたすたす倚くの実隓を行っおいたす」ず圌女は蚀いたす。 「そしお、厳密な方法論ぞの私たちの取り組みは、私たちの実隓の野心に遅れをずっおいたす。」



これは単なる孊術的な問題ではありたせん。透明性が欠劂しおいるため、新しいAIモデルずテクノロゞヌの信頌性、歪みの欠劂、安党性を適切にテストするこずは䞍可胜です。 AIは、研究所から珟実の䞖界ぞず急速に移行しおおり、人々の生掻に盎接圱響を䞎えおいたす。ただし、ラボでうたく機胜する機械孊習MLモデルは、珟実の䞖界では壊れお、危険な結果に぀ながる可胜性がありたす。さたざたな研究者によるさたざたな条件での実隓結果を再珟するこずで、起こりうる問題がより迅速に明らかになり、AIがすべおの人にずっおより信頌できるものになりたす。



AIはすでに「ブラックボックス」の問題に悩たされおいたす。MLモデルがこの結果を正確に生成する方法や理由を蚀うこずができない堎合がありたす。研究における透明性の欠劂は事態を悪化させるだけです。倧芏暡なモデルでは、より倚くの人々に自分の仕事を䜓隓しお理解させるために、できるだけ倚くのオブザヌバヌが必芁です。これにより、ヘルスケアでのAIの䜿甚をより安党に、公序良俗に反しお、チャットルヌムでより䞁寧に行うこずができたす。



AIの通垞の再珟性は、コヌド、デヌタ、ハヌドりェアの3぀が䞍足しおいるために劚げられおいたす。AIの2020幎の状態「投資家のNathanBenaichずIanHogarthによる怜蚌枈みの幎次分析では、AI研究の15のみがコヌドを共有しおいるこずがわかりたした。業界の研究者は、倧孊の科孊者よりも䞍正行為を行う可胜性が高いです。特に、OpenAI䌁業がレポヌトで匷調されおいたす。およびDeepMindは、コヌドを共有する可胜性が最も䜎いです。



AIの2぀の柱であるデヌタずハヌドりェアに関しおは、再珟性に必芁なツヌルの欠劂がより深刻に感じられたす。倚くの堎合、デヌタは個人の手に保持されたすたずえば、Facebookがナヌザヌに関しお収集するデヌタ、たたは医療蚘録の堎合のように機密性がありたす。技術の巚人は、少数の倧孊や䞭小䌁業がアクセスできる巚倧で非垞に高䟡なコンピュヌタヌクラスタヌに぀いおたすたす倚くの研究を行っおいたす。



たずえば、いく぀かの芋積もりによるず、GPT-3蚀語ゞェネレヌタヌをトレヌニングしたす、OpenAIのコストは10〜1200䞇ドルです。これは、プロトタむプのコストや開発およびトレヌニングを考慮せずに、最新のモデルを考慮した堎合のみです。 「そうすれば、その数字はおそらく1、2桁増える可胜性がありたす」ず、AIスタヌトアップベンチャヌキャピタル䌚瀟Air StreetCapitalの創蚭者であるBenaichは蚀いたす。倧手ハむテク䌁業のごく䞀郚がそれを買う䜙裕がある、ず圌は蚀いたす「他の誰もそのような実隓にこれほど莫倧な予算を投じるこずはできたせん。」





架空の質問GPT-3にアクセスできる人もいれば、アクセスできない人もいたす。 OpenAIプロゞェクト以倖の人々が最先端の結果を埗るためにGPT-3を䜿甚しおいる新しい䜜業が出珟するずどうなりたすか

そしお䞻な問題は、OpenAIが勝者ず敗者の研究者を遞ぶのかずいうこずです。




進歩のスピヌドは目がくらむほどです。毎幎䜕千もの䜜品が出版されおいたす。しかし、誰を信頌するかわからない堎合、この分野の開発を促進するこずは非垞に困難です。耇補により、他の研究者は、著者が手動で最良の結果ず䞀臎しなかったこず、および新しいテクノロゞヌが実際に説明どおりに機胜するこずを確認できたす。 「信頌できる結果を他の結果ず区別するこずはたすたす困難になっおいたす」ずPiñoは蚀いたす。



ここで䜕ができるでしょうか他の倚くのAI研究者ず同様に、ピグノは倧孊ず䌁業の研究宀の間で時間を分けおいたす。近幎、圌女はAI研究の出版システムに積極的に圱響を䞎えおきたした。たずえば、昚幎、圌女は、最倧のAI䌚議の1぀であるNeurIPSぞの論文提出で研究者が提䟛しなければならない項目のリストの宣䌝を支揎したした。コヌド、実隓の詳现な説明が含たれおいたす。



再珟性はそれ自䜓が䟡倀がありたす



Pinhoはたた、研究者が公開された研究者の結果を耇補しようずするいく぀かの再珟性コンテストの立ち䞊げを支揎したした。参加者は、䌚議で受け入れられた論文を遞択し、提䟛された情報に基づいお実隓を実行しながら、互いに競争したす。確かに、圌らは報酬ずしおの認識のみを受け取りたす。



動機の欠劂は、AIだけでなく、すべおの研究分野でそのような慣行の普及を促進するわけではありたせん。耇補は必芁なこずですが、決しお奚励されおいたせん。この問題の1぀の解決策は、この䜜業に孊生を参加させるこずです。過去数幎間、ペシュア・ベンゞオによっお蚭立されたモントリオヌルの研究所であるミラのロヌズマリヌ・ケ博士が再珟性競争を組織したした、孊生がトレヌニングの枠組みの䞭でNeurIPSに提出された研究を再珟しようずする枠組みの䞭で。成功した詊みのいく぀かは、ピアレビュヌされ、ReScienceで公開されたす。



「他の人の䜜品を最初から再珟するには、倚倧な劎力が必芁です」ずKe氏は蚀いたす。 「再珟性コンペティションはこの努力に報い、良い仕事をした人々を称えたす。」Keず他の人々は、AI䌚議でこれらの詊みに぀いお話し、研究者が仕事に透明性を加えるこずを奚励するワヌクショップを開催したす。今幎、PinhoずKeは競争をICMLずICLRを含む7぀の最倧のAI䌚議。



透明性を促進する別のプロゞェクトは、Papers withCodeず呌ばれたす。ケンブリッゞ倧孊で働いおいたAI研究者のロバヌト・ストむニックによっお組織されたした。珟圚、圌ずピニョはFacebookで協力しおいたす。このプロゞェクトは、研究者が自分の仕事から自分のコヌドにリンクできるスタンドアロンのWebサむトずしお最初に立ち䞊げられたした。今幎、このプロゞェクトは人気のあるarXivプレプリントサヌバヌず提携したした。 10月以降、arXivで公開されおいるすべおの機械孊習䜜品には、「コヌド付きの論文」セクションがあり、そこから䜜品の䜜成者が公開する準備ができおいるコヌドぞのリンクがありたす。プロゞェクトの目暙は、そのようなコヌドの配垃を暙準にするこずです。



これらの詊みは䜕か圱響がありたすかPignoは、昚幎、前提条件リストがリリヌスされたずきに、NeurIPS䌚議に提出されたコヌド提出論文の数が50から75に増加したこずを発芋したした。䜕千人ものレビュヌアが、コヌドを䜿甚しお提出物を評䟡したず述べおいたす。再珟性競争ぞの参加者の数は増えおいたす。



悪魔は现郚にありたす



しかし、これはほんの始たりに過ぎたせん。 Haibe-Kainsは、コヌドだけでは実隓を再実行するのに十分でないこずが倚いず指摘しおいたす。 AIモデルを構築するには、倚くの小さな倉曎を加える必芁がありたす。そこにパラメヌタヌを远加し、ここに倀を远加したす。これらのいずれも、動䜜モデルを非動䜜にする可胜性がありたす。モデルのトレヌニングず調敎の方法を説明するメタデヌタがないず、コヌドが圹に立たなくなる可胜性がありたす。 「悪魔は本圓にささいなこずにありたす」ず圌は蚀いたす。



たた、配垃するコヌドが垞に明確であるずは限りたせん。倚くの研究所では、特別なプログラムを䜿甚しおモデルを実行しおいたす。時にはそれは独自の専有゜フトりェアです。たた、どのコヌドを共有するかを刀断するのが難しい堎合もありたす、ずHaibe-Kains氏は蚀いたす。



ピニョはそのような障害には特に関心がありたせん。 「コヌドを配垃するこずから期埅されるこずはたくさんありたす」ず圌女は蚀いたす。デヌタの共有はより困難ですが、解決策がありたす。研究者がデヌタを共有できない堎合は、適切なデヌタセットを自分で収集する方法に぀いおのガむダンスを提䟛できたす。たたは、少数のレビュヌ担圓者がデヌタにアクセスしお、他のすべおの人の結果を怜蚌するように手配するこずもできたす、ずKhaibe-Kains氏は蚀いたす。



最倧の問題はハヌドりェアにありたす。 DeepMindは、AlphaGoやGPT-3のような倧芏暡なラボがお金を䜿う倧芏暡なプロゞェクトは、最終的にはすべおの人に利益をもたらすず䞻匵しおいたす。初期の段階では他の研究者がアクセスできないため、膚倧な蚈算胜力を必芁ずするAIは、開発䞭により効率的でアクセスしやすくなるこずがよくありたす。 DeepMindの調査担圓副瀟長であるKorayKavukchuogluは、次のように述べおいたす。「AlphaGo Zeroは、その前身であるAlphaGoをはるかに䞋回る蚈算胜力で、はるかに優れおいたす。



理論的には、これは、研究が遅れお再珟されたずしおも、それはただ可胜であるこずを意味したす。 Kavukchuogluは、Mozillaのベルギヌ人プログラマヌであるJean-Carlo Pascuttoが、空き時間にチェスアンドゎヌプログラムを䜜成し、DeepMindの論文で説明されおいるアルゎリズムを䜿甚しお、AlphaGoZeroのバリアントを耇補しおLeelaZeroず呌ぶこずができたず述べおいたす。 Pignoは、AlphaGoやGPT-3などの䞻力研究はたれであるずも考えおいたす。圌女は、ほずんどのAI研究は、平均的なラボで利甚可胜なコンピュヌタヌで機胜するず述べおいたす。そしお、そのような問題はAIに限ったこずではありたせん。 PinhoずBenayhomは、粒子物理孊を指摘しおいたす。粒子物理孊では、䞀郚の実隓は、Large HadronColliderなどの高䟡な機噚でのみ実行できたす。



ただし、物理実隓は、LHCでいく぀かの研究所が䞀緒に実斜しおいたす。たた、倧芏暡なAI実隓は通垞、民間䌁業が所有および管理する機噚で実行されたす。しかし、ピニョはこれも倉化しおいるず蚀いたす。たずえば、Compute Canadaは、倧孊が倧芏暡なAI実隓を実斜できるようにコンピュヌティングクラスタヌを組み立おおいたす。 Facebookを含む䞀郚の䌁業は、倧孊に自瀟の機噚ぞのアクセスを制限しおいたす。 「状況は完党には解決されおいたせん」ず圌女は蚀いたす。 「しかし、いく぀かのドアが開き始めおいたす。」





, . . Google, , Nature , , Google - .

: , , ( ). . .




Haibe-Kainsは疑っおいたす。圌がGoogleヘルスチヌムに圌の癌蚺断AIからのコヌドを共有するように頌んだずき、圌はコヌドがたださらなるテストを必芁ずしおいるず蚀われたした。チヌムは、同じくNatureに掲茉されおいる、Haibe-Kainsの批刀に察する正匏な回答の䞭で、これず同じ蚀い蚳を繰り返したす。 「私たちは、臚床珟堎で䜿甚する前に、患者、サヌビスプロバむダヌ、芏制圓局ず協力しおすべおを効率的か぀安党に機胜させるために、プログラムを厳栌なテストにかけたす。」研究者たちはたた、圌らが䜿甚するすべおの医療デヌタを共有するこずは蚱可されおいないず述べた。



それはそのようには機胜したせん、ずKhaibe-Kainsは蚀いたす。「圌らがこれから商品を䜜りたいのなら、なぜ圌らがすべおの情報を開瀺したくないのか理解しおいたす。」ただし、科孊雑誌や䌚議で公開する堎合は、他の人が実行できるコヌドを公開するのがあなたの矩務であるず圌は信じおいたす。より少ないデヌタで、たたはより安䟡なハヌドりェアを䜿甚しお、トレヌニングされたバヌゞョンをリリヌスできる堎合がありたす。結果はもっず悪いかもしれたせんが、人々はそれらをいじくり回すこずができたす。「商品の補造ず研究の境界線は垞に曖昧になっおいたす」ずHaibe-Kains氏は蚀いたす。「この分野の専門知識は最終的には倱われるず思いたす。」



研究習慣はあきらめにくい



䌁業が䜜品の出版に぀いお批刀されおいるのなら、なぜそれを気にするのですかもちろん、その䞀郚は広報に関係しおいたす。しかし、これは䞻に最高の商業ラボが倧孊の研究者でいっぱいだからです。 Facebook AI Research、DeepMind、OpenAIなどの堎所の文化は、ある皋床、䌝統的な孊問的習慣によっお圢䜜られおいたす。たた、ハむテク䌁業は、より幅広い研究コミュニティに参加するこずで恩恵を受けおいたす。民間研究所のすべおの倧芏暡なAIプロゞェクトは、公開された研究からのさたざたな結果に基づいおいたす。たた、FacebookのPyTorchやGoogleのTensorFlowなどのオヌプン゜ヌスMLツヌルを䜿甚したAI研究者はほずんどいたせん。



ハむテク倧手䌁業でより倚くの研究が行われるほど、ビゞネス芁件ず研究芁件の間でより倚くのトレヌドオフを行う必芁がありたす。問題は、研究者がこれらの問題にどのように取り組むかです。 Haibe-Kainsは、Natureのようなゞャヌナルが、出版物を別々のストリヌムに分割するこずを望んでいたす。耇補可胜な研究ず技術進歩のデモンストレヌションです。



ピニョは将来に぀いおより楜芳的です。 「オヌプンな研究アプロヌチがなければ、Facebookで働くこずはなかったでしょう」ず圌女は蚀いたす。



他の䌁業ラボもオヌプン性ぞの取り組みを䞻匵しおいたす。 「科孊的な仕事には、他の研究者の泚意深い研究ず再珟性が必芁です」ずKavukchuogluは蚀いたす。 「これは、DeepMindでの私たちの研究アプロヌチの重芁な郚分です。」



「OpenAIは、埓来の研究所ずは非垞に異なるものに成長したした」ず、䌚瀟のスポヌクスマンであるKaylaWoodは蚀いたす。 「圓然、圌女には疑問が生じたす。」圌女は、OpenAIは、AIむニシアチブに関するパヌトナヌシップを通じお、80以䞊の商業および孊術組織ず協力しお、研究を公開するための長期的な基準に぀いお怜蚎しおいるず述べおいたす。



ピニョはそこに䜕かがあるず思っおいたす。圌女は、AI䌁業が2぀のHaibe-Kainsストリヌムの間のどこかで、研究を行うための3番目の方法を瀺しおいるず信じおいたす。圌女は、民間のAIラボのスマヌトな結果を補薬䌚瀟ず比范したす。補薬䌚瀟は、医薬品開発に数十億ドルを投資し、結果のほずんどを自分たちのために保持しおいたす。



ピニョらが採甚した慣行の長期的な圱響はただ芋られおいたせん。習慣は氞久に倉わりたすかこれは研究以倖のAIの䜿甚にどのように圱響したすか AIがどちらの方向に進んでいるかに倧きく䟝存したす。より倧きなモデルずデヌタセットぞの傟向たずえば、OpenAIが続くは、ほずんどの研究者が高床なAIオプションを利甚できない状況をサポヌトしたす。䞀方、モデル圧瞮や数ショット孊習などの新しいテクノロゞヌは、この傟向を打砎し、より倚くの研究者がより小さく、より効率的なAIで䜜業できるようにする可胜性がありたす。



いずれにせよ、倧䌁業は匕き続きAI研究を支配するでしょう。そしお、正しく行われれば、それは䜕も悪いこずではありたせん、ずピグノは蚀いたす。「AIは研究所の働き方を倉えおいたす。」重芁なのは、より倚くの人々が研究に参加する機䌚を確実に埗るこずです。なぜなら、AIぞの信頌は非垞に䟝存しおいるため、最先端から始たりたす。



All Articles