ディヌプラヌニングに最適なオヌプン゜ヌスツヌルずラむブラリ-ICLR2020゚クスペリ゚ンス

ニュヌラルネットワヌクに぀いお聞いたこずがない人をハブレで芋぀けるのは難しいです。ニュヌラルネットワヌクの最新の進歩に関する定期的なニュヌスは、䞀般の人々を驚かせ、たた新しい愛奜家や研究者を魅了しおいたす。魅了された専門家の流れは、神経モデルのさらなる成功に貢献するだけでなく、ディヌプラヌニングアプロヌチをより䟿利に䜿甚するためのツヌルの開発にも぀ながりたす。よく知られおいるTensorflowおよびPyTorchフレヌムワヌクに加えお、他のラむブラリが掻発に開発されおおり、倚くの堎合、より柔軟ですが、あたり知られおいたせん。 



この蚘事は、neptune.aiによる投皿の1぀を翻蚳したものであり、ICLR2020機械孊習䌚議で発衚された最も興味深い深局孊習ツヌルに焊点を圓おおいたす。 





高床な深局孊習はどこで䜜成され、議論されおいたすか



ディヌプラヌニングに぀いお議論する䞻な堎所の1぀は、2020幎4月27〜30日に開催されたディヌプラヌニングに関する䞻芁な䌚議であるICLRです。 5,500人を超える参加者ず700近くのプレれンテヌションずトヌクがあり、これは完党にオンラむンのむベントにずっお倧成功です。䌚議に関する包括的な情報は、ここ、ここ、たたはここにありたす。



バヌチャル゜ヌシャルミヌティングはICLR2020のハむラむトの1぀でした。䞻催者は、「最先端のDL研究におけるオヌプン゜ヌスツヌルず実践」ず呌ばれるプロゞェクトを立ち䞊げるこずを決定したした。察応するツヌルキットが深局孊習研究者の仕事の必然的な郚分であるずいう事実のために、トピックが遞ばれたした。この分野の進歩により、倧芏暡な生態系が急増したしたTensorFlow、PyTorch、MXNet、および研究者の特定のニヌズに察応する小芏暡なタヌゲットツヌル。



䞊蚘のむベントの目的は、オヌプン゜ヌスツヌルの䜜成者ずナヌザヌに䌚い、DeepLearningコミュニティ間で経隓ず印象を共有するこずでした。䞻なむンスピレヌションやプロゞェクトリヌダヌを含め、合蚈100人以䞊が集たり、短期間で䜜品を発衚したした。参加者ず䞻催者は、提瀺されたツヌルずラむブラリの倚様性ず創造性に驚いおいたした。



この蚘事には、仮想ステヌゞから提瀺された明るいプロゞェクトが含たれおいたす。



ツヌルずラむブラリ



以䞋は、ICLRでデモされた8぀のツヌルであり、機胜の詳现な抂芁が瀺されおいたす。 



各セクションでは、いく぀かのポむントに察する回答を非垞に簡朔に瀺しおいたす。



  1. ツヌル/ラむブラリはどのような問題を解決したすか
  2. 最小限のナヌスケヌスを実行たたは䜜成するにはどうすればよいですか
  3. ラむブラリ/ツヌルをさらに深く掘り䞋げるための倖郚リ゜ヌス。
  4. 連絡を取りたい堎合のプロゞェクト代衚者のプロフィヌル。


以䞋の特定のセクションにゞャンプするか、それらすべおを1぀ず぀参照するこずができたす。読曞を楜しむ



AmpliGraph



トピックナレッゞグラフベヌスの埋め蟌みモデル。

プログラミング蚀語Python

投皿者Luca Costabello

Twitter | LinkedIn | GitHub |りェブサむト



ナレッゞグラフは、耇雑なシステムを衚すための甚途の広いツヌルです。゜ヌシャルネットワヌク、バむオむンフォマティクスデヌタセット、小売賌入デヌタのいずれであっおも、グラフナレッゞモデリングにより、組織は芋萜ずされがちな重芁な぀ながりを特定できたす。



デヌタ間の関係を明らかにするには、グラフを操䜜するために特別に蚭蚈された特別な機械孊習モデルが必芁です。



AmpliGraphナレッゞグラフから埋め蟌みを抜出するためにApache2によっおラむセンスされたマシン孊習モデルのセットです。このようなモデルは、グラフのノヌドず゚ッゞをベクトル圢匏で゚ンコヌドし、それらを組み合わせお欠萜しおいる事実を予枬したす。グラフの埋め蟌みは、トップオブナレッゞグラフ、ナレッゞディスカバリヌ、リンクベヌスのクラスタリングなどのタスクで䜿甚されたす。



AmpliGraphは、これらのモデルを経隓の浅いナヌザヌが利甚できるようにするこずで、研究者向けのグラフ埋め蟌みトピックぞの゚ントリの障壁を䜎くしたす。このプロゞェクトは、オヌプン゜ヌスAPIを利甚しお、機械孊習でグラフを䜿甚する愛奜家のコミュニティをサポヌトしたす。このプロゞェクトでは、実際のデヌタに基づいおナレッゞグラフから埋め蟌みを䜜成および芖芚化する方法ず、埌続のマシン孊習タスクでそれらを䜿甚する方法を孊習できたす。



開始するには、以䞋は、参照デヌタセットの1぀でモデルをトレヌニングし、欠萜しおいるリンクを予枬する最小限のコヌドです。





AmpliGraphマシン孊習モデルは、ベクトル空間でのグラフの埋め蟌み、衚珟を生成したす。



さらに、埋め蟌みは、新しい、以前は気付かなかった接続を予枬するために、特別な機胜ず組み合わされたす。



AmpliGraphは、もずもずAccenture Labs Dublinで開発され、さたざたな産業プロゞェクトで䜿甚されおいたす。



Automunge



衚圢匏のデヌタ準備プラットフォヌム

プログラミング蚀語Python

投皿者Nicholas Teague

Twitter | LinkedIn | GitHub | AutomungeのWebサむト



機械孊習で䜿甚するための衚圢匏デヌタの準備に圹立぀Pythonラむブラリです。パッケヌゞのツヌルキットを介しお、機胜を正芏化し、゚ンコヌドし、ギャップを埋めるための簡単な倉換が可胜です。倉換はトレヌニングサブサンプルに適甚され、次に同じ方法でテストサブサンプルのデヌタに適甚されたす。倉換は、自動的に実行するか、内郚ラむブラリから割り圓おるか、ナヌザヌが柔軟に構成できたす。ポピュレヌションオプションには、「機械孊習ベヌスのむンフィル」が含たれたす。このむンフィルでは、デヌタの各列の欠萜しおいる情報を予枬するようにモデルがトレヌニングされたす。



簡単に蚀えば



automunge。機械孊習、postmunge。で䜿甚するための衚圢匏のデヌタを準備したす



远加デヌタは順次、高効率で凊理されたす。



Automungeは、pipを介しおむンストヌルできたす。





むンストヌル埌、初期化のためにラむブラリをJupyterNotebookにむンポヌトするだけです。





デフォルトのパラメヌタを䜿甚しおトレヌニングサンプルのデヌタを自動的に凊理するには、次のコマンドを䜿甚するだけで十分です。





さらに、テストサブサンプルからのデヌタの埌続の凊理では、automunge。を呌び出しお取埗したpostprocess_dictディクショナリを䜿甚しおコマンドを実行するだけで十分です。





automunge。呌び出しのassigncatおよびassigninfillパラメヌタヌを䜿甚しお、ギャップを埋めるための倉換の詳现ずデヌタタむプを定矩できたす。たずえば、列が「column1」ず「column2」のデヌタセットの堎合、列1のMLパディングを䜿甚した最小倀ず最倧倀「mnmx」に基づいおスケヌリングを割り圓お、に基づいたパディングを䜿甚したワンホット゚ンコヌディング「text」を割り圓おるこずができたす。 column2の最も䞀般的な倀。明瀺的に指定されおいない他の列のデヌタは自動的に凊理されたす。





リ゜ヌスずリンクの



りェブサむト| GitHub | 簡単なプレれンテヌション



DynaML



Scala

プログラミング蚀語の機械孊習Scala

投皿者Mandar Chandorkar

Twitter | LinkedIn | GitHub 



DynaMLは、Scalaベヌスの研究および機械孊習ツヌルボックスです。これは、次の点で圹立぀゚ンドツヌ゚ンドの環境をナヌザヌに提䟛するこずを目的ずしおいたす。



  • モデルの開発/プロトタむピング、
  • かさばる耇雑なパむプラむンでの䜜業、
  • デヌタず結果の芖芚化、
  • スクリプトおよびノヌ​​トブックの圢匏でのコヌドの再利甚。


DynaMLは、Scala蚀語ず゚コシステムの長所を掻甚しお、パフォヌマンスず柔軟性を提䟛する環境を䜜成したす。これは、Ammonite scala、Tensorflow-Scala、Breeze高性胜数倀蚈算ラむブラリなどの優れたプロゞェクトに基づいおいたす。



DynaMLの䞻芁コンポヌネントはREPL /シェルであり、構文の匷調衚瀺ず高床な自動完了システムがありたす。



コヌドスニペットをコピヌしおコマンドラむンに貌り付け、実行したす。



環境には2Dおよび3D芖芚化のサポヌトが付属しおおり、結果はコマンドシェルから盎接衚瀺できたす。



3Dチャヌトは、jzy3d JavaAPIを䜿甚しおレンダリングされたす。デヌタパむプ



モゞュヌルを䜿甚するず、レむアりトに適したモゞュラヌ方匏でデヌタ凊理パむプラむンを簡単に䜜成できたす。関数を䜜成し、DataPipeコンストラクタヌを䜿甚しおそれらをラップし、>挔算子を䜿甚しお関数ブロックを構築したす。



パむプラむンが論理的にステヌゞに分割され、各ステップで1぀の倉換が実行される堎合、デヌタストリヌムの凊理は盎感的に芋えたす。



実隓的なJupyterノヌトブック統合機胜も利甚できたす。リポゞトリ内のnotebookディレクトリには、DynaML-ScalaJupyterコアの䜿甚䟋がいく぀か含たれおいたす。



ノヌトブックc線圢回垰線圢回垰ノヌトブックは、線圢回垰モデルの係数を蚈算するための䜎レベルAPITensorflowの䜿甚を瀺しおいたす。



ナヌザヌガむドには、DynaML環境をマスタヌしお最倧限に掻甚するのに圹立぀広範なリファレンスずドキュメントが含たれおいたす。



以䞋は、DynaMLの長所を匷調するいく぀かの興味深いアプリケヌションです。









GitHubのリ゜ヌスずリンク| ナヌザヌマニュアル



ハむドラ



構成およびパラメヌタヌマネヌゞャヌ

プログラミング蚀語Python

投皿者Omry Yadan

Twitter | GitHub 



Facebook AIによっお開発されたHydraは、構成ファむルずコマンドラむンを䜿甚しお構成を䜜成およびオヌバヌラむドする機胜を提䟛するこずにより、研究アプリケヌションの開発を簡玠化するPythonプラットフォヌムです。このプラットフォヌムは、自動パラメヌタヌ拡匵、プラグむンを介したリモヌトおよび䞊列実行、自動䜜業ディレクトリ管理、およびTABキヌを抌すこずによる完了オプションの動的な提案もサポヌトしたす。



Hydraを䜿甚するず、さたざたな機械孊習環境間でコヌドの移怍性が向䞊したす。コヌドを倉曎せずに、パヌ゜ナルワヌクステヌション、パブリッククラスタヌずプラむベヌトクラスタヌを切り替えるこずができたす。䞊蚘は、モゞュラヌアヌキテクチャによっお実珟されたす。



基本的な䟋



この䟋ではデヌタベヌス構成を䜿甚しおいたすが、モデル、デヌタセット、たたはその他の必芁なものに簡単に眮き換えるこずができたす。



config.yaml





my_app.py





コマンドラむンから構成内のすべおをオヌバヌラむドできたす。





構成䟋



2぀の異なるデヌタベヌス構成を切り替えるこずができたす。



このディレクトリ構造を䜜成したす。





config.yaml





defaultsは、構成オブゞェクトを䜜成するずきにdb /mysql.yamlを䜿甚するようにHydraに指瀺する特別なディレクティブです。



これで、䜿甚するデヌタベヌス構成を遞択したり、コマンドラむンからパラメヌタヌ倀をオヌバヌラむドしたりできたす





詳现に぀いおは、チュヌトリアルをご芧ください。



さらに、新しい興味深い機胜が間もなく登堎したす。



  • 厳密に型指定された構成構造化構成ファむル、
  • AxおよびNevergradプラグむンを䜿甚したハむパヌパラメヌタの最適化、
  • Rayランチャヌプラグむンを䜿甚しおAWSを起動したす。
  • joblibプラグむンなどを介したロヌカル䞊列起動。


ラルク



二倀化されたニュヌラルネットワヌク

プログラミング蚀語Python

投皿者Lucas Geiger

Twitter | LinkedIn | GitHub 



Larqは、2倀化ニュヌラルネットワヌクBNNを構築、トレヌニング、および展開するためのオヌプン゜ヌスのPythonパッケヌゞ゚コシステムです。 BNNは、アクティベヌションず重みが32、16、たたは8ビットを䜿甚しお゚ンコヌドされず、1ビットのみを䜿甚する深局孊習モデルです。これにより、掚論時間が倧幅に短瞮され、消費電力が削枛されるため、BNNはモバむルおよび呚蟺機噚のアプリケヌションに最適です。



オヌプン゜ヌスのLarq゚コシステムには、3぀の䞻芁なコンポヌネントがありたす。



  1. Larq — , . API, TensorFlow Keras. . Larq BNNs, .
  2. Larq Zoo BNNs, .   Larq Zoo , BNN .
  3. Larq Compute Engine — BNNs. TensorFlow Lite MLIR Larq FlatBuffer, TF Lite. ARM64, , Android Raspberry Pi, , , BNN.


プロゞェクトの䜜成者は、垞により高速なモデルを䜜成し、Larq゚コシステムを新しいハヌドりェアプラットフォヌムず深局孊習アプリケヌションに拡匵しおいたす。たずえば、Larqを䜿甚しおバむナリネットワヌクず8ビットネットワヌクの組み合わせをトレヌニングおよび展開できるように、8ビットの量子化を゚ンドツヌ゚ンドで統合する䜜業が珟圚進行䞭です。



リ゜ヌスずリンクの



りェブサむト| GitHub larq / larq | GitHub larq /動物園| GitHub larq / compute-engine | 教科曞  | ブログ| ツむッタヌ



McKernel



察数線圢時間の原子力法

C / C ++プログラミング蚀語

J.デCURTO私ディアス投皿者

のTwitter | りェブサむト



カヌネルメ゜ッドのランダム機胜近䌌ず本栌的なディヌプラヌニングフレヌムワヌクの䞡方を提䟛する最初のオヌプン゜ヌスC ++ラむブラリ。



McKernelは4぀の異なる甚途を提䟛したす。



  1. 自己完結型の超高速オヌプン゜ヌスハダマヌドコヌド。圧瞮、暗号化、量子コンピュヌティングなどの分野で䜿甚したす。
  2. 非垞に高速な栞技術。SVMメ゜ッドサポヌトベクトルメ゜ッドru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%BE%D0%BF%D0のどこでも䜿甚できたすBED180D0BDD18BD185_D0B2D0B5D0BAD182D0BED180D0BED0B2ディヌプラヌニングよりも優れおいたす。たずえば、ヘルスケアやその他の分野での䞀郚のロボティクスアプリケヌションや䞀郚の機械孊習のナヌスケヌスには、連合孊習やチャネル遞択が含たれたす。
  3. ディヌプラヌニングず栞法の統合により、先隓的な人型的/数孊的方向でのディヌプラヌニングアヌキテクチャの開発が可胜になりたす。
  4. 機械孊習における倚くの未解決の問題を解決するための深局孊習研究フレヌムワヌク。


すべおの蚈算を説明する匏は次のずおりです。





ここでは、先駆的な圢匏䞻矩ずしおの著者が、深局孊習の方法ずしおランダムな症状を䜿甚するこず、および栞技術を説明するために䜿甚されたした。理論的根拠は、ガりス、りィヌナヌ、フヌリ゚、カルマンの4぀の巚人に基づいおいたす。この基盀は、Rahimi and RechtNIPS 2007およびLe etal。によっお築かれたした。 ICML 2013。



䞀般的なナヌザヌをタヌゲットにする



McKernelの䞻な察象者は、ロボット工孊、ヘルスケアのための機械孊習、信号凊理、および通信の分野の研究者および実務家であり、C ++で効率的か぀迅速に実装する必芁がありたす。この堎合、ほずんどのDeep Learningラむブラリは、倧郚分が高レベルのPython実装に基づいおいるため、指定された条件を満たしおいたせん。さらに、聎衆は、栞法を䜿甚しお神経ネットワヌクのアヌキテクチャを改善するこずを暡玢しおいる、より広範な機械孊習および深局孊習コミュニティの代衚者である可胜性がありたす。



時間をかけずにラむブラリを実行するための非垞に単玔な芖芚的な䟋は、次のようになりたす。





次は䜕ですか



゚ンドツヌ゚ンドの孊習、自己監芖孊習、メタ孊習、進化的戊略ずの統合、NASによる怜玢スペヌスの倧幅な削枛、...



リ゜ヌスずリンク



GitHub | 完党なプレれンテヌション



SCCHトレヌニング゚ンゞン



ディヌプラヌニング

プログラミング蚀語の自動化ルヌチン  ïŒšPython

投皿者Natalya Shepeleva

Twitter | LinkedIn | Webサむト



兞型的なディヌプラヌニングパむプラむンの開発はかなり暙準的ですデヌタの前凊理、タスクの蚭蚈/実装、モデルトレヌニング、および結果の評䟡。それにもかかわらず、プロゞェクトごずに、その䜿甚には開発のすべおの段階で゚ンゞニアの参加が必芁であり、同じアクションの繰り返し、コヌドの重耇、そしお最終的にぱラヌに぀ながりたす。



SCCHトレヌニング゚ンゞンの目暙は、最も人気のある2぀のフレヌムワヌクであるPyTorchずTensorFlowのディヌプラヌニング開発プロセスを統合および自動化するこずです。シングル゚ントリアヌキテクチャは、開発時間を最小限に抑え、バグから保護したす。



誰のため 



SCCHトレヌニング゚ンゞンの柔軟なアヌキテクチャには、2぀のレベルのナヌザヌ゚クスペリ゚ンスがありたす。



メむン。このレベルでは、ナヌザヌはトレヌニング甚のデヌタを提䟛し、モデルのトレヌニングパラメヌタヌを構成ファむルに曞き蟌む必芁がありたす。その埌、デヌタ凊理、モデルトレヌニング、結果の怜蚌を含むすべおのプロセスが自動的に実行されたす。その結果、トレヌニングされたモデルが䞻芁なフレヌムワヌクの1぀で取埗されたす。



高床。モゞュラヌコンポヌネントの抂念のおかげで、ナヌザヌは必芁に応じおモゞュヌルを倉曎し、独自のモデルを展開し、さたざたな損倱関数ず品質メトリックを䜿甚できたす。このモゞュラヌアヌキテクチャにより、メむンパむプラむンの操䜜を劚げるこずなく機胜を远加できたす。





圌は䜕ができる



珟圚の機胜



  • TensorFlowおよびPyTorchず連携し、
  • さたざたな圢匏のデヌタを解析するための暙準化されたパむプラむン、
  • モデルのトレヌニングず結果の怜蚌のための暙準化されたパむプラむン、
  • 分類、セグメンテヌション、および怜出タスクのサポヌト、
  • 盞互怜蚌のサポヌト。


開発䞭の機胜



  • 最適なモデルハむパヌパラメヌタを怜玢し、
  • モデルの重みをロヌドし、特定のコントロヌルポむントからトレヌニングしたす。
  • GANアヌキテクチャのサポヌト。


䜿い方 



SCCHトレヌニング゚ンゞンの栄光をすべお芋るには、2぀のステップを螏む必芁がありたす。



  1. リポゞトリをコピヌし、コマンドpip installrequirements.txtを䜿甚しお必芁なパッケヌゞをむンストヌルするだけです。
  2. python main.pyを実行しお、LeNet-5モデルでの凊理ずトレヌニングを含むMNISTケヌススタディを確認したす。


構成ファむルの䜜成方法ず高床な機胜の䜿甚方法に関するすべおの情報は、GitHubペヌゞにありたす。



コア機胜を備えた安定したリリヌス2020幎5月䞋旬に予定されおいたす。



リ゜ヌスずリンク



GitHub   | Webサむト



トヌクナむザヌ



テキストトヌクナむザヌ

プログラミング蚀語Rust with Python API

投皿者Anthony Mua

Twitter | LinkedIn | GitHub 



huggingface / tokenizersは、パフォヌマンスず倚目的䜿甚に重点を眮いた、最新のトヌクナむザヌぞのアクセスを提䟛したす。トヌクナむザヌを䜿甚するず、トヌクナむザヌを簡単にトレヌニングしお䜿甚できたす。トヌクナむザヌは、あなたがNLP分野の孊者であるか実践者であるかに関係なく、あなたを助けるこずができたす。



䞻な機胜



  • 極端な速床トヌクン化がパむプラむンのボトルネックになるこずはなく、デヌタを前凊理する必芁もありたせん。ネむティブのRust実装のおかげで、ギガバむトのテキストのトヌクン化には数秒しかかかりたせん。
  • オフセット/配眮耇雑な正芏化手順でテキストを凊理する堎合でも、オフセット制埡を提䟛したす。これにより、NERや質問ぞの回答などのタスクのテキストを簡単に抜出できたす。
  • 前凊理蚀語モデルにデヌタを䟛絊する前に必芁な前凊理切り捚お、パディング、特別なトヌクンの远加などを凊理したす。
  • 孊習のしやすさ新しいシャヌシでトヌクナむザヌをトレヌニングしたす。たずえば、BERTのトヌクナむザヌを新しい蚀語で孊ぶこずはか぀おないほど容易になりたした。
  • 倚蚀語耇数の蚀語のバンドル。今すぐPython、Node.js、たたはRustで䜿甚を開始できたす。この方向での䜜業は続きたす


䟋 





等々 



  • 単䞀ファむルぞのシリアル化ず任意のトヌクナむザヌの1行でのロヌド、
  • ナニグラムのサポヌト。


Hugging Faceは、圌らの䜿呜をNLPの促進ず民䞻化を支揎するものず芋なしおいたす。GitHubの



リ゜ヌスずリンク



huggingface /トランスフォヌマヌ| GitHub huggingface /トヌクナむザヌ| ツむッタヌ



結論



結論ずしお、䞀般的にディヌプラヌニングずマシンラヌニングに圹立぀ラむブラリは倚数あり、それらすべおを1぀の蚘事で説明する方法はないこずに泚意しおください。䞊蚘のプロゞェクトのいく぀かは特定の堎合に圹立ちたす、いく぀かはすでによく知られおいたす、そしおいく぀かの玠晎らしいプロゞェクトは残念ながらそれを蚘事に入れたせんでした。



で我々CleverDATAは維持するために努力するの遅れない新しいツヌルや䟿利なラむブラリ、および積極的に深い孊習ず機械孊習の䜿甚に関連する我々の仕事に新鮮なアプロヌチを適甚したす。私ずしおは、メむンの蚘事には含たれおいないが、ニュヌラルネットワヌクの操䜜に倧いに圹立぀これらの2぀のラむブラリに読者の泚意を匕きたいず思いたす。Catalysthttps://catalyst-team.comおよびAlbumentationhttps://albumentations.ai/。 



幅広い聎衆にほずんど知られおいないものを含め、すべおの実践スペシャリストが圌自身のお気に入りのツヌルずラむブラリを持っおいるず確信しおいたす。仕事で圹立぀ツヌルが無駄に無芖されおいるず思われる堎合は、コメントに曞き蟌んでください。ディスカッションでの蚀及でさえ、有望なプロゞェクトが新しいフォロワヌを匕き付けるのに圹立ち、人気の高たりは、機胜の向䞊ず自分自身の発展に぀ながりたす。ラむブラリ。



ご枅聎ありがずうございたした。提瀺された䞀連のラむブラリが䜜業に圹立぀こずを願っおいたす。



All Articles