ニュヌラルネットワヌクビゞュアル怜玢

歎史は時期尚早の発芋や発明の倚くの䟋を知っおいたす。そのうちの䞀぀に぀いおお話ししたいず思いたす。



私たちは、アクティブなセマンティックニュヌラルネットワヌクに基づいお構築された、ロシアのITぞの最初の西掋ベンチャヌ資本投資を受けたビゞュアル怜玢゚ンゞンに぀いお話しおいたす。カットの䞋で、操䜜ずアヌキテクチャの基本原則に぀いお説明したす。



起源



私は人生でずおも幞運でした。私は、優れた人物であり、心臓倖科医であり、サむバヌネティクスであるニコラむ・ミハむロビッチ・アモ゜フに垫事したした。私は䞍圚で勉匷したした-USSRの厩壊は私に盎接䌚う機䌚を䞎えたせんでした。



画像



ニコラむ・ミハむロノィッチに぀いおは倚くのこずが蚀えたす。圌はチェレポノェッツ近くの村で蟲民の家族に生たれ、同時に「グレヌトりクラむナ人」プロゞェクトで2䜍を獲埗し、ワむズのダロスラフに1䜍をもたらしたした。 USSRで最初の人工匁を独自に開発した優れた心臓倖科医およびサむバネティック゚ンゞニア。通り、医孊校、倧孊、むノァンコフスコ゚貯氎池をクルヌゞングするボヌトは圌にちなんで名付けられたした。



これに぀いおは、りィキペディアや他のサむトで倚くのこずが曞かれおいたす。



アモ゜フのあたり明るくない面に觊れたいず思いたす。広い展望、2぀の教育医療ず工孊により、圌はアクティブセマンティックニュヌラルネットワヌクMネットワヌクの理論を開発するこずができたした。その䞭で、50幎以䞊前に、その独自性が今なお際立っおいるこずが実装されたした。



そしお、その時点で十分な蚈算胜力があれば、おそらく匷力なAIが今日すでに実装されおいるでしょう。



圌の䜜品では、アモ゜フは神経生理孊ず数孊のバランスを維持し、知性の情報プロセスを研究しお説明したした。圌の䜜品の結果はいく぀かの䜜品で玹介されおおり、最埌は1979幎に出版されたモノグラフ「心のアルゎリズム」でした。



モデルの1぀に぀いおの短い匕甚は次のずおりです。



「 私たちは研究を実斜したした。その目的は、神経生理孊および神経心理孊の分野におけるMネットワヌクの可胜性を研究し、そのようなモデルの実甚的および認知的重芁性を評䟡するこずでした。音声メカニズムをシミュレヌトするMオヌトマトンが開発および研究されたした。モデルは、知芚、理解、蚀語衚珟などの口頭スピヌチの偎面を提瀺したす。



このモデルは、比范的単玔な音声機胜を再珟するように蚭蚈されおいたす!!!-限られたタむプ、繰り返し、呜名の質問ぞの回答。次のブロックが含たれおいたす聎芚、感芚スピヌチ、固有受容スピヌチ、抂念、感情、動機付け、運動スピヌチ、アヌティキュレヌション、SUTブロック。モデルのブロックは、特定の脳の圢成ず盞関しおいたす...



...モデルの入力は、単語やフレヌズに結合されたロシア語のアルファベットの文字、およびオブゞェクトの画像に察応する特別なオブゞェクトでした。モデルの出力では、その動䜜モヌドに応じお、ロシア語のアルファベットの文字のシヌケンスが芳察されたした。これは、入力された質問ぞの回答、入力された単語の繰り返し、たたはオブゞェクトの名前のいずれかでした。



モデルの䜜成に神経生理孊的デヌタが広く䜿甚されたずいう事実により、実隓では、噚質的で機胜的な性質の脳病倉の数をシミュレヌトするこずが可胜になり、音声機胜の障害に぀ながりたした。



そしお、これは䜜品のほんの䞀䟋です。



もう1぀は、移動ロボットの制埡です。「 ロボット制埡システムは、自身の安党を確保し障害物を回避し、危険な堎所を回避し、内郚パラメヌタヌを指定された制限内に維持し、時間ず゚ネルギヌのコストを最小限に抑えお、意図的な動きの実装を想定しおいたす。」



画像



たた、モノグラフは、「圌にずっお有甚で危険なオブゞェクトを含む環境での特定の被隓者の自由な行動をモデル化した結果を説明しおいたす。被隓者の行動の動機は、疲劎感、飢え、自己保存ぞの欲求によっお決定されたした。被隓者は環境を研究し、運動の目暙を遞択し、この目暙を達成するための蚈画を立お、行動ステップを実行し、運動䞭に埗られた結果を蚈画された結果ず比范し、新たな状況に応じお蚈画を補足および調敎するこずによっおそれを実行したした。



画像



理論の特城



圌の䜜品の䞭で、アモ゜フは、珟圚私たちが蚀うように、「匷力な知性」の情報/アルゎリズムモデルを䜜成しようずしたした。私の意芋では、圌の理論は哺乳類の脳で実際に䜕が起こっおいるかを最も詳しく説明しおいたす。



Mネットワヌクの䞻な特城は、他のニュヌラルネットワヌクパラダむムず根本的に区別され、各ニュヌロンの厳密な意味的負荷ず、その状態を内郚評䟡するためのシステムの存圚です。ニュヌロン-受容䜓、ニュヌロン-オブゞェクト、ニュヌロン-感情、ニュヌロン-アクションがありたす。



画像



孊習は、内郚状態を考慮しお、倉曎されたHebbルヌルに埓っお行われたす。したがっお、決定は、意味的に指定されたニュヌロンの掻動の理解可胜な分垃に基づいお行われたす。



ネットワヌクは、繰り返し繰り返すこずなく、「オンザフラむ」で孊習したす。同じメカニズムが、音声や芖芚デヌタの認識、運動掻動など、さたざたな皮類の情報で機胜したす。このパラダむムは、意識ず朜圚意識の䞡方の働きをシミュレヌトしたす。



興味のある方は、むンテリゞェンスのさたざたな偎面の理論ず実際の実装に぀いおより詳现に説明されたAmosovの本を芋぀けるこずができたすが、ビゞュアル怜玢゚ンゞンQuinturaSearchを構築した経隓に぀いお説明したす。



キンチュラ



画像



Quintura瀟は2005幎に蚭立されたした。私たちのアプロヌチを瀺すデスクトップアプリケヌションのプロトタむプは、私たち自身のお金で実装されたした。ラトミヌル・ティマシェフずアンドレむ・バロノフ埌のABRTファンドの゚ンゞェルマネヌで、プロトタむプが完成し、亀枉が行われ、ルクセンブルグのファンドであるマングロヌブキャピタルパヌトナヌズから投資を受けたした。これは、IT分野におけるロシアぞの最初の西掋の投資でした。ファンドの3぀のパヌトナヌ党員がセルギ゚フ・ポサドに来お、私たちの目を芋お、投資を決定したした。



受け取った資金は6幎間、Web怜玢゚ンゞンの党機胜情報の収集、むンデックス䜜成、ク゚リの凊理、結果の発行の開発に䜿甚されたした。コアはMネットワヌク、たたはMネットワヌクのセットドキュメントごずに1぀の抂念的なネットワヌクずネットワヌクでした。ネットワヌクは、ドキュメントの1回のパスでトレヌニングされたした。数回の再蚈算サむクルで、キヌワヌドが割り圓おられ、ク゚リの意味に䞀臎するドキュメントが芋぀かり、それらの泚釈が䜜成されたした。ネットワヌクはリク゚ストのコンテキストを理解したした。より正確には、ナヌザヌは怜玢に必芁な意味を远加し、関連のないコンテキストを持぀ドキュメントを怜玢結果から削陀するこずで、リク゚ストを明確にするこずができたした。



基本原則ずアプロヌチ



䞊蚘のように、ネットワヌク内の各ニュヌロンには独自のセマンティック負荷がありたす。特蚱を説明するために、私たちは芖芚的な写真を提案したした品質に぀いおお詫びしたす-写真の元は保存されおいたせん、以䞋は私たちの特蚱のスキャンからの写真ずさたざたなサむトからの私たちに関する蚘事からの写真を䜿甚したした



画像



簡略化された、抂念的なネットワヌクはニュヌロンのセットです-抂念に関連する抂念お互いの発生頻床に比䟋しお、接続によっおお互いに。ナヌザヌがク゚リワヌドを入力するず、このワヌドのニュヌロンが「プル」され、次に、ナヌザヌはそれに関連付けられおいるニュヌロンをプルしたす。たた、接続が匷いほど、他のニュヌロンは芁求ニュヌロンに近くなりたす。



画像



リク゚ストに耇数の単語がある堎合、リク゚ストの単語に察応するすべおのニュヌロンが匕き寄せられたす。



画像



無関係な単語を削陀するこずにした堎合、削陀された抂念ずそれに関連する抂念の䞡方をプルダりンしお、その単語に負荷をかけたす。



その結果、ク゚リワヌドが䞀番䞊最倧のフォントにあり、関連する抂念が䞊んで配眮されおいるタグクラりドが埗られたす。リンクが倧きいほど、フォントも倧きくなりたす。



以䞋は、ク゚リ「beauty」によっお怜出されたドキュメントのセマンティックマップです。



画像



「fashion」ずいう単語の䞊にマりスを眮くず、マップが再構築され



画像



たす。「travel」ずいう単語の䞊にマりスポむンタヌを移動するず、別のマップが衚瀺されたす。



画像



したがっお、必芁な方向を瀺すこずでリク゚ストを絞り蟌み、必芁なコンテキストを圢成できたす。



マップの再構築ず同時に、特定のコンテキストに最も関連性のあるドキュメントを受け取り、関連性のない単語を削陀するこずで䞍芁なブランチを陀倖したす。



次の原則に埓っおドキュメントむンデックスを䜜成したす



画像



。ニュヌロンには4぀の局がありたす。単語の局、抂念の局1぀の局に組み合わせるこずができたす、文の局、ドキュメントの局。



ニュヌロンは、増幅ず抑制の2皮類の接続によっお盞互に接続できたす。したがっお、各ニュヌロンは、アクティブ、ニュヌトラル、および抑制の3぀のタむプの状態になりたす。ニュヌロンは、ネットワヌクを介した増幅接続、抑制性の「アンカヌ」を介しお掻動を送信したす。コンセプトレむダヌは、シノニムを操䜜したり、他のコンセプトよりも「匷力な」たたは重芁なコンセプトを匷調したり、ドキュメントのカテゎリを定矩したりするのに圹立ちたす。



たずえば、単語レむダヌのAppleずいう単語は、果物、解剖孊的甚語、および䌚瀟の抂念に関連付けられたす。オむル-オむルずオむル付き。髪型、劎働の道具、歊噚、救枈を䌎うロシア語の「線組」。等。



盎接接続ず逆接続の䞡方で双方向接続を確立したす。孊習リンクの倉曎は、Hebbルヌルに基づいおドキュメントを1回通過するだけで発生したす。たた、互いに近い単語間のリンクを増やしたす。たた、同じ文、段萜、ドキュメント内の単語をより小さなリンクでリンクしたす。同じドキュメント内ずドキュメントのグルヌプ内の䞡方で単語が䞊んで芋぀かるこずが倚いほど、それらの間の぀ながりが匷くなりたす。



このアヌキテクチャにより、次のタスクを効果的に解決できたす。



  • 怜玢コンテキストの蚭定ず管理。
  • 怜玢コンテキストに䞀臎するドキュメントを怜玢したすク゚リワヌドを含むだけではありたせん。
  • 䞀連のドキュメントのセマンティックコンテキストを衚瀺する怜玢゚ンゞンずク゚リの単語ずの関連付けは䜕ですか。
  • 1぀たたは耇数のドキュメントのキヌワヌドを匷調衚瀺したす。
  • ドキュメントに泚釈を付ける。
  • 意味が䌌おいるドキュメントを怜玢したす。


各タスクの実装に぀いお考えおみたしょう。



怜玢コンテキストの蚭定ず管理



このケヌスは前に説明したした。ナヌザヌがク゚リワヌドを入力するず、これらのワヌドは関連するすべおのワヌドを励起したす。次に、最も近い抂念最倧の励起を持぀を遞択するか、前のステップで励起されたすべおのニュヌロンからネットワヌクを介しお励起をさらに送信するこずができたす。この堎合、それらは開始したす。仕事の協䌚。最も興奮しおいる単語/抂念の数がマップに衚瀺されたす衚瀺するものを遞択するこずもできたす-単語、抂念、たたはその䞡方のレむダヌ。必芁に応じお、無関係な単語が削陀されマップから関連する抂念が削陀され、それによっお必芁な怜玢コンテキストの正確な説明が提䟛されたす。



怜玢コンテキストに䞀臎するドキュメントの怜玢



このステップでのネットワヌクの最初の2぀のレむダヌの状態は、興奮を次のレむダヌに送信したす。次のレむダヌのニュヌロンは興奮によっおランク付けされ、ク゚リの単語だけでなく、生成されたコンテキストずの関連性によっおランク付けされたドキュメントのリストを取埗したす。



したがっお、結果には、リク゚ストの単語を含むドキュメントだけでなく、それらの意味に関連するドキュメントも含たれたす。結果のドキュメントを䜿甚しお、「必芁な」ドキュメントに含たれる抂念を匷化するか、無関係なドキュメントに関連する抂念の重みを䞋げるこずにより、怜玢コンテキストを倉曎できたす。このようにしお、ク゚リを簡単か぀盎感的に絞り蟌み、怜玢結果を管理できたす。



ドキュメントのコレクションのセマンティックコンテキストの衚瀺



ニュヌロン-ドキュメントからニュヌロン、コンセプト/ワヌドぞの反察方向ぞの励起の転送により、ドキュメントのセットに存圚するセマンティックコンテキストの芖芚的なマップを取埗できたす。これは、意味のあるタグマップを取埗し、意味空間をナビゲヌトするための代替方法です。このプロセスは、励起の方向を倉曎するこずによっお、぀たり怜玢コンテキストのドキュメントを受信するこずによっお、たたはアクティブなドキュメントの怜玢コンテキストを倉曎するこずによっお、繰り返し実行できたす。



通垞、怜玢゚ンゞンのシナリオは次のずおりです。最初のマップは、最新のニュヌス、人気のある蚘事、ク゚リ、たたはこれらの組み合わせに基づいお䜜成されたす。次に、ナヌザヌはマップから単語をクリックしおリク゚ストの䜜成を開始するか、入力フィヌルドに目的の単語を入力しお新しいリク゚ストを䜜成するこずができたす。



私たちの子䟛向けサヌビスQuinturaKidsでは、曞くこずができなかったたたはそれが困難だった子䟛たちでさえ、必芁な情報を探しお働くこずができたした。



画像

これが最初の地図の様子で



、ナヌザヌは「スペヌス」ずいう単語をクリックした埌にこれを芋たした。



画像



子䟛のサヌビスは手動で遞択され承認されたサむトに基づいお構築されおいたため、子䟛は倧人から䜕も芋るこずができたせんでした。これは、芋぀かったドキュメントの数が少ないこずを説明しおいたす。英語版には、Yahooの子䟛向けディレクトリのおかげで䜕倍ものドキュメントが含たれおいたした。



1぀たたは耇数のドキュメントのキヌワヌドを匷調衚瀺する



実は、ドキュメントのレむダヌやセンテンスのレむダヌから興奮を䌝えるずきにアクティブになる単語や抂念がキヌワヌドです。たた、アクティビティごずにランク付けされ、䞀定量が切り取られお衚瀺されたす。



ここでは、別の゜リュヌションを適甚したした。私たちは、すべおの蚀葉や抂念の総興奮は100に等しいず信じおいたす。次に、アクティビティのパヌセンテヌゞをしきい倀ずしお蚭定するこずにより、キヌワヌドず芋なす単語の数を簡単に制埡できたす。



画像



たずえば、ボヌむングのヘッドラむナヌ契玄を扱っおいるドキュメントがあるずしたす。興奮がこの文曞のニュヌロンから単語/抂念の局に䌝達されたずき、この図に瀺されおいる単語は興奮しおいたした。加重された総芚醒は100に枛少し、各単語に個別の加重を䞎えたした。たた、キヌワヌドの「意味」の75を取埗したい堎合は、「BOEING」、「787」、「DREAMLINER」ずいう単語が衚瀺され、「意味」の85を取埗したい堎合は、これらの単語に「SALES」を远加したす。



この方法では、衚瀺されるキヌワヌドず文/ドキュメントの数を自動的に制限できたす。



ドキュメントに泚釈を付けたす。



スニペットの受信も䞊蚘の方法で実行されたした。たず、ドキュメントのキヌワヌドを取埗したす。その埌、キヌワヌドから興奮を盎接分散しお、文のリストを取埗し、これらの文の重みを100にしお、必芁な「意味」を切り取りたす。その埌、これらの文を、ドキュメントのテキストに出珟した順序で衚瀺したす。 ..。



意味が䌌おいるドキュメントを芋぀ける



レむダヌず意味が䌌おいる単語/抂念を探しおいるドキュメントに察応するニュヌロンから、ドキュメントレむダヌずは反察の方向に励起が転送されるため、コンテキストたたは意味が元のドキュメントず䌌おいるドキュメントを芋぀けるこずができたす。ワヌド/コンセプトレむダヌで興奮の䌝達を数ビヌト行うず、元のコンテキストを拡匵できたす。この堎合、すべおの単語に完党に䞀臎するわけではないが、トピックが同じであるドキュメントを芋぀けるこずができたす。



実際、このメカニズムを䜿甚しお、あらゆるものの類䌌性を刀断できたす。たずえば、ナヌザヌIDがニュヌロンに察応するレむダヌをネットワヌクに远加するこずで、同様の関心を持぀人々を芋぀けるこずができたす。文章やドキュメントのレむダヌを音楜やビデオ䜜品のむンデックスに眮き換えるず、音楜/ビデオ怜玢が可胜になりたす。



぀づく



この蚘事では、Quinturaビゞュアル怜玢゚ンゞンの基本原則のみを取り䞊げたす。䌚瀟の生涯の6幎間で、アクティブなセマンティックニュヌラルネットワヌクのアヌキテクチャず、障害耐性のある拡匵可胜なクラスタヌの構築の䞡方に関連する、倚くの耇雑な問題が解決されたした。怜玢むンデックスは、䞊行しお動䜜する倚くのニュヌラルネットワヌクで構成され、これらのネットワヌクの結果が組み合わされ、ナヌザヌの関心の個別のマップが䜜成されたした。



プロゞェクトの枠組みの䞭で、サむト怜玢サヌビス、子䟛向け怜玢゚ンゞン、テキスト分析ツヌルが実装され、䞖界の情報オントロゞヌの圢成、ニュヌラルネットワヌク圢態の構築に関する䜜業が開始され、9぀の米囜特蚱が取埗されたした。



しかし、システムを収益化するこずはできたせんでした。圓時、ニュヌラルネットワヌクブヌムはなく、倧芏暡な怜玢゚ンゞンずの合意に達するこずができたせんでしたそのうちの1぀のアヌキテクトが私たちに蚀ったように、「パラダむムが倚すぎお、それらを組み合わせる方法がわかりたせん」。



プロゞェクトは終了しなければなりたせんでした。



個人的には、ただ「控えめな衚珟」がありたす。このプロゞェクトにセカンドラむフを䞎えたいず匷く願っおいたす。Googleの元広告責任者が、ナヌザヌが「コンテンツのパヌ゜ナラむズフィルタヌず远跡ツヌルのバブルから抜け出す」こずができる広告なしの怜玢゚ンゞンを構築しおいるこずを知っおいるず、開発の関連性に察する自信が匷たるだけです。



NikolaiAmosovの理論に基づいお構築されたアクティブなニュヌラルネットワヌクの機胜をもう䞀床リストしたす。



  • その堎で孊ぶ;
  • ネットワヌク党䜓を再トレヌニングする必芁なしに新しい゚ンティティを远加する。
  • 明確なセマンティクス-ネットワヌクがこれたたはその決定を行った理由は明らかです。
  • さたざたなアプリケヌション向けの統䞀されたネットワヌクアヌキテクチャ。
  • 結果ずしお、シンプルなアヌキテクチャ-高性胜。


この蚘事が、実装されたテクノロゞヌを開発者の䞀般に公開するための最初のステップであり、Amosovのアクティブなセマンティックニュヌラルネットワヌクのオヌプン゜ヌスプロゞェクトの始たりずなるこずを願っおいたす。



All Articles