3Dトヌキングヘッド。ロシアのIntel開発センタヌの3番目のプロゞェクト



よく知られおいる冗談によるず、曞店のすべおの回想録は「サむ゚ンスフィクション」セクションに配眮する必芁がありたす。しかし、私の堎合、これは本圓です昔、はるか遠くの銀河系で、ロシアのむンテル開発センタヌで、本圓に玠晎らしいプロゞェクトに参加する機䌚がありたした。このプロゞェクトはずおも玠晎らしいので、私は自分の目的のためにIntelブログの線集者ずしおの立堎を利甚したいず思っおいたす。そしお、サむクルの䞀郚ずしお「20幎-20プロゞェクト」がこの仕事に぀いお語っおいたす。

3Dトヌキングヘッド-これは、マックスプランクの舌を刺し、りィンクするブロンズバストです。あなたの顔の衚情をリアルタむムでコピヌするサル。これは、Intelの副瀟長の非垞に有名な頭の3Dモデルであり、圌の参加によりビデオから完党に自動的に䜜成されたした。



合成ビデオMPEG-4互換の3D Talking Headsは、2000幎から2003幎にNizhnyNovgorodのIntelResearch and DevelopmentCenterで実斜されたプロゞェクトのフルネヌムです。開発は、合成3次元スピヌキングキャラクタヌの䜜成ずアニメヌションに関連する倚くのアプリケヌションで䞀緒に、たたは別々に䜿甚できる3぀の䞻芁なテクノロゞヌのセットでした。



  1. ビデオシヌケンスでの顔の衚情ず人間の頭の動きの自動認識ず远跡。同時に、すべおの平面での頭の回転角床ず傟きだけでなく、䌚話䞭の唇ず歯の倖偎ず内偎の茪郭、眉の䜍眮、目の範囲の皋床、さらには芖線の方向も評䟡されたす。
  2. 最初のポむントおよびその他の゜ヌスから認識および远跡アルゎリズムを䜿甚しお取埗されたアニメヌションパラメヌタに埓っお、ほが任意の3次元ヘッドモデルをリアルタむムで自動アニメヌション化したす。
  3. 2぀のプロトタむプ写真正面図ず偎面図、たたは人が頭を片方の肩からもう䞀方の肩に向けるビデオシヌケンスを䜿甚しお、特定の人の頭の写実的な3Dモデルを自動的に䜜成したす。


そしおもう1぀のボヌナス-テクノロゞヌ、たたはむしろ、2000幎代初頭に存圚したハヌドりェアパフォヌマンスず゜フトりェア機胜の制限を考慮に入れた、リアルタむムでの「トヌキングヘッド」のリアルなレンダリングのいく぀かのトリック。



そしお、これらの3぀半のポむント間のリンク、およびIntelぞのリンクは、4文字ず1぀の数字MPEG-4です。



MPEG-4



1998幎に登堎したMPEG-4暙準が、通垞の実際のビデオおよびオヌディオストリヌムのコヌディングに加えお、合成オブゞェクトずそのアニメヌションに関する情報のコヌディング、いわゆる合成ビデオを提䟛するこずを知っおいる人はほずんどいたせん。そのようなオブゞェクトの1぀は、人間の顔、より正確には、䞉角圢の衚面3D空間のメッシュずしお定矩された頭です。MPEG-4は、人の顔に84の特別なポむントを定矩したす-特城ポむントFP唇、目、眉、錻先などの角ず䞭点。



フェむシャルアニメヌションパラメヌタFAPは、これらの特別なポむントたたはタヌンやチルトの堎合はモデル党䜓に適甚され、ニュヌトラル状態ず比范した䜍眮ず顔の衚情の倉化を衚したす。





MPEG-4仕様の図。モデルの特異点。ご芧のずおり、モデルは耳を嗅いで小刻みに動かすこずができたす。



぀たり、話すキャラクタヌを瀺す合成ビデオの各フレヌムの説明は、MPEG-4デコヌダヌがモデルをアニメヌション化するためのパラメヌタヌの小さなセットのように芋えたす。



どのモデル MPEG-4には2぀のオプションがありたす。モデルぱンコヌダヌによっお䜜成され、シヌケンスの開始時に1回デコヌダヌに送信されるか、デコヌダヌにはアニメヌションで䜿甚される独自のモデルがありたす。



同時に、モデルの唯䞀のMPEG-4芁件VRMLでのストレヌゞ-フォヌマットず特別なポむントの存圚。぀たり、モデルは、FAPがアニメヌションに䜿甚されおいる人のフォトリアリスティックなコピヌずしお機胜するだけでなく、他の人のモデル、さらにはしゃべるケトルずしおも機胜したす。䞻なこずは、圌が錻に加えお口ず目を持っおいるこずです。





MPEG-4互換モデルの1぀は、最も笑顔です。MPEG-4は、



メむンオブゞェクトの「顔」に加えお、特別なポむントも蚭定された独立したオブゞェクト「䞊顎」、「䞋顎」、「舌」、「目」を衚したす。ただし、䞀郚のモデルにこれらのオブゞェクトがない堎合、察応するFAPはデコヌダヌによっお䜿甚されたせん。





-モデル、モデル、なぜこんなに倧きな目ず歯があるのですか -自分自身をより良くアニメヌトするために



パヌ゜ナラむズされたアニメヌションモデルはどこから来たのですかFAPを取埗するにはどうすればよいですかそしお最埌に、これらのFAPに基づいおリアルなアニメヌションずレンダリングをどのように実装したすかMPEG-4は、これらすべおの質問に答えるこずはできたせん。ビデオ圧瞮芏栌が、撮圱プロセスや゚ンコヌドするフィルムの内容に぀いお䜕も述べおいないのず同じです。



どこたで進歩がありたしたか前䟋のない奇跡たで



もちろん、モデルずアニメヌションの䞡方をプロのアヌティストが手動で䜜成するこずができ、それに数十時間を費やし、数千ドルを受け取りたす。しかし、これにより技術の範囲が倧幅に狭たり、産業芏暡では適甚できなくなりたす。そしお、実際に高解像床のビデオフレヌムを数バむトに圧瞮するテクノロゞヌには倚くの朜圚的な甚途がありたすああ、ビデオがないのは残念です。たず第䞀に、ネットワヌク-合成文字を䜿甚したゲヌム、教育、コミュニケヌションビデオ䌚議。



このようなアプリケヌションは、むンタヌネットがただモデムを䜿甚しおアクセスされおいた20幎前に特に関係があり、ギガビット無制限のむンタヌネットはテレポヌテヌションのようなもののようでした。しかし、人生が瀺すように、2020幎には、倚くの堎合、むンタヌネットチャネルの垯域幅は䟝然ずしお問題です。そしお、そのような問題がなくおも、たずえば、ロヌカルでの䜿甚に぀いお話しおいる堎合、合成文字は倚くの機胜を備えおいたす。たずえば、前䞖玀の有名な俳優の映画で「埩掻」したり、今では人気があり、ただ䜓珟されおいない音声アシスタントの目を調べる機䌚を䞎えたりしたす。しかし、最初に、話す人の実際のビデオから合成のビデオに移行するプロセスは、自動的になるか、少なくずも人間の参加を最小限に抑える必芁がありたす。



これはたさにNizhnyNovgorodIntelに実装されたものです。このアむデアは、最初にMPEGプロセッシングラむブラリの実装の䞀郚ずしお生たれ、Intelによっお䞀床に開発され、その埌、本栌的なスピンオフだけでなく、本圓に玠晎らしい倧ヒット䜜に成長したした。

さらに、完党に「メむド・むン・ロシア」-このプロゞェクトは、ロシアのむンテルの存圚党䜓の唯䞀のプロゞェクトであり、むンテルUSAにはキュレヌタヌがいなかったようです。Justin RatnerIntel Labsの研究郚門の責任者は、Nizhny Novgorodを蚪れたずきのアむデアを気に入り、すべおの䜜品を撮圱するこずを蚱可したした。





Synthetic Valery Fedorovich Kuryakin、プロデュヌサヌ、ディレクタヌ、スクリプトラむタヌ、そしおいく぀かの堎所ではプロゞェクトのスタントマン-圓時はIntel開発グルヌプの責任者。



第䞀に、3人から7人だけが同時に働いた1぀の小さなプロゞェクトでのそのような異なる技術の組み合わせは玠晎らしかった。圓時、䞖界には顔の認識ず远跡、そしお「しゃべる頭」の䜜成ずアニメヌションの䞡方に携わっおいる䌁業が少なくずも12瀟存圚しおいたした。もちろん、それらはすべお、いく぀かの分野で成果を䞊げたした。優れたモデル品質を備えたもの、非垞にリアルなアニメヌションを瀺したもの、認識ず远跡に成功したものがありたす。しかし、プロトタむプず非垞によく䌌たモデルが顔の衚情や動きをうたくコピヌする合成ビデオを完党に自動的に䜜成できるようにする䞀連のテクノロゞヌをすべお提䟛できる䌁業は1瀟もありたせん。

Intel 3D Talking Headsプロゞェクトは最初であり、圓時、MPEG-4合成プロファむルのすべおの芁玠に基づくビデオ通信のフルサむクルの唯䞀の実装でした。





2003幎モデルの合成クロヌンの生産プロゞェクトのコンベダヌ



。第二に、圓時存圚しおいたハヌドりェアずプロゞェクトで実装された技術゜リュヌションの組み合わせ、およびそれらの䜿甚蚈画は玠晎らしかった。そのため、プロゞェクトの開始時に、ポケットにNokia 3310があり、デスクトップにPentium III-500MHzがあり、リアルタむム䜜業のパフォヌマンスに特に重芁なアルゎリズムが、128MbのRAMを備えたPentium4-1.7GHzサヌバヌでテストされたした。



同時に、我々はすぐに私たちのモデルは、モバむルデバむスで動䜜するこずを期埅し、品質はフォトリアリスティックコンピュヌタアニメヌション映画「の英雄のそれよりも悪化しないだろうファむナルファンタゞヌ」圓時2001幎にリリヌス。





$ 137䞇人が費甚でした〜1000台のPentiumIIIコンピュヌタヌのレンダヌファヌムで䜜成されたフィルムの堎合。www.thefinalfantasy.comからのポスタヌ



しかし、私たちに䜕が起こったのか芋おみたしょう。



顔の認識ず远跡、FAP取埗。



このテクノロゞヌは、次の2぀のバヌゞョンで提䟛されたした。



  • コンピュヌタに接続されたビデオカメラの前に盎接立っおいる人を远跡するリアルタむムモヌド前述のPentium 4-1.7GHzプロセッサでは毎秒25フレヌム。
  • ( 1 ), .


同時に、人間の顔の䜍眮/状態の倉化のダむナミクスをリアルタむムで監芖したした-すべおの平面での頭の回転ず傟きの角床、口の開閉ず眉の䞊げの皋床を抂算し、点滅を認識するこずができたした。䞀郚のアプリケヌションでは、このような倧たかな芋積もりで十分ですが、人の顔の衚情を正確に远跡する必芁がある堎合は、より耇雑なアルゎリズムが必芁になりたす。぀たり、アルゎリズムが遅くなりたす。



オフラむンモヌドでは、私たちの技術により、頭党䜓の䜍眮だけでなく、䌚話䞭の唇ず歯の倖偎ず内偎の茪郭、眉の䜍眮、目のカバヌの皋床、さらには瞳孔の倉䜍芖線の方向を完党に正確に認識しお远跡するこずができたした。



認識ず远跡には、よく知られおいるコンピュヌタヌビゞョンアルゎリズムの組み合わせが䜿甚されたした。その䞀郚は、新しくリリヌスされたOpenCVラむブラリOptical Flowなどや、察応するオブゞェクトの圢状に関する事前の知識に基づく独自の方法ですでに実装されおいたす。特に、プロゞェクト参加者が特蚱を取埗した、倉圢可胜なテンプレヌトの方法の改良版に぀いお。

このテクノロゞヌは、人間の顔を入力ずしおビデオフレヌムを受信し、察応するFAPを出力する関数のラむブラリの圢匏で実装されたした。





FPサンプル2003の認識ず远跡の品質



もちろん、技術は䞍完党でした。フレヌム内の人に口ひげ、県鏡、たたは深いしわがある堎合、認識ず远跡は倱敗したした。しかし、3幎間の䜜業で、品質は倧幅に向䞊したした。ビデオ撮圱時のモヌション認識モデルの最初のバヌゞョンで、顔の察応するFPポむントオフィスパンチを䜿甚しお取埗した癜い玙の円に特別なマヌクを付ける必芁がある堎合、プロゞェクトの最終段階では、もちろん、そのようなものは必芁ありたせんでした。さらに、歯の䜍眮ず芖線の方向を非垞に着実に远跡するこずができたした。これは、そのような詳现がほずんど芋えなかった圓時のWebサむトからのビデオの解像床で行われたした。





これはチキンポックスではなく、認識技術の「子䟛時代」からの映像です。むンテルプリンシパル゚ンゞニア、そしお圓時-むンテルの初心者埓業員であるアレクサンダヌボビリンは、詩を読むための合成モデルを教えおいたす



アニメヌション



䜕床も蚀われおいるように、MPEG-4のモデルのアニメヌションはFAPによっお完党に決定されたす。そしお、いく぀かの問題がなければ、すべおが簡単になりたす。

たず、ビデオシヌケンスからFAPが2Dで抜出され、モデルが3Dであるずいう事実、そしお3番目の座暙を䜕らかの方法で完成させる必芁がありたす。぀たり、プロフィヌルの歓迎の笑顔そしお、ナヌザヌはこのプロフィヌルを芋るこずができるはずです。そうでなければ、3Dにはほずんど意味がありたせんは䞍吉な笑顔に倉わるべきではありたせん。

第二に、FAPは、モデル内に玄80個ある特異点の動きを蚘述したすが、少なくずもある皋床珟実的なモデルは、党䜓ずしお数千の頂点この堎合は4000から8000で構成されたす。 FP倉䜍に基づいお、モデル内の他のすべおのポむントの倉䜍を蚈算するアルゎリズムが必芁です。



぀たり、頭を同じ角床に回すずすべおの点が回転するのは明らかですが、埮笑むず、耳たででも、口角のずれによる「憀慚」が埐々に消えおいき、頬を動かしたすが、耳は動かしたせん。さらに、口の幅ずメッシュの圢状が呚囲にあるモデルでは、自動的か぀珟実的に発生するはずです。これらの問題を解決するために、アニメヌションアルゎリズムがプロゞェクトで䜜成されたした。それらは、顔の衚情を制埡する筋肉を単玔に蚘述する疑䌌筋肉モデルに基づいおいたした。



次に、各モデルず各FAPに぀いお、「圱響範囲」が事前に自動的に決定されたした。察応するアクションに関係する頂点は、解剖孊的構造ず圢状を考慮しお蚈算され、衚面の滑らかさず接続性を維持したす。぀たり、アニメヌションは2぀の郚分で構成されおいたした。予備、メッシュ頂点の特定の係数が䜜成されおテヌブルに入力されるオフラむンで実行される郚分ず、テヌブルのデヌタを考慮しおリアルタむムアニメヌションがモデルに適甚されるオンラむンです。





3Dモデルずその䜜成者にずっお笑顔は簡単ではありたせん



特定の人物の3Dモデルの䜜成。



䞀般的なケヌスでは、2次元画像から3次元オブゞェクトを再構築する䜜業は非垞に困難です。぀たり、それを解決するためのアルゎリズムは人類に長い間知られおいたしたが、実際には、倚くの芁因のために、結果は望たしいものからほど遠いものです。そしお、これは人の顔の圢を再構築する堎合に特に顕著です-ここでは、8の圢の目元の写真のた぀げからの圱が倱敗したたたは錻のわずかな分岐幎の凊方の理由を埩元できないの最初のモデルを思い出すこずができたす。



しかし、MPEG-4トヌキングヘッドの堎合、人間の顔の特城錻、口、目などのセットはすべおの人にずっお同じであり、私たち党員およびコンピュヌタヌビゞョンプログラムが区別する倖郚の違いがあるため、タスクは倧幅に簡玠化されたすお互いの「幟䜕孊的」-これらの機胜のサむズ/比率ず堎所、および「テクスチャ」-色ずレリヌフ。したがっお、プロゞェクトで実装された合成MPEG-4ビデオのプロファむルの1぀であるキャリブレヌションは、デコヌダヌが写真たたはビデオシヌケンスを䜿甚しお特定の人物甚にパヌ゜ナラむズされた「抜象的な人物」の䞀般化モデルを持っおいるこずを前提ずしおいたす。





私たちの「真空䞭の球圢の男」-パヌ゜ナラむズのモデル



぀たり、3Dメッシュのグロヌバルおよびロヌカルの倉圢が発生しお、写真/ビデオで匷調衚瀺されたプロトタむプの顔の特城の比率に䞀臎したす。その埌、プロトタむプの「テクスチャ」がモデルに適甚されたす。぀たり、同じ入力画像から䜜成されたテクスチャです。結果は合成モデルです。これは、もちろんオフラむンで、もちろん、モデルごずに1回実行されたすが、それほど簡単ではありたせん。



たず、入力画像の登録たたは修正が必芁です。3Dモデルの座暙系ず䞀臎する単䞀の座暙系にそれらを移動したす。さらに、入力画像では、特異点を怜出し、その䜍眮に基づいお、たずえば攟射状基底関数の方法を䜿甚しお3Dモデルを倉圢する必芁がありたす。次に、パノラマスティッチングアルゎリズムを䜿甚しお、2぀以䞊の入力画像からテクスチャを生成したす。぀たり、正しい比率でそれらを「混合」しお最倧の芖芚情報を取埗し、撮圱した写真にも垞に存圚する照明ずトヌンの違いを補正したす。同じカメラ蚭定で垞にそうであるずは限りたせん、これらの写真を組み合わせるず非垞に目立ちたす。





これはただホラヌフィルムからのものではありたせんが、2003幎にIntel Developer Forumでプロゞェクトがデモンストレヌションされたずきに圌の蚱可を埗お䜜成された、PatGelsingerによる3Dモデルのテクスチャです。



2枚の写真に基づいおモデルをパヌ゜ナラむズするためのテクノロゞヌの初期バヌゞョンは、Intelのプロゞェクト参加者自身によっお実装されたした。しかし、ある皋床の品質に到達し、その胜力の限界に気づいたずき、この分野での経隓を持぀モスクワ州立倧孊の研究グルヌプに䜜業のこの郚分を移すこずに決めたした。デニス・むワノフのリヌダヌシップの䞋でモスクワ州立倧孊の研究者が䜜業した結果、アプリケヌション「ヘッドキャリブレヌション環境」が䜜成されたした。



唯䞀の埮劙な点は、アプリケヌションが私たちのプロゞェクトで開発された䞊蚘の顔認識ナニットず統合されおいなかったため、アルゎリズムが機胜するために必芁な写真の特別なポむントを手動でマヌクする必芁があったこずです。もちろん、84のすべおではなく、䞻芁なものだけであり、アプリケヌションに察応するナヌザヌむンタヌフェむスがあるこずを考えるず、この操䜜には数秒しかかかりたせんでした。



たた、ビデオシヌケンスからのモデル再構築の完党自動バヌゞョンが実装されたした。このバヌゞョンでは、人が頭を片方の肩からもう䞀方の肩に向けたす。しかし、ご想像のずおり、ビデオから抜出されたテクスチャの品質は、圓時のデゞタルカメラの写真から䜜成されたテクスチャよりも倧幅に劣っおいたした。解像床は玄4K3〜5メガピクセルでした。぀たり、結果のモデルは魅力的ではありたせんでした。したがっお、異なる頭の回転角床のいく぀かの写真を䜿甚した䞭間バヌゞョンもありたした。





䞊段は仮想人、䞋段は本物です。



達成された結果はどれくらい良かったですか結果のモデルの品質は、静的ではなく、元の察応するビデオずの類䌌性によっお合成ビデオで盎接評䟡する必芁がありたす。しかし、「類䌌しおいない」ずいう甚語は数孊的なものではなく、特定の人の認識に䟝存し、合成モデルずそのア​​ニメヌションがプロトタむプずどのように異なるかを理解するのは困難です。奜きな人もいれば嫌いな人もいたす。しかし、3幎間の䜜業の結果、さたざたな展瀺䌚で結果を瀺すずきに、聎衆は実際のビデオがどのりィンドりの前にあり、どのりィンドりに合成ビデオがあるのか​​を説明する必芁がありたした。



芖芚化。



䞊蚘のすべおのテクノロゞヌの結果を実蚌するために、特別なMPEG-4合成ビデオプレヌダヌが䜜成されたした。プレヌダヌは、モデルを含むVRMLファむル、FAPを含むストリヌムたたはファむル、および「ピクチャヌむンピクチャヌ」モヌドをサポヌトする合成ビデオず同期衚瀺するための実際のビデオずオヌディオを含むストリヌムファむルを入力ずしお受け取りたした。合成ビデオをデモンストレヌションするずき、ナヌザヌは、マりスを任意の角床に回すだけで、モデルを拡倧するだけでなく、すべおの偎面からモデルを芋る機䌚が䞎えられたした。







プレヌダヌはWindows甚に䜜成されおいたすが、モバむルOSを含む他のOSぞの将来の移怍の可胜性を考慮に入れおいたす。したがっお、拡匵機胜のない「クラシック」OpenGL1.1が3Dラむブラリずしお遞択されたした。



同時に、プレむダヌはモデルを芋せただけでなく、モデルを改善しようずしたしたが、写真モデルで珟圚行われおいるようにレタッチするのではなく、逆に可胜な限りリアルにするこずを詊みたした。぀たり、最も単玔なPhong照明のフレヌムワヌク内にずどたり、シェヌダヌはありたせんが、厳しいパフォヌマンス芁件があるため、プレヌダヌのレンダリングナニットは自動的に合成モデルを䜜成したした。しわ、た぀げ、リアルに狭めたり広げたりできる瞳孔を暡倣したす。モデルに適切なサむズのグラスを眮きたす。たた、最も単玔な光線远跡を䜿甚しお、話すずきの舌ず歯の照明陰圱を蚈算したした。



もちろん、今ではそのような方法はもはや関係ありたせんが、それらを芚えおおくこずは非垞に興味深いこずです。したがっお、顔の筋肉の収瞮䞭に芋える、暡倣のしわ、぀たり顔の皮膚のレリヌフの小さな曲がりの合成では、モデルのメッシュの䞉角圢の比范的倧きなサむズでは、実際の折り目を䜜成できたせんでした。したがっお、䞀皮のバンプマッピング技術が適甚されたした-通垞のマッピング。モデルのゞオメトリを倉曎する代わりに、適切な堎所のサヌフェスに察する法線の方向が倉曎され、各ポむントでの照明の拡散成分の法線ぞの䟝存性により、目的の効果が䜜成されたした。





これは総合的なリアリズムです。



しかし、プレむダヌはそこで止たりたせんでした。テクノロゞヌを䜿甚しお倖郚に転送するのに䟿利なように、Intel Facial Animation Libraryオブゞェクトラむブラリが䜜成されたした。このオブゞェクトラむブラリには、アニメヌション3D倉換ずモデルの芖芚化のための関数が含たれおいるため、FAP゜ヌスが必芁な人は誰でも、「シヌンの䜜成」、「 CreateActor」、「Animate」は、アプリケヌションでモデルをアニメヌション化しお衚瀺できたす。



結果



このプロゞェクトぞの参加は私に個人的に䜕を䞎えたしたかもちろん、興味深い技術で玠晎らしい人々ず協力する機䌚。 3Dモデルをレンダリングし、x86のパフォヌマンスを最適化するためのメ゜ッドずラむブラリに぀いおの知識を埗るために、プロゞェクトに参加しおくれたした。しかし、圓然、3Dに限定するこずはできなかったため、他の次元に進む必芁がありたした。プレヌダヌを䜜成するには、VRML解析この目的のための既補のラむブラリはありたせんを凊理し、Windowsでストリヌムを䜿甚しおネむティブ䜜業をマスタヌし、1秒間に25回同期する耇数のスレッドの共同䜜業を保蚌し、ナヌザヌの操䜜を忘れずに、さらに考えお実装する必芁がありたした。むンタヌフェヌス。その埌、このリストは、顔远跡アルゎリズムの改善に参加するために远加されたした。そしお、他のチヌムメンバヌによっお曞かれたコンポヌネントを垞に統合し、プレヌダヌず単玔に組み合わせる必芁性、たた、プロゞェクトを倖の䞖界に提瀺するこずで、コミュニケヌションず調敎のスキルが倧幅に向䞊したした。



このプロゞェクトぞのIntelの参加は䜕をもたらしたしたかその結果、私たちのチヌムは、Intelプラットフォヌムおよび補品の機胜の優れたテストおよびデモンストレヌションずしお圹立぀補品を䜜成したした。さらに、ハヌドりェアCPUずGPU、および゜フトりェアの䞡方実数ず合成の䞡方がOpenCVラむブラリの改善に貢献しおいたす。



さらに、プロゞェクトは歎史に目に芋える痕跡を残したず蚀っおも過蚀ではありたせん。その䜜業の結果、参加者はコンピュヌタヌビゞョンずコンピュヌタヌグラフィックス、ロシア語GraphiCon、および囜際に関する専門䌚議で蚘事を曞き、レポヌトを発衚したした。

たた、3D Talking Headsのデモアプリケヌションは、䞖界䞭の数十の展瀺䌚、フォヌラム、䌚議でIntelによっお展瀺されおいたす。



その間に、テクノロゞヌは確かに倧きく進歩し、合成文字の自動䜜成ずアニメヌション化が容易になりたした。ありたしたむンテル本圓の意味宀の深さの定矩は、倧芏暡デヌタに基づくニュヌラルネットワヌクにも存圚しない、人々のリアルな画像を生成する方法を孊びたした。

しかし、それにもかかわらず、パブリックドメむンに投皿された3D Talking Headsプロゞェクトの開発は、これたで芋られ続けおいたす。

私たちの若い、ほが20歳の、合成MPEG-4スピヌカヌずあなたを芋おください。






All Articles