Samsung AI / ML / DLコヌスの教え方

こんにちは。プロセスの䞭から、いわばAIに察する私の芋方に぀いおお話したす。教育的および科孊的プロセスの意味で。



たたたた1998幎にロシア囜立蟲業アカデミヌの倧孊院に入孊し、科孊研究のトピックずしおAI / MLを遞びたした。これらは、ニュヌラルネットワヌクの次の氷河期の厳しい時代でした。ダン・レクンが、畳み蟌みネットワヌクの線成の原則に関する圌の有名な䜜品「文曞認識に適甚される募配ベヌスの孊習」を発衚したのはこの時でした。これは、私の意芋では、新しい解凍の始たりにすぎたせんでした。圓時、私が䌌たような芁玠のいく぀かに取り組んでいたのはおかしいです。なぜなら、その時が来るず、そのアむデアは空䞭にあるず蚀われおいるからです。しかし、誰もがそれを実珟するために䞎えられおいるわけではありたせん。残念ながら、私は防衛たで仕事を終えるこずはありたせんでしたが、い぀かそれを終わらせたいず思っおいたした。





出兞 Hitecher



そしお今、20幎埌、南連邊倧孊で教垫ずしお働き始め、同時に远加教育プログラム「サムスンITスクヌル」で教え始めたずき、私は2床目のチャンスがありたした。サムスンはSFedUに、独身者ずマスタヌのための人工知胜に関するトレヌニングトラック「サムスンITアカデミヌ」を最初に立ち䞊げるこずを提案したした。カリキュラム党䜓を完党に実斜できるのではないかず心配したしたが、コヌスを読むずいう申し出に熱心に応えたした。サヌクルが閉鎖されおいるこずに気づきたしたが、か぀お倱敗したこずを行うチャンスがただ2床ありたした。ここで、Samsung AI / MLコヌスは、Stepikプラットフォヌムhttps://stepik.org/org/srrで無料で利甚できる珟圚オヌプンしおいるロシア語コヌスの䞭で最高のものの1぀であるこずに泚意しお ください。。ただし、倧孊のプログラムの堎合、理論/実践コヌスに加えお、プロゞェクト郚分が远加されたした。぀たり、「Samsung IT Academy」の幎間カリキュラムは、適切なStepik蚌明曞を取埗し、個々のプロゞェクトを実斜しお、「ニュヌラルネットワヌクずコンピュヌタビゞョン」、「ニュヌラルネットワヌクずテキスト凊理」の2぀のモゞュヌルを孊習する堎合に習埗されたず芋なされたした。コヌスは、専門家が招埅された孊生のプロゞェクトの防埡で終了したした。サムスン人工知胜モスクワセンタヌの埓業員。



そしお2019幎9月から、SFedUの高等技術研究所ずピ゚ゟテクニクスでコヌスを開始したした。もちろん、かなりの数の孊生がHYIPに来お、その埌深刻な脱萜がありたした。プログラムはそれほど耇雑ではありたせんでしたが、膚倧な量の知識が必芁でした。



  • 線圢代数、

  • 確率論、

  • 埮分蚈算、

  • Pythonプログラミング蚀語。



もちろん、必芁なすべおの知識ずスキルは、倧孊の3幎生の孊郚課皋のカリキュラムを超えるものではありたせん。より耇雑な䟋をいく぀か挙げたす。



  • 双曲線正接の掻性化関数の導関数を芋぀けお、結果を次のように衚珟したす。 th(x) ..。 

  • シグモむド掻性化関数の導関数を芋぀け、その結果をシグモむドで衚珟し たす σ(x) ..。 

  • 図に瀺す蚈算のグラフでは。1は耇雑な機胜を瀺しおいたす y パラメヌタ付き b1,b2,c1,c2 ..。䟿宜䞊、操䜜の䞭間結果を次のように远加したした z1÷z9 ..。導関数が䜕に等しくなるかを決定する必芁がありたす y パラメヌタ別 b1









正盎なずころ、私は急いで䜕かを、特にニュヌラルネットワヌクを操䜜するための最新のアルゎリズムから孊生ず䞀緒に勉匷したした。圓初は、孊生自身がStepikのSamsungオンラむンコヌスのビデオ講矩を勉匷するこずを想定しおおり、教宀ではワヌクショップのみを行いたした。しかし、私も理論を読むこずにしたした。この決定は、先生ず䞀緒に理解できないトピックを敎理したり、生じたアむデアに぀いお話し合ったりするこずができるずいう事実によるものです。孊生は宿題の圢で実践的な仕事を受けたした。アプロヌチは正しいこずが刀明したした。教宀では、掻気のある雰囲気が埗られ、䞀般的に孊生が資料を習埗するこずに非垞に成功しおいるこずがわかりたした。 



1か月埌、ニュヌロンモデルから最初の単玔な完党接続アヌキテクチャに、単玔な回垰からマルチクラス分類に、単玔な募配蚈算から募配降䞋最適化アルゎリズムSGD、ADAMなどにスムヌズに移行したした。コヌスの前半は、畳み蟌みネットワヌクず最新のディヌプネットワヌクアヌキテクチャで完了したした。最初のコンピュヌタビゞョンモゞュヌルの最埌のタスクは、「に参加したクリヌン察ダヌティ」Kaggle䞊の競争 の80の粟床限界を克服しおいたす。 



もう1぀、私の意芋では、重芁な芁玠は、倧孊内で閉鎖されおいなかったこずです。トラック䞻催者は、サムスン研究所から招埅された専門家ず䞀緒にりェビナヌずマスタヌクラスを開催したした。そのような出来事は、正盎に蚀うず、孊生ず私の意欲を高めたした:)。たずえば、興味深いキャリアガむダンスむベントがありたした。SFedU、モスクワ州立倧孊、サムスンの聎衆の間のオンラむンブリッゞで、モスクワAIセンタヌサムスンの埓業員がAI / ML開発の最新トレンドに぀いお話し、孊生の質問に答えたした。



テキスト凊理に専念するコヌスの第2郚は、蚀語分析の䞀般的な理論から始たりたした。次に、孊生はベクトルずTF-IDFテキストモデルを玹介され、次に配垃セマンティクスずword2vecを玹介されたした。その結果に基づいお、いく぀かの興味深いワヌクショップが開催されたした。word2wec埋め蟌みの生成、名前ずスロヌガンの生成です。次に、テキスト分析に畳み蟌みネットワヌクず反埩ネットワヌクを䜿甚する理論ず実践に移りたした。



重芁なのはそうですが、私はVAKゞャヌナルに蚘事を掲茉し、次の蚘事の準備を始め、新しい論文の資料をスムヌズに収集したした。私の生埒たちもじっず座っおいたせんでしたが、最初のプロゞェクトに取り組み始めたした。孊生は自分でトピックを遞択し、その結果、ニュヌラルネットワヌクのさたざたな応甚分野で7぀の卒業プロゞェクトを取埗したした。



  1. « » , .

  2. « » .

  3. « » .

  4. « » .

  5. « » .

  6. « » .

  7. « » , .







すべおのプロゞェクトが守られたしたが、耇雑さず掗緎床は異なり、それはプロゞェクトの芋積もりに反映されおいたした。防衛の結果に基づいお、毎幎恒䟋のサムスンITアカデミヌコンペティションに4぀のプロゞェクトが遞ばれたした 。そしお、私は、審査員が私たちのプロゞェクトの2぀をトップの堎所に䞎えたず誇らしげに蚀うこずができたす。以䞋に、私の生埒であるGrateful Alexander、Krikunov Stanislav、Pandov Vyacheslavから提䟛された資料に基づいお、これらのプロゞェクトに぀いお簡単に説明したす。圌らが瀺した解決策は、真剣な研究䜜業ずしお評䟡されるかもしれないず私は信じおいたす。



I « » «IT Samsung».

« », ,



このプロゞェクトは、携垯電話のセンサヌを䜿甚しおトレヌニング䞭の身䜓掻動を識別および定量化するモバむルアプリケヌションを䜜成するこずでした。珟圚、人の身䜓掻動を認識できるモバむルアプリケヌションは数倚くありたす。GoogleFit、Nike Training Club、MapMyFitnessなどです。ただし、これらのアプリは特定の皮類の運動を認識できず、繰り返し回数をカりントできたせん。

プロゞェクトの著者の1人であるGratefulAlexanderは、2015幎にSamsung IT Schoolプログラムを卒業したした。私は、誇りを持っお、孊校でのモバむル開発で埗られた知識がこのように適甚されたこずを喜んでいたした。





身䜓掻動はどのように認識されたすか運動のタむミングがどのように決定されるかから始めたしょう。挔習の開始ず終了を怜出するために、孊生は、軞に沿った加速床の2乗の合蚈のルヌトずしお蚈算された加速床モゞュヌルを䜿甚するこずにしたした。珟圚の加速倀ず比范される特定のしきい倀が遞択されたした。しきい倀を超えた堎合加速床の導関数が正の堎合、挔習が開始されたず芋なされたす。珟圚の加速床がしきい倀を䞋回っおいる堎合加速床の導関数が負の堎合、挔習は終了したず芋なされたす。残念ながら、このアプロヌチではリアルタむム凊理はできたせん。可胜な改善は、シフトの各ステップで結果を蚈算するデヌタにスラむディングりィンドりを䜿甚するこずです。



デヌタセットは、䜜成者自身によっお収集されたした。 7぀の異なる挔習を実行するずき、3皮類のスマヌトフォンが䜿甚されたしたAndroidバヌゞョン4.4、9.0、10.0。スマヌトフォンは専甚ポケットを䜿っお手に取り付けたした。 3人のボランティアが合蚈1800回の繰り返しを行いたした。実行䞭に䜕らかの理由で技術の゚ラヌが発生する可胜性があるため、サンプルのクリヌニング手順を実行したした。このために、盞互盞関の分垃がすべおのタむプの挔習に察しお䜜成されたした。次に、各挔習に぀いお、盞関しきい倀が遞択されたした。このしきい倀を䞋回るず、挔習は䞍適切ず芋なされ、サンプルから陀倖されたす。   



同じ゚クササむズは、繰り返しに応じお、実行時間が異なりたす。これに察抗するために、センサヌからのサンプル数に関係なく、固定数のサンプルでデヌタを補間するこずが決定されたした。受信50-サンプリングレヌトの2倍、隣接する䜍眮の算術平均ずしお䞭間䜍眮を蚈算したす。 200を受け取りたした-2カりントごずに砎棄したす。この堎合、サンプル数は䞀定になりたす。同様に、サンプルの入力数ず目的の出力数の任意の比率に぀いお。



ニュヌラルネットワヌクに぀いおは、呚波数領域でデヌタを適甚するこずが決定されたした。人の䜓重は非垞に倧きいので、ほずんどの暙準的な運動では、特城的な信号呚波数がスペクトルの䜎呚波数領域にあるず予想できたす。この堎合、高呚波数は、実行䞭のゞッタ、たたはセンサヌからのノむズのいずれかず芋なすこずができたす。どういう意味ですかこれは、FFTを䜿甚しお信号のスペクトルを芋぀け、分析にデヌタの10〜20しか䜿甚できないこずを意味したす。なぜそんなに少ないのですか 1スペクトルは察称であるため、コンポヌネントの半分をすぐに切り取るこずができたす。2基本情報-スペクトルの有益な郚分の20〜40のみ。これらの仮定は、特にスロヌストレングスの゚クササむズをよく衚しおいたす。





さたざたな挔習の正芏化された時系列





さたざたな挔習の正芏化されたスペクトル



ニュヌラルネットワヌクで凊理する前に、すべおの挔習サンプルを0〜1の振幅範囲に合わせるために、デヌタスペクトルは3぀の軞間の最倧倀に正芏化されたす。この堎合、軞間の比率は保持されたす。



ニュヌラルネットワヌクは、挔習を分類するタスクを実行したす。これは、トレヌニングされたリストからすべおの挔習の確率のベクトルを生成するこずを意味したす。このベクトルの最倧芁玠のむンデックスは、実行された挔習の数です。さらに、実行された挔習の信頌床が85未満の堎合、どの挔習も実行されなかったず芋なされたす。ネットワヌクは3぀のレむダヌで構成されおいたす。4぀は畳み蟌み、3぀は完党に接続されおおり、出力ニュヌロンの数は、認識したい挔習の数ず同じです。アヌキテクチャでは、蚈算リ゜ヌスを節玄するために、コアサむズが3x3の畳み蟌みのみが䜿甚されたす。比范的単玔なネットワヌクアヌキテクチャは、スマヌトフォンの限られたコンピュヌティングリ゜ヌスによっお正圓化されたす。私たちのタスクでは、最小限の遅延での認識が必芁です。 





ニュヌラルネットワヌクアヌキテクチャの説明



ニュヌラルネットワヌクトレヌニング戊略は、トレヌニングサンプルの損倱関数が最小倀に達するたで、トレヌニングデヌタぞのバッチ正芏化を䜿甚した゚ポックによるトレヌニングです。



結果倚かれ少なかれ高品質の運動パフォヌマンスで、ネットワヌクの信頌性は95-99です。怜蚌セットでは、粟床は99.8でした。





怜蚌セットでのトレヌニング䞭の





゚ラヌニュヌラル



ネットワヌクの゚ラヌマトリックスニュヌラルネットワヌクがモバむルアプリケヌションに組み蟌たれ、トレヌニングず同様の結果を瀺したした。



この研究では、分類の問題を解決するために今日䜿甚されおいる他の機械孊習モデルロゞスティック回垰、ランダムフォレスト、XGブヌストもテストしたした。これらのアヌキテクチャでは、Tikhonov正芏化L2、盞互怜蚌、およびグリッド怜玢を䜿甚しお、最適なパラメヌタを芋぀けたした。その結果、粟床指暙は次のようになりたした。



  • ロゞスティック回垰99.4

  • ランダムフォレスト99.1

  • XGブヌスト97.5



サムスンITアカデミヌでのトレヌニング䞭に埗られた知識は、プロゞェクトの䜜成者が関心の範囲を広げるのに圹立ち、スコルコボ科孊技術研究所の修士プログラムに参加する際に貎重な貢献をしたした。珟圚、私の生埒たちは通信システムの機械孊習の分野で研究を行っおいたす。 



GitHubのコヌド



II « » «IT Samsung».

« »,







モデルの仕事はこのスラむドでよく説明されおいたす







それはすべお写真から始たりたす。提瀺された実装では、Telegramボットからのものです。これを䜿甚しお、Dlibfrontal_face_detectorは画像内のすべおの顔を怜玢したす。次に、Dlib shape_predictor_68_face_landmarksを䜿甚しお、各面の68の䞻芁な2Dポむントが怜出されたす。各セットは次のように正芏化されたす䞭倮揃えXずYの平均を差し匕くおよびスケヌリングXずYの絶察最倧倀で陀算。正芏化された点の各座暙は、間隔[-1、+ 1]に属したす。



次に、正芏化された座暙X、Yを䜿甚しお、顔の各キヌポむントZ座暙の深さを予枬するニュヌラルネットワヌクが機胜したす。このモデルは、AFLW2000デヌタセットでトレヌニングされたした。



さらに、これらの点は互いに接続され、メッシュマスクを圢成したす。フェむスバむオメトリクスずも呌ばれたす。このようなマスクのセグメントの長さは、感情を定矩する方法の1぀ずしお䜿甚されたす。アむデアは、各ラむンセグメントがラむンセグメントベクトル内で独自の堎所を持ち、感情に応じおそれらのいく぀かを持っおいるずいうこずです。そしお、理論的には、各感情には限られた数のそのようなベクトルがありたす。この仮説は、実隓の過皋で確認されたした。このようなモデルをトレヌニングするために、次のデヌタセットが䜿甚されたしたCohn-Kanade +、JAFFE、RAF-DB。



䞊行しお、別のネットワヌクが画像自䜓によっお感情を分類するこずを孊んでいたす。顔の画像は、Dlibで芋぀かった長方圢から切り取られたす。シングルチャンネルの癜黒に倉換され、48x48に圧瞮されたす。このモデルをトレヌニングするために、バむオメトリクスモデルず同じデヌタセットが䜿甚されたした。ただし、FER2013デヌタセットが远加で䜿甚されたした。



結論ずしお、3番目のニュヌラルネットワヌクが皌働したす。そのアヌキテクチャは、以前の2぀の凍結および事前トレヌニング枈みネットワヌクずトレヌニング枈みレむダヌを組み合わせたものです。これらのネットワヌクは、最埌に完党に接続されたレむダヌもオヌバヌラむドしたす。タヌゲットクラスを決定できる予想される「確率のベクトル」の代わりに、より倚くの「䜎レベルの機胜」が返されるようになりたした。そしお、統合局は、この情報をタヌゲットクラスに解釈するようにトレヌニングされおいたす。



「類䌌の゜リュヌション」には、EmoPy、DLP-CNNRAF-DB、FER2013、EmotioNetがありたす。ただし、次のように比范するこずは困難です。圌らは異なるデヌタで蚓緎されたした。 



GitHubのコヌド



結論



結論ずしお、パむロットコヌスはその䟡倀を瀺しおおり、この2020/21孊幎床には、ロシアずカザフスタンのサムスンITアカデミヌのパヌトナヌである23の倧孊でプログラムがすでに教えられおいたす。完党なリストはここで芋るこずができ たす..。今幎、マスタヌず孊士のグルヌプがすでに私たちず䞀緒に勉匷しおいたすグルヌプには1人の博士号がありたすそしおこれたでのずころ、倧郚分で、科孊の花厗岩はうたくかじっおいたす。個々のプロゞェクトのアむデアはただ芋぀かっおいたせんが、孊生は楜芳的です。もちろん、次回の個別プロゞェクトでは10倍になりたすが、今埌も生埒の掻躍が高く評䟡されおいきたいず思いたす。そしお最も重芁なこずは、埗られた知識ず経隓が、ITの分野での卒業生のさらなる発展に倧いに圹立぀ず確信しおいたす。



2020ロストフオンドン。 SFedU、ITアカデミヌサムスン。





ドミトリヌ・ダツェンコ

南連邊倧孊ハむテクノロゞヌ孊郚情報枬定技術孊科の䞊玚講垫、

サムスンITスクヌルの

講垫、サムスンアカデミヌのAIITトラックの講垫。 



All Articles