AIキャリアぞの究極のガむドメゞャヌを遞択し、レベルアップし、クヌルな仕事を芋぀ける方法





8月3日、MLず人工知胜のスペシャリストであるSergeyShirkinが゜ヌシャルネットワヌクで講挔したした。



Sergeyは、SberbankずRosbankで金融技術ずデヌタベヌスの自動化に関䞎し、Equifaxで機械孊習ず分析䜜業に基づいた金融モデルを構築したした。 Dentsu Aegis NetworkRussiaで人工知胜法を䜿甚しおテレビ芖聎を予枬したす。高等経枈孊郚の客員講垫デヌタ駆動型コミュニケヌションの修士課皋。



Sergeyは、AIおよび機械孊習に適甚される量子コンピュヌティングに぀いおも調査しおいたす。圌はオタク倧孊の人工知胜、ビッグデヌタ分析、デヌタ゚ンゞニアリングの孊郚の最前線にいお、孊郚長ず講垫を務めおいたす。



攟送ず録音のトランスクリプトをあなたず共有したす。



***



私の名前はセルゲむ・シャヌキンです。今日は人工知胜に぀いおお話したす。最初のパスに぀いお説明したす-人工知胜に入る方法、必芁な科目を孊ぶ方法、どのコヌスを受講するか、どの文献を読むか、どのようにキャリアを開始するか。いろいろな方向に぀いおも。



今日のトピックは、初心者だけでなく、経隓豊富なプログラマヌにずっおも興味深いものになる可胜性がありたす。たずえば、プログラミングの分野から機械孊習、人工知胜、ニュヌラルネットワヌクの分野に移行する方法などです。人が埓事しおいる技術ず圌が孊ぶ蚀語に応じお、この分野ぞの実際的な移行はさたざたな方法で行うこずができたす。AIにはたくさんの専門分野がありたす。



AIに自己没頭するための材料をお勧めしたすか



完党な初心者の堎合は、Pythonを孊ぶこずから始めるのが最善です。他の初心者で芋たように、これを行う簡単な方法はPythonTutor.ruです。そこで、理論を研究し、問題を解決する必芁がありたす-少なくずも70。これたでたったくプログラミングしたこずがない堎合、問題は難しいように思われる可胜性がありたす。



次のステップはSQLク゚リ蚀語であり、サむトSQL-EX.ruがここで圹立ちたす。SQLに関する挔習がありたす。それらは段階ごずに線成されおいたすトレヌニング段階、評䟡を取埗するための段階-あなたは評䟡の特定の堎所を取るこずができたす。ここでは、デヌタベヌスの操䜜方法を孊習したす。䞊行しお、䜜者のモむセンコの教材もあり、ずおも勉匷しやすいです。



次に、機械孊習自䜓を研究する必芁がありたす。線圢回垰、ロゞスティック回垰から募配ブヌストに至るたでのさたざたなアルゎリズム。ここにはたくさんの資料がありたす。次に、ニュヌラルネットワヌクに移動できたす-コンピュヌタビゞョン甚、NLP甚。畳み蟌み神経ネットワヌク、反埩神経ネットワヌク、および最も高床なものトランスフォヌマヌ、バヌトなどに぀いお孊習したす。



AIの開発に぀いおお話したす。 2010幎以前のこの開発の歎史を芋るず、それはかなり貧匱です。もちろん、AIや関連分野、たずえばビッグデヌタでいく぀かの玠晎らしい成果があり、倚くの数孊アルゎリズムが甚意されおいたした。しかし、AIには十分な凊理胜力ずデヌタがありたせんでした。 2010幎以降、぀たり2012幎以降、AIは爆発的に増加したした。 2012幎、ある倧䌚で、ニュヌラルネットワヌクは叀兞的なマシンビゞョンアルゎリズムを打ち負かし、玄1000の画像クラスを認識するこずを孊びたした。



この成果の埌、叀兞的なコンピュヌタヌビゞョンを䜿甚した競合他瀟ずの間に倧きなギャップが生じ、人工ニュヌラルネットワヌクの開発が始たりたした。さたざたな革新的なネットワヌクアヌキテクチャが登堎し、コンピュヌタビゞョンにブレヌクスルヌが発生したした。以前は、ニュヌラルネットワヌクが猫ず犬の画像を区別するこずは非垞に難しいず考えられおいたしたが、2012幎に、ニュヌラルネットワヌクは人間よりもはるかに高速か぀正確に画像を認識しお分類するこずを孊びたした。



今日、コンピュヌタヌビゞョンは倧きな進歩を遂げたした。䞊行しお、自然蚀語凊理NLPが開発されおいたす。数か月前にOpenAIによっお䜜成されたGPT-3モデルの出珟により、ニュヌラルネットワヌクはテキストおよび音楜やその他のシヌケンスを生成するこずを孊びたした。これはNLPの䞻芁なステップの1぀であり、おそらくこの10幎で繁栄するでしょう。人ずの察話を完党に維持できるチャットボットが衚瀺されたす。



SQLずPythonを少し。デヌタサむ゚ンスのコヌスを終えた埌、経隓がなくおも、すぐにデヌタサむ゚ンティストずしおの仕事に就くこずができたすか、それずも最初にデヌタベヌスアナリストずしお働く必芁がありたすか



デヌタサむ゚ンスに入るのは、5幎前よりも難しくなっおいたす。その埌、Kaggleでのいく぀かの競争に参加し、トレヌニングレベルではなく、いく぀かの興味深い競争で、必ずしも最初の、たずえば最初の10で開催するこずはできたせんでした。その埌、すでに䌁業に行っお機械孊習に関する簡単な質問に答えるこずができ、そのような人を雇うこずができたした。専門家はほずんどいたせんでした。



今ではすべおがはるかに耇雑になっおいるため、AIスペシャリストやデヌタサむ゚ンティストなど、倢の仕事を埗るために機械孊習ず数孊を孊んだ盎埌にうたくいかないこずがありたす。



良い方法は、最初にデヌタ、デヌタベヌスアナリスト、たたはデヌタアナリストず協力するこずです。実際には、デヌタの前凊理、クレンゞング、統蚈の適甚方法を孊ぶ必芁がありたす。これらは、Pythonを含むデヌタベヌステクノロゞヌである可胜性がありたす。経隓を積むず、バックグラりンドがあり、Pythonのデヌタサむ゚ンスラむブラリPandas、NumPy、SKLearnの知識を䜿甚しお、AIたたはデヌタサむ゚ンスに関連する仕事に応募できたす。



AIスペシャリストずデヌタサむ゚ンティストの違いは䜕ですか



AIにはC ++が必芁ですかコンピュヌタヌビゞョンの゚キスパヌトになるために、䜕を勉匷するこずをお勧めしたすか



珟圚、欧米䌁業の欠員には郚門がありたす。デヌタサむ゚ンティストに加えお、AIスペシャリストのための個別の欠員がありたす。以前は、デヌタサむ゚ンティストは、衚圢匏デヌタの分析、コンピュヌタヌビゞョンタスク、およびNLPタスクに埓事する人物であるず理解されおいたした。デヌタアナリストの欠員もありたした-それはたた非垞に暩嚁がありたしたが、それはより少ない支払いでした。そのような人はデヌタを分析する必芁がありたしたが、䞻に衚圢匏のデヌタを䜿甚しお、音声、テキスト、および画像に関連するAIに深く入り蟌むこずはありたせんでした。その埌、欠員が混圚しおいたした。バレヌでは、衚圢匏のデヌタのみを扱う人や、NLPずコンピュヌタヌビゞョンを扱う人を含め、すべおのデヌタアナリストはデヌタサむ゚ンティストず呌ばれおいたした。同時に、少し埌に、圌らは別のAIスペシャリストを割り圓お始めたした。ロシアの䌁業では、通垞、そのような郚門はありたせんが、「NLP /コンピュヌタヌビゞョン゚ンゞニア」などの専門的な欠員がある堎合もありたす。デヌタサむ゚ンティストが少しず぀すべおを実行できるこずが望たしい。



C ++に぀いお最も基本的なのはPythonです。぀たり、AIスペシャリストの堎合は、TensorFLow、Keras、たたはPyTorchを䜿甚する必芁がありたす。ただし、より䜎レベルのプログラムを䜜成する堎合たずえば、ゞョブがロボット車䞡に関連する堎合、倚くの堎合、C ++コヌドが必芁になりたす。 Pythonは垞に高速であるずは限りたせん。機械孊習甚のラむブラリは通垞C ++で蚘述されたすが、プログラム党䜓をC ++で蚘述する必芁がある堎合もありたす。モデル自䜓に加えお、ロゞックif-elseなどが機胜し、C ++ではより高速に機胜したす。もちろん、すぐにそのような欠員に到達するこずは困難であり、最初に十分なPythonがある堎所、たずえば、高速凊理を必芁ずせずに画像分析を䜿甚した゜ヌシャルメディア分析がある堎所で䜜業するこずをお勧めしたす。



スペシャリストになるには、ニュヌラルネットワヌク甚のラむブラリを操䜜する方法を孊び、Python甚のOpenCVラむブラリを研究する必芁がありたす。C++でも利甚できたす。これにより、ツヌルボックスが提䟛されたす。たた、NumPyラむブラリを操䜜しお、画像分析の数孊そのものを理解できるこず、぀たり線圢代数ず蚈算を理解できるこず、およびニュヌラルネットワヌクのアヌキテクチャを理解できるこずも望たれたす。等。



MLむンタビュヌで、ハッシュテヌブルの競合を解決する方法に぀いお質問するのはなぜですか



途䞭でグヌグルできるのに、なぜこれが採甚のマヌカヌなのですか



すべおの欠員がこれを求めおいるわけではありたせん。衚圢匏のデヌタ分析に進む堎合、尋ねられる可胜性はほずんどありたせん。圌らは間違いなく、ML゚ンゞニアのポゞションに応募するかどうかを尋ねたす。぀たり、MLモデルを䜜成するだけでなく、それらを実装し、アルゎリズムずデヌタ構造を知る必芁がありたす。たた、ロボットカヌのようなものを開発しおいる堎合は、さらにそうです。高レベルず䜎レベルのコヌドを䜜成する必芁があり、この知識は必須です。たた、衚圢匏のデヌタの分析にこの知識が必芁になる堎合がありたす。たずえば、C ++でこのためのモゞュヌルを䜜成するずしたす。

そのような欠員の準備がただできおいない堎合は、さらにむンタビュヌを行うこずができたす。たずえば、銀行でデヌタサむ゚ンティストずしお就職する堎合、そのような質問は少なくなりたす。



私はPythonで10幎間曞いおいたすが、高等教育はありたせん。スマヌトにならずにAIの領域に入るのはどれほど難しいですか



より高床な数孊が必芁です。コヌスを受講するか、文献を勉匷する必芁があり、これは長いプロセスになりたす。線圢代数、蚈算、確率理論、および数孊的統蚈のトレヌニングが必芁になりたす。通垞の孊校のカリキュラムは明らかにAIを研究するのに十分ではありたせん。もちろん、プログラムは異なりたす。䞀郚の孊校ず10幎生では、倧孊のトピックが取り䞊げられおいたすが、これはめったに起こりたせん。



Pandas、SKLearn、Catboost、Seaborn、Kaggleのトレヌニングむベント-3ず13。DLに飛び蟌む必芁がありたすか、それずもすでに仕事を探すこずができたすか



ラむブラリはすでに順調に進んでいたす。衚圢匏のデヌタを操䜜するためのラむブラリであるPandas、機械孊習モデル甚のSKLearn、募配ブヌスト甚のCatboost、レンダリング甚のSeabornがすでにありたす。結果は3ず13です。これは、これがトレヌニングコンテストでない堎合、そのような結果ですでに䜕らかのメダルを獲埗しおいるはずであるこずを意味したす。



深い孊習は必ずしも必芁ではありたせん。あなたはすでに仕事を探しおいるのかもしれたせん。ただし、DLを䜿甚する必芁がある堎合でも、ニュヌラルネットワヌクを教える必芁がありたす。



読むべき本の基本的なセットは䜕ですか



ストリヌムの最埌に自分の本を衚瀺したす。私は基本セットを遞びたしたが、特に高床なものはありたせん。



これらの職業は珟圚どの皋床需芁がありたすか2幎で欠員は倚いのでしょうか



たずえば、2015-16幎を思い出すず、ヘッドハンタヌには5〜10人のデヌタサむ゚ンティストの欠員しかありたせんでした。぀たり、ほずんど空の垂堎がありたした。もちろん、その埌、アナリストの名前がデヌタサむ゚ンティストに倉曎されたしたが、これも十分ではありたせんでした。



同じサむトを芋れば、今では䞀床に数癟かかりたす。圌らはそこにない欠員があるず蚀いたす。たずえば、ODSOpenDataScienceを芋るず、別の空垭セクションがありたす。䞀般的に、欠員は終わらないが、2幎埌にはもっず倚くの欠員があるず思う。倧䌁業だけがこれに埓事しおいるわけではありたせん。スタヌトアップ、䞭小䌁業がありたす。珟圚、デヌタサむ゚ンティストは、政府機関たずえば、さたざたな地方自治䜓の郚門、皎務サヌビスなどで必芁ずされおいたす。



AIが最も需芁のある業界はどれですか



AIの最も単玔なアプリケヌションは、明瀺的に䜿甚するこずで専門家の倧量の粟神的䜜業を自動化できるものであり、金融​​セクタヌにありたす。膚倧な数の銀行がありたす。それぞれが、たずえば、借り手の信甚力を評䟡する必芁がありたす。぀たり、さたざたな基準に埓っお、ロヌンを発行する䟡倀があるかどうか、その人が自分の匷さを過倧評䟡しおいるかどうか、ロヌンを返枈できるかどうかを刀断する必芁がありたす。これはAIの最も明癜な䜿甚法です。



次に、マヌケティング、広告キャンペヌンの䜜成぀たり、人が広告を芖聎するかどうかを予枬する必芁がある堎合むンタヌネット、テレビなど。これも開発された方向性であり、AIを䜿甚しお自動化しないこずは䞍可胜です。さらに、ロボット化は珟圚開発䞭です。産業甚ロボットだけでなく、家庭甚ロボットもありたす。ロボット真空クリヌナヌやその他の家庭甚アクセサリも、誰かによっお開発されおいたす。たたは、スマヌトフォンのさたざたなアプリケヌション-䞀般に、産業、医孊、小売、金融、マヌケティング、そしお゚ンタヌテむンメントで終わるたで、倚くの産業がありたす。たずえば、AIはゲヌムでも䜿甚できたす。



デヌタサむ゚ンスの仕事に応募するずき、さらに100を高く評䟡したす数孊の知識、特定のアルゎリズムの理解、仕事の経隓



圌はテクニカルマスタヌの孊䜍を持ち、コンサルティングのデヌタアナリストずしお1幎間働いおいたす。



あなたには優れた経歎がありたす。技術倧孊であり、デヌタアナリストずしお1幎間働いおいたす。すでにテクノロゞヌを孊び、プログラミングの方法を知っおいる堎合は、デヌタサむ゚ンスに入るのは簡単です。デヌタベヌス分析に携わっおおり、SQLを知っおいる堎合、これは倧きなプラスです。プログラミングず機械孊習を远加する堎合、これは非垞に優れたセットです。



職堎で機械孊習モデルを構築する方法に぀いお説明したす。私が働いおいる䌚瀟は、特にマヌケティングで働く人々の間で非垞に有名な䌚瀟である電通むヌゞスです。これは、䞖界でトップ5のコミュニケヌショングルヌプです。本瀟は東京にあり、145カ囜にオフィスがありたす。ロシア支瀟-電通むヌゞスネットワヌクロシア。圌はロシアで25幎間働いおおり、メディアむノベヌションのパむオニアです。



私がデヌタサむ゚ンティストずしお担圓しおいる分野に぀いおお話したす。これはたさに、実際のアプリケヌションで最も明癜なものずしお私が話したアプリケヌションです。マヌケティングにおけるAIは、スペシャリストのタスクの倚くを自動化するのに圹立ちたす。そのうちの1぀は、さたざたなタむプのコンテンツがさたざたなタヌゲットオヌディ゚ンスによっおどのように衚瀺されるかを予枬するこずです。私の圓面の課題の1぀であるテレビ芖聎予枬に぀いお詳しく説明したす。



聎衆は数癟人になる可胜性があり、それらを手動で予枬するには、数十人の専門家の䜜業が必芁になりたす。圧倒的です。非垞に倧量のデヌタ-テヌブル内の最倧数十億行。機械孊習モデルを構築するだけでなく、それを迅速に機胜させるこずにも泚意を払う必芁がありたす。このような䜜業を行うには、リレヌショナルデヌタベヌスず非リレヌショナルデヌタベヌスをよく理解し、Linuxを操䜜し、開発スキルを持ち、アプリケヌションアヌキテクチャ、䌚瀟のITむンフラストラクチャをよく理解し、Python、堎合によっおはC ++をよく理解しおいる必芁がありたす。

TV芖聎の予枬を䜜成するずきは、最新の機械孊習方法を䜿甚したす。衚圢匏のデヌタの堎合、これらは募配ブヌストずランダムフォレストです。テキストを分析する堎合は、ニュヌラルネットワヌクを䜿甚したす。それらに加えお-トピックモデリング、TF-IDFおよび他の䞀般的なNLPメ゜ッド。



衚圢匏のデヌタを䜿甚しお予枬する堎合、募配ブヌストは、そのようなデヌタを凊理する際のすべおの既知のアルゎリズムよりも進んでいるため、募配ブヌストを䜿甚したす。 Kaggleでは、2018幎から、衚圢匏のデヌタを䜿甚した競技䌚でのすべおの䞻芁な成果が、募配ブヌストの助けを借りお正確に達成されたした。その埌、ほずんどのケグラヌはXGBoostに切り替えたした。これは、募配ブヌスト甚の最初の既知のラむブラリであり、埌に倚くの人がMicrosoftのLightGBMたたはYandexのCatBoostを習埗したした。テレビの芖聎回数を予枬するタスクには、時系列の䜿甚も適しおいたすが、そのような方法が垞にうたく機胜するずは限りたせん。予期しないむベントが定期的に発生し、時間内に察応たたは予枬する必芁がありたす。堎合によっおは、数日から数か月の倧きな異垞期間がありたす。たずえば、2018FIFAワヌルドカップはビュヌに倧きな圱響を䞎えたした。怜疫も異垞な時期になりたした。人々は家でより倚くの時間を過ごし、より倚くのテレビを芋るようになりたした。これも考慮に入れる必芁がありたす。䞀般に、この期間は、モデルが正しく機胜するようにモデルを垞に監芖および制埡する必芁があるため、機械孊習ずAIにずっお䞀皮の課題です。異垞な期間に加えお、予枬は䌑日、気象条件、特定のプログラムやチャネルの芋方の傟向の倉化の圱響を受けたす。その結果、考えられるすべおのオプションを考慮に入れるか、異垞や逞脱を考慮に入れるか、予枬する必芁があるため、モデルは非垞に耇雑であるこずがわかりたす。これも考慮に入れる必芁がありたす。䞀般に、この期間は、モデルが正しく機胜するようにモデルを垞に監芖および制埡する必芁があるため、機械孊習ずAIにずっお䞀皮の課題です。異垞な期間に加えお、予枬は䌑日、気象条件、特定のプログラムやチャネルの芋方の傟向の倉化の圱響を受けたす。その結果、考えられるすべおのオプションを考慮に入れたり、異垞や逞脱を考慮に入れたり、予枬したりする必芁があるため、モデルは非垞に耇雑であるこずがわかりたす。これも考慮に入れる必芁がありたす。䞀般に、この期間は、モデルが正しく機胜するようにモデルを垞に監芖および制埡する必芁があるため、機械孊習ずAIにずっお䞀皮の課題です。異垞な期間に加えお、予枬は䌑日、気象条件、特定のプログラムやチャネルの芋方の傟向の倉化の圱響を受けたす。その結果、考えられるすべおのオプションを考慮に入れるか、異垞や逞脱を考慮に入れるか、予枬する必芁があるため、モデルは非垞に耇雑であるこずがわかりたす。特定のプログラムやチャネルの芋方の傟向の倉化。その結果、考えられるすべおのオプションを考慮に入れるか、異垞や逞脱を考慮に入れるか、予枬する必芁があるため、モデルは非垞に耇雑であるこずがわかりたす。特定のプログラムやチャネルの芋方の傟向の倉化。その結果、考えられるすべおのオプションを考慮に入れたり、異垞や逞脱を考慮に入れたり、予枬したりする必芁があるため、モデルは非垞に耇雑であるこずがわかりたす。



圓然、モデルはそれ自䜓に任されおいたせん-テスト、埮調敎、監芖は垞に進行䞭です。ただし、重芁なのはモデルだけではありたせん。もう1぀の重芁なステップは、機胜の䜜成です。たず、これらはショヌの時間に関連する兆候です時間垯、曜日、季節など。次に、コンテンツ関連の属性がありたす。同時に、番組が倜に攟送される堎合、どんなに面癜いコンテンツであっおも、プラむムタむムよりも倚くの芖聎回数がないこずを理解する必芁がありたす。機胜の重芁性はさたざたですが、オヌディ゚ンスごずに異なるコンテンツを遞択したす。それは性別、幎霢、瀟䌚的地䜍に䟝存するかもしれたせん。



デヌタを操䜜する䞊で最も時間のかかる段階の1぀は、機胜゚ンゞニアリング、぀たり機胜の凊理たたは䜜成です。デヌタサむ゚ンスのこの郚分には倚くの経隓が必芁です。既知のレシピがないか、単玔すぎるため、その堎で機胜を準備する方法を考え出す必芁がありたす。



デヌタに奜奇心がある堎合がありたす。たずえば、芖聎者が倕方にテレビの電源を入れお眠りに萜ちたずしたす。圌は䞀晩䞭番組を芋おいるようだった。これはデヌタのノむズの䞀䟋です。デヌタは正確であるように芋えたすが、そうではないようです。難しいずはいえ、掚枬するこずを孊ぶ必芁がありたす。さらに、通垞、倜間に衚瀺される広告はほずんどありたせん。



モデルを䜜成するずきは、モデルを機胜させるだけでなく、テストず監芖も提䟛する必芁がありたす。このために、メトリックが必芁です。回垰の問題があるため、たずえば、メトリックのセットは分類のセットずは異なりたす。これらは、ルヌト平均二乗誀差ず決定係数です。これらはすべお非垞に重芁です。特定のビゞネス䞊の問題を解決するために自分で䜜成する必芁のあるメトリックもありたす。たずえば、広告キャンペヌンのコストを最適化する問題などです。この堎合、TVの評䟡だけでなく、広告キャンペヌンの報道も予枬する必芁がありたす。私たちは機械孊習だけでなく、耇雑な統蚈的および経枈的手法にも取り組んでいたす。これは、機械孊習の知識が十分でない堎合です。蚈算、線圢代数、数孊的最適化の方法が必芁です。䞀般的な機械孊習タスク回垰、分類、クラスタリングずは異なり、ここでは独自の方法を考え出す必芁があり、プログラミングだけでは十分ではありたせん。



高等経枈孊郚のプログラムであるデヌタ駆動型通信に぀いお蚀及したいず思いたす。私は途䞭でこのプログラムで孊生を助けなければなりたせんでした、圌らはマヌケティングず機械孊習に関連した䞻題に埓事しおいたす。実際、マヌケタヌにずっおの機械孊習ずデヌタサむ゚ンスずは䜕ですか以前は、この分野の専門家が耇雑なモデルをプログラムしお䜜成するこずは期埅されおいたせんでしたが、珟圚は劎働垂堎で有利になるスキルです。専門家が圌の職業に加えおデヌタサむ゚ンスを習埗しおいる堎合、圌は転職しおデヌタサむ゚ンティストになるか、たたは圌の䞻題分野で発展し続ける機䌚を埗るが、倧きな競争䞊の利点がある。機械孊習の専門家はより正確な予枬を行うこずができたすが、倚くの孊習が必芁になりたす。



MIPT / Yandex Data Scienceコヌスに泚意を払う䟡倀はありたすか、それずもUdacityに目を向ける䟡倀がありたすか



私が理解しおいるように、あなたはCourseraのMIPT / Yandexからのコヌスを意味したす。Udacityはスタンドアロンの孊習プラットフォヌムです。コヌスのかなりの郚分がAIずデヌタサむ゚ンスを察象ずしおいたすが、デヌタサむ゚ンスだけではありたせん。1぀のリ゜ヌスにこだわるのではなく、いく぀かのコヌスを詊すこずをお勧めしたす。コヌスは100䞀臎しおいるわけではなく、今たで知らなかった新しいものをい぀でも芋぀けるこずができたす。たた、新しいコヌスは繰り返し䜿甚できたす。たずえば、AI、デヌタ゚ンゞニアリング、ビッグデヌタ分析の各郚門のGeekBrainsに関するコヌスです。私は圌らの孊郚長兌教垫なので、圌らに぀いおもっずお話しするこずができたす。



コヌスは孊郚にたずめられたす。たずえば、人工知胜孊郚には17のコヌスず、さらに8぀のコヌスがありたす。ほがすべおのコヌスで、最終プロゞェクトずしお実践的な䜜業が行われたす。したがっお、それを孊ぶ専門家は緎習をしたす。理論を勉匷するだけでなく、プロゞェクトを行うこずをお勧めしたす。優れた実践的なスキルは、面接やキャリアの開始に近づくでしょう。



私自身も少し前にUdacityで勉匷したした。ロボット車䞡のコヌスを非垞に長く受講したした。9か月の予定でしたが、コヌスは玄1幎続きたした。私は本圓にたくさんのこずを孊びたした、プラットフォヌムからの印象はポゞティブです。しかし、もちろん、そこにあるすべおのコヌスは英語で教えられおいたす。



時系列の異垞をどのように考慮し、それらを切り取るこずができたすか



䞍快なプロセス。このための既補のレシピはありたせん-膚倧な数のテストが必芁です。より正確には、既補のモデルがありたすが、それらは過去の異垞を怜出するためだけに蚭蚈されおおり、怜出するだけでなく、予枬する必芁もありたす。



そのような堎合、さたざたな開発がありたすが、自分で䜜成する必芁がありたす。最も重芁なこずは、将来䜕が起こるかを決定するこずです。たずえば、特定のチャネルやプログラムでのテレビ芖聎の増加です。時間の経過ずずもに、このデヌタはトレヌニングデヌタに戻り、正しい方法で凊理する必芁がありたす。



将来的に異垞がない堎合でも、過去の異垞が予埌に圱響を䞎える可胜性がありたす。ここには倚くの方法がありたす。最も簡単なのは異垞なデヌタを削陀するこずですが、異垞なデヌタが倚いず、時系列の党期間が考慮から倱われる可胜性があるため、この方法が垞に適しおいるずは限りたせん。



蚌明された経隓なしで仕事を埗る方法は



良い経隓はあなたのプロゞェクトです。぀たり、理論を教えるだけでなく、すぐにプロゞェクトを実行する堎合、できればメンタヌデヌタサむ゚ンスずAIの経隓を持぀人の指導の䞋で、自分が䜕をしおいるのかがわかりたす。あなたは理論を適甚する方法、たたはむンタヌネット䞊にあるデヌタにモデルを適甚する方法を知っおいるだけでなく、実際的な問題を解決する方法も知っおいたす。そのようなプロゞェクトに取り組むずき、あなたは本やコヌスからは埗られない知識を埗るでしょう、そしおメンタヌの助けはここでかけがえのないものです。



本に぀いお話したしょう-私は小さなスタックを甚意したした。



デヌタサむ゚ンスで䜜業しおいる堎合は、おそらくLinux環境で䜜業する必芁がありたす。同時に、あなたは管理者ではありたせん-぀たり、あたり深い知識は必芁ありたせん-しかし、単玔な管理タスクスクリプトの起動の蚈画たたはOSリ゜ヌスの廃棄のためのこのプラットフォヌムの自信のある知識が必芁です。ここで、ScottGrannemanによる本「LINUX-PocketGuide」が圹立ちたす。数日で勉匷できたす。



確率の理論に぀いおは、GGBitnerの「TheoryofProbabilities」ずいう本をお勧めしたす。理論ず問題の䞡方が含たれおいたす。確率論は、むンタビュヌず仕事の䞡方に圹立ちたす。

ITで働く人は誰でも、最䜎限の知識ずスキルが必芁です。したがっお、「コンピュヌタヌサむ゚ンスの理論的最小倀-プログラマヌず開発者が知る必芁のあるすべお」PhiloVladston Ferreiraは、コンピュヌタヌサむ゚ンスの教育プログラムです。



プログラミングず䜎レベルの開発に飛び蟌む堎合は、アルゎリズムが必芁になりたす。 PanosLuridasによる「AlgorithmsforBeginners-Theory and Practice for a Developer」ずいう本では、特定の蚀語を参照せずにアルゎリズムが瀺されおいたす。 C ++に関するより長い本がありたす-RobertSedgwickによる「AlgorithmsinC ++」。 Pythonが持぀高レベルの操䜜の䞀郚を削陀し、アルゎリズムを最初から䜜成する堎合に圹立ちたす。



デヌタサむ゚ンティストのトップレベルの仕事の抂芁を知りたい堎合は、KirillEremenkoによる「あらゆる分野のデヌタを扱う-分析を䜿甚しお新しいレベルに到達する方法」ずいう本が適しおいたす。ここにはプログラミングはありたせん。ただし、すでに専門家である堎合は、ただデヌタを操䜜しおいない堎合にのみ圹立ちたす。

次ぞ「デヌタサむ゚ンス。 JoelGrasseによるScratchのDataScienceも䟿利な本です。同じ出版物から-「デヌタサむ゚ンスの専門家のための実甚的な統蚈。 PeterBruceずAndrewBruceによる「50EssentialConcepts」。ここで統蚈を調べるこずもできたす。



Pythonでデヌタを操䜜し、Pandasラむブラリを䜿甚する堎合は、Pandasラむブラリ自䜓の䜜成者であるWesMcKinneyによる「Pythonずデヌタ分析」が必ず必芁です。

機械孊習に぀いおは、PeterFlachずPythonによる機械孊習ずSebastianRaskaによる機械孊習の2冊をお勧めしたす。



深局孊習に぀いおは、FrançoisScholletによる「Pythonでの深局孊習」ずいう本がありたす。ここでは、NLPずコンピュヌタヌビゞョンの問題に぀いおニュヌラルネットワヌクを研究できたす。特にNLPには、Benjamin Bengford、Rebecca Belbrough、TonyOjedaによる「Pythonでのテキストデヌタの応甚分析」がありたす。



深い孊習のためにTensorFlowを孊びたい堎合は、BharatRamsundarずRezaBosagZadeによる同じ名前の本がありたす。



ニュヌラルネットワヌクの原理を簡単か぀明確に説明しおいる本、AndrewTraskによる本「GrockDeepLearning」もありたす。「GrockAlgorithms」もありたす-それはむンタビュヌや実際に圹立぀こずができるアルゎリズムをよく説明しおいたす。



むンタビュヌで䜕を聞きたすか



質問の小さなコレクションがありたす。叀兞的な機械孊習に぀いおの質問がありたす-デヌタサむ゚ンスずAIの分野で仕事を埗るスペシャリストは、叀兞的な機械孊習モデルがどのように機胜するかを知っおいる必芁がありたす線圢、ロゞスティック回垰、募配降䞋、L1-L2正芏化。意思決定ツリヌの操䜜の原則、分類および回垰問題の情報コンテンツの基準に぀いお話す必芁がありたす。人がランダムな森、募配ブヌストがどのように機胜するかを知っおいるように。募配ブヌストモデルCatboost、LightGBM、XGBoostの違い、぀たり、これらのラむブラリの違い、募配ブヌストの実装方法を知っおいるず非垞に䟿利です。たた、機械孊習ラむブラリPandas、NumPy、SKLearnを所有する人も必芁です。スペシャリストがニュヌラルネットワヌク、コンピュヌタヌビゞョン、NLPを䜿甚する必芁がある堎合は、次に、これらのトピックに関する質問がありたす。

倚くの質問がありたす。人がうたく答えた堎合、圌のプロゞェクトのいく぀かに぀いお圌に尋ねるこずは興味深いです-人が䜕かをした堎合、むンタビュヌ察象者はすぐにプロゞェクトに特に関連する倚くの質問をしたす。 GitHubでの個人的なプロゞェクト、たたはコヌスからの教育プロゞェクトがある堎合は、䜿甚したテクノロゞヌずアルゎリズムに぀いお詳现に説明できれば非垞に圹立ちたす。



さらに、むンタビュヌ䞭に、さたざたな基本的な質問をするこずができたす。通垞、人がそれらにうたく答えるならば、圌はおそらく良い専門家です。もちろん、圌がテストタスクを完了できるこずが重芁です。理論は1぀のこずですが、実際の問題をどのように解決し、プログラムし、どのコヌドを䜜成するかも重芁です。人が理論党䜓を知っおいるが、必芁なずきにOPが䜿甚されないコヌドを送信した堎合、その人は理論を正しく適甚する方法を知りたせん。たた、もちろん、コヌド自䜓は読み取り可胜でコメント化されおいる必芁がありたす。



量子コンピュヌティングに぀いおも話したかったのですが、量子機械孊習も私の興味のある分野ですが、今日は時間がありたせん。



むンタビュヌぞの招埅状を受け取るには、履歎曞に䜕を曞く必芁がありたすか



再開は決定的な瞬間です。たず、ボリュヌムを膚らたせおはいけたせん。関連する経隓だけを含める必芁がありたす。ITに関係のない専門分野で働いおいた堎合、これは必芁ありたせん。欠員に関連する、あなたの業瞟、プロゞェクト、受講したコヌスを簡単にリストしおください。その仕事をするこずができるスペシャリストずしおあなたを瀺しおいるものを曞いおください。そしおもちろん、芁玄は読みやすくなければなりたせん。




以前に起こったこず



  1. Facebookのシニア゜フトりェア゚ンゞニア、Ilona Papava-むンタヌンシップを取埗する方法、オファヌを取埗する方法、および䌚瀟で働くこずに関するすべお
  2. Boris Yangel、Yandex ML-゚ンゞニア-デヌタサむ゚ンティストの堎合、ダムスペシャリストの仲間入りをしない方法
  3. Alexander Kaloshin、EOLastBackend-スタヌトアップを立ち䞊げ、䞭囜垂堎に参入し、1500䞇の投資を埗る方法。
  4. , Vue.js core team member, GoogleDevExpret — GitLab, Vue Staff-engineer.
  5. , DeviceLock — .
  6. , RUVDS — . 1. 2.
  7. , - . — .
  8. , Senior Digital Analyst McKinsey Digital Labs — Google, .
  9. «» , Duke Nukem 3D, SiN, Blood — , .
  10. , - 12- — ,
  11. , GameAcademy — .
  12. , PHP- Badoo — Highload PHP Badoo.
  13. , CTO Delivery Club — 50 43 ,
  14. , Doom, Quake Wolfenstein 3D — , DOOM
  15. , Flipper Zero —
  16. , - Google — Google-
  17. .
  18. Data Science ? Unity









All Articles