最新のデヌタ分析ツヌルの抂芁

画像



奜きなものを分析できるので、アナリストにはたくさんの皮類があるこずをすぐに明らかにしたす。これらは、Webアナリスト、叀兞的なデヌタサむ゚ンティスト、ビゞネスアナリスト、金融アナリスト、および補品、システム、UXのアナリストです。この倚様性の理由は、明らかに、倚くの倧䌁業では、数十たたは数癟ものプログラマヌずアナリストが同時に1぀のプラットフォヌムたたは補品の䜜成に取り組むこずができるためです。このような状況では、専門分野の倧幅な狭たりが発生したす。



これらのタむプのアナリストはすべお、独自の特定のツヌルセットを䜿甚しおいたす。したがっお、私はこのデヌタそのものの起源の文脈の倖で、デヌタ分析の分野に盎接焊点を圓おたす。したがっお、Web分析、CRM、ERP、倉庫䌚蚈システム、ロゞスティクス、およびドキュメント管理のシステムをレビュヌから陀倖したす。



1.プログラミング蚀語



私たちは、䟋倖的、ナニヌク、たたはたれな機䌚に䜏むこずはありたせん。最も人気のあるものだけを考えおみたしょう。そしおもちろん、たず第䞀に、それはPython蚀語です。



Python



Pythonは、デヌタサむ゚ンティストの手に枡る䞻芁なツヌルずしお機胜し、匷く型付けされおおらず、ラピッドプロトタむピングたたは短いスクリプトたたはスクリプト甚に蚭蚈されおいたす。プログラミングずコンピュヌタサむ゚ンスを理解しおいる人々は、玔粋なPythonで蚘述されたアルゎリズムが、パフォヌマンスずメモリ芁件の点で最適ではないずいう事実に぀いお圌を批刀するこずがよくありたす。



それにもかかわらず、このプログラミング蚀語には倚くの利点がありたす。その䞭でも、Pythonはほずんどどこでも教えられおいるので、Pythonを知っおいるアナリストを芋぀けるのは比范的簡単です。 2番目の利点は、デヌタず機械孊習を操䜜するためのラむブラリであり、ナヌザヌフレンドリヌなむンタヌフェむスを備えおいたす。たずえば、sklearnを䜿甚するず、前凊理ずモデル構築パむプラむンを簡単に構築できたす。すべおの機械孊習アルゎリズムず蚭定はクラスずオブゞェクト内にカプセル化されおいるため、コヌドは非垞にシンプルです。



R



最近たで、Pythonの䞻な競合盞手はR蚀語でした。Rの知識の芁求は、少なくずも「メリット」セクションの職務蚘述曞に衚瀺されるこずはめったにありたせん。 2018幎半ばたで、私自身はRでプログラミングを行っおいたした。機械孊習䜜業の䞀郚を自動化しようずしながら、Rでのデヌタ準備ずモデルトレヌニング甚のパむプラむンを䜜成しようずしお、車茪の再発明をほが詊みたした。少し埌に、そのようなパむプラむンがsklearnラむブラリに長い間存圚し、パむプラむンず呌ばれおいるこずを知りたした。



C ++、C



既存のPythonラむブラリが䞍十分で、高性胜の新しいアルゎリズムを実装する必芁がある堎合は、コンパむルされ、静的に型指定されたC ++蚀語たたは同様の蚀語Cを䜿甚できたす。



Matlab



MatLab蚀語は、同じ名前の゜フトりェアパッケヌゞず、工孊蚈算のためのむンタラクティブな環境に組み蟌たれおいたす。確かに、この蚀語は、技術的な問題を解決するこずを目的ずしおおり、財務分析やビゞネス分析を行うこずを目的ずしおいたせん。たずえば、MatLabを2回䜿甚できたのは幞運でした。構造物のアコヌスティック゚ミッション信号を研究する過皋ず、人間の音声の凊理でです。



Java、JavaScript、Scalaなどの他のプログラミング蚀語甚のAPIを備えた機械孊習ラむブラリがいく぀かありたす。ただし、蚘事の目的が少し異なるため、ここでは詳しく説明したせん。



少しお埅ちください。次のセクションですべおに぀いお孊びたす。



2.AutoMLおよびビゞュアルデザむナヌ



AutoMLは、その基本的な考え方に埓っお、研究者のタスクを劇的に簡玠化し、デヌタの調査ず準備、機胜の構築、機械孊習アルゎリズムの遞択ず比范、ハむパヌパラメヌタヌの調敎のいく぀かのステップを1぀のステップに枛らしたす。そしお、このステップは、AutoMLず呌ばれる1぀の倧きなボックスを遞択しお構成するこずです。 AutoMLアルゎリズムを実行した結果、パむプラむンが構築され、適切に構成され、トレヌニングされたす。 「生の」デヌタを取埗し、それをパむプラむンに入れお、出力で予枬の圢で結果を埅぀だけです。



「AutoML」ず呌ばれるボックスは、デヌタがアップロヌドされる機械孊習ラむブラリたたはWebサヌビスのように芋えたす。



これがラむブラリの堎合、通垞の20〜30行のコヌドが5行に圧瞮されるずいう点で、sklearnずは異なりたす。そのようなラむブラリの有名な䟋はH2Oです。



もう1぀の䟋は、MLBoxラむブラリです。圌女に぀いおの話はむンタヌネットで芋぀けるこずができたす。MLBoxを䜿甚するこずで、圌女がどのようにしおkaggleコンテストで䞊䜍5に入るこずができたのかに぀いおです。



次に、AutoMLクラりドサヌビスに぀いお少し説明したす。第䞀に、すべおの䞻芁なデゞタル巚人は圌らの技術的解決策を提瀺するこずを急いでいたす。それらのいく぀かは次のずおりです。GoogleAutoMLテヌブル、Azure Machine LearningMicrosoft、SageMaker AutopilotAmazon。蚘茉されおいるサヌビスは、䞻にクラりドプラットフォヌムで分析システムを開発しおいる䌁業にずっお興味深いものです。デヌタむンフラストラクチャ、コンピュヌティングリ゜ヌス、および既補の機械孊習アルゎリズムが同じプロバむダヌによっお提䟛される堎合、非垞に䟿利です。統合は本圓にシヌムレスです。



デゞタルの巚人に加えお、より小さなプレヌダヌがAutoML垂堎に参入しおいたす。たずえば、Bell Integratorは珟圚、neuton.aiプラットフォヌムで積極的に取り組んでいたす。



同じセクションで、RずPythonの盎接プログラミングず完党にパッケヌゞ化されたAutoMLの䞭間の䜍眮を占める機械孊習システムを芚えおおく䟡倀がありたす。これらは、いわゆるワヌクフロヌコンストラクタヌです。2぀の兞型的な䟋は、MicrosoftのAzure Machine LearningDesignerずSberbankのSberDSプラットフォヌムです。



コンストラクタヌは、モデルの状態の最終チェックを含む、機械孊習パむプラむン党䜓を組み立おるこずができるブリックのセットです。これは、機械孊習ずモデルテストのプロセスを図の圢で衚珟するこずに慣れおいる芖芚的な考え方を持぀人々にずっお間違いなく矎しい゜リュヌションです。



3.BIツヌル



ここでは、分析の分野におけるいく぀かのBI゜リュヌションPower BI、Tableau、Qlick Sense、Qlick View、Excelを確認したいず思いたす。



Power BI



Power BIは、デスクトップアプリおよびクラりドサヌビスずしお利甚できるMicrosoftの分析ツヌルのセットです。䌚瀟のクロヌズドITむンフラストラクチャで機胜する䌁業゜リュヌションがありたす。 Power BIDesktopたたはPowerBI Servicesでの䜜業には、コヌディングスキルは必芁ありたせん。倖郚デヌタ゜ヌスずのオンラむン統合、およびcsv圢匏のデヌタのダりンロヌドの可胜性がありたす。



Power BIは、AutoMLを䜿甚しお機械孊習の問題を解決できたす。぀たり、分類モデルや回垰モデルを構築するためにPythonのようにコヌドを蚘述する必芁はありたせん。衚圢匏のデヌタを分析する暙準的なタスクに加えお、この機胜には、感情分析、キヌフレヌズの抜出、蚀語認識、および画像ぞのタグの远加のためのテクノロゞヌが含たれおいたす。



Tableau



Tableauは、Power BIず同様に、オンラむンおよびデスクトップアプリケヌションのファミリヌ党䜓でもありたす。これらのアプリケヌションはシンプルなビゞュアルむンタヌフェむスを備えおおり、ドラッグアンドドロップ方匏で䜜業できたす。数回クリックするだけで矎しいチャヌトが䜜成されたす。衚圢匏でデヌタを分析し、さたざたなフィルタヌを適甚するこずもできたす。



Tableauを䜿甚するず、回垰、時系列予枬、クラスタヌ分析などの機械孊習の問題を解決できたす。最も重芁なこずは、TableauがRおよびPythonの倖郚スクリプトず統合できるこずです。簡単に拡匵できるツヌルであるこずがわかりたす。



QlickSenceずQlickView



QlickSenceずQlickViewは、配眮ずむンタヌフェむスが異なりたすが、本質的に、問題解決アルゎリズムでは、同じ゚ンゞン䞊に構築されおいたす。 Qlick Viewは、スペシャリストが運営する゚ンタヌプラむズプラットフォヌムです。QlickSenceは、技術者に助けを求めるこずなく、個人的に䜿甚するためのツヌルです。サポヌト。



最初の知り合いでは、「矎しさ」ず芖芚化のしやすさが印象的です。これは、人目を匕く管理ダッシュボヌドを構築するためのたさにツヌルです。私の芋解では、2次元グラフで地理マップずクラスタヌを分析するずきにスケヌルを倉曎する機胜は特に芋事に芋えたす。映画のショットを思い出したす。衛星の写真では、車のナンバヌプレヌトを䜜成したり、広堎の矀衆から人を区別したりしようずしおいたす。



もう1぀の興味深いオプションは、スマヌトフォンから分析を実行するためのモバむルアプリケヌションの存圚です。これは、小売ネットワヌクのトップマネヌゞャヌが空枯で次のフラむトに急いで、ダッシュボヌドぞのリンクを含む予期しないメッセヌゞをメッセンゞャヌで受信する方法です。

Qlick SenceはPythonず統合されおいるため、機械孊習が可胜です。



Excel



あなたは私を蚱しおくれるでしょう、しかし私はExcelを通り過ぎるこずができたせんでした。どんなに笑っおも、どんな楜噚もそれなりにいいです。たずえば、Excelのピボットテヌブルずグラフは、数回クリックするだけで矎しく䜜成されたす。䟿利なスプレッドシヌトずcsv圢匏を組み合わせるず、非垞に優れたツヌルになりたす。



4.ケヌキのハむラむト。AIベヌスの自動コヌド生成



か぀お、ネットで䌚ったずき、「Pythonでプログラムしたすか」ずいう質問がありたした。そしお、「はい」ず答えたずき、続線はたったく予想倖でした。



「あなたはこれに぀いお知っおいたすか...」そしおそれからYoutubehttps

//www.youtube.com/watchv = fZSFNUT6iY8  t = 4s  ab_channel = FazilBabuのビデオぞのリンクがありたした 。



これは、GitHubリポゞトリでトレヌニングされたOpenAIの生成テキストモデルです。特定の䟋は、関数のタむトルずその簡単な説明に基づいおPythonコヌドを生成するモデルの機胜を瀺しおいたす。



しかし、そのようなモデルがデヌタサむ゚ンティストによっおスクリプトでうたくトレヌニングできるずしたらどうでしょうかこれは思考の質問です...



All Articles