Gartner MQ Review 2020機械孊習および人工知胜プラットフォヌム

私がこれを読んだ理由を説明するこずは䞍可胜です。ちょうど時間があり、垂堎がどのように機胜するかは興味深いものでした。そしお、これは2018幎以来すでにGartnerにずっお本栌的な垂堎です。 2014幎から2016幎たでは、高床な分析BIにルヌツず呌ばれ、2017幎にはデヌタサむ゚ンスず呌ばれおいたしたこれをロシア語に倉換する方法がわかりたせん。広堎でのベンダヌの動きに興味のある方はこちらをご芧ください。そしお、2020幎の広堎に぀いおお話したす。特に、2019幎以降の倉曎は最小限であるため、SAPは去り、AltairはDatawatchを賌入したした。



これは䜓系的な分析ではなく、衚でもありたせん。地球物理孊者の芳点からも、個々の芖点。しかし、私は垞にGartner MQを読みたいず思っおいたす。圌らは、いく぀かのポむントを完璧に定匏化しおいたす。それで、ここに私が技術的、垂堎的そしお哲孊的な芳点から泚意を払ったものがありたす。



これは、MLに深く関心のある人向けではなく、垂堎で䞀般的に起こっおいるこずに関心のある人向けです。



DSML垂堎自䜓は、BIずCloudAI開発者サヌビスの間に論理的にネストしおいたす。







最初の匕甚ず甚語が気に入りたした



  • 「リヌダヌは最良の遞択ではないかもしれたせん」 -マヌケットリヌダヌは必ずしもあなたが必芁ずするものではありたせん。非垞に緊急機胜的な顧客が䞍足しおいるため、圌らは垞に「適切な」゜リュヌションではなく、「最良の」゜リュヌションを探しおいたす。
  • モデルの運甚化はMOPず略されたす。そしお、パグは誰にずっおも難しいです-クヌルなパグテヌマはモデルを機胜させたす。
  • ノヌトブック環境は、コヌド、コメント、デヌタ、および結果がたずめられる重芁な抂念です。これは非垞に明確で有望であり、UIコヌドの量を倧幅に枛らすこずができたす。
  • «Rooted in OpenSource» — – .
  • «Citizen Data Scientists» — , , , . .
  • «Democratise» — “ ”. «democratise the data» «free the data», . «Democratise» — long tail . — !
  • «Exploratory Data Analysis – EDA» — . . . , . ,
  • 「再珟性」 -環境、入力、出力のすべおのパラメヌタヌを最倧限に保持するため、䞀床実行するず実隓を繰り返すこずができたす。実隓的なテスト環境の最も重芁な甚語


そう



Alteryx



クヌルなむンタヌフェヌスは単なるおもちゃです。もちろん、スケヌラビリティは少しき぀いです。したがっお、tsatskiず同じ呚りの゚ンゞニアの垂民コミュニティがプレむしたす。Analyticsには、独自のオヌルむンワンボトルがありたす。90幎代にプログラムされたCoscadSpectral Correlation DataAnalysisスむヌトを思い出したした。



アナコンダ



PythonずRの専門家を䞭心ずしたコミュニティ。オヌプン゜ヌスはそれぞれ倧きいです。私の同僚は垞に䜿甚しおいるこずがわかりたした。知りたせんでした。



DataBricks



3぀のオヌプン゜ヌスプロゞェクトで構成されおいたす-Spark開発者は2013幎以来、莫倧な資金を調達しおいたす。私はwikiを盎接読む必芁がありたす。
「2013幎9月、DatabricksはAndreessenHorowitzから1390䞇ドルを調達したず発衚したした。同瀟は、2014幎に3,300䞇ドル、2016幎に6,000䞇ドル、2017幎に1億4,000䞇ドル、2019幎2月に2億5,000䞇ドル、2019幎10月に4億ドルを远加で調達したした。
スパヌクが芋た玠晎らしい人々。なじみがないごめんなさい



そしおプロゞェクトは次のずおりです。



  • Delta Lake -ACID on Sparkが最近リリヌスされたしたElasticsearchで倢芋おいたもの-それをデヌタベヌスに倉換したす厳密なスキヌム、ACID、監査、バヌゞョン...
  • MLフロヌ-モデルの远跡、パッケヌゞ化、管理、および保管。
  • Koalas -Spark䞊のPandasDataFrameAPI-Pandas-䞀般にテヌブルずデヌタを操䜜するためのPythonAPI。


突然知らない、たたは忘れおしたったSparkに぀いお芋るこずができたすlink。Vidosikiは、少し退屈で詳现なコンサルティングのキツツキの䟋を芋おみたした。DataScience甚のDataBricksリンクずData Engineering甚リンクです。



぀たり、DatabricksはSparkを匕き出したす。クラりドで通垞Sparkを䜿甚したい人は、意図したずおり、ためらうこずなくDataBricksを䜿甚したす:)ここでの䞻な差別化芁因はSparkです。

SparkStreamingは本物の停のリアルタむムたたはマむクロバッチ凊理ではないこずがわかりたした。たた、実際のリアルタむムが必芁な堎合は、ApacheSTORMにありたす。それでも誰もがSparkはMapReduceよりもクヌルだず蚀ったり曞いたりしおいたす。スロヌガンはこれです。



DATAIKU



クヌルな゚ンドツヌ゚ンドのもの。たくさんの広告がありたす。Alteryxずの違いがわかりたせんか



DataRobot



デヌタを準備するためのPaxataは、2019幎12月にDateRobotsに買収された別の䌚瀟です。 20 MUSDを調達し、販売したした。 7幎ですべお。



ExcelではなくPaxataでデヌタを準備しおいたす-ここを参照しおくださいlink。

2぀のデヌタセット間に自動スプヌフィングず結合提案がありたす。玠晎らしいこず-デヌタを敎理するために、テキスト情報にさらに重点を眮きたすリンク。

デヌタカタログは、誰も必芁ずしない「ラむブ」デヌタセットの優れたカタログです。

Paxataでカタログがどのように圢成されるかも興味深いですリンク。



«According to analyst firm Ovum, the software is made possible through advances in predictive analytics, machine learning and the NoSQL data caching methodology.[15] The software uses semantic algorithms to understand the meaning of a data table's columns and pattern recognition algorithms to find potential duplicates in a data-set.[15][7] It also uses indexing, text pattern recognition and other technologies traditionally found in social media and search software.»


デヌタロボットの䞻な補品はこちらです。圌らのスロヌガンはモデルから䌁業アプリケヌションたでです危機に関連しお石油業界向けのコンサルティングを発芋したしたが、非垞に平凡で面癜くありたせんリンク。 MopsたたはMLopsで圌らのビデオを芋たしたリンク。これは、さたざたな補品の6〜7回の買収で構成されたフランケンシュタむンです。



もちろん、デヌタサむ゚ンティストの倧芏暡なチヌムは、モデルを操䜜するためのたさにそのような環境を備えおいる必芁があるこずが明らかになりたす。そうしないず、モデルの倚くが生成され、䜕も展開されたせん。そしお、私たちの石油ずガスの䞊流の珟実では、1぀のモデルを正垞に䜜成するこずができ、これはすでに倧きな進歩です



プロセス自䜓は、地質孊における蚭蚈システムの䜜業を非垞に圷圿ずさせたす-地球物理孊、䟋えば、ペトレル..。すべおの雑貚がモデルを䜜成および倉曎したす。モデルにデヌタを収集したす。それから圌らはリファレンスモデルを䜜り、それを生産に投入したしたたずえば、地質孊的モデルずMLモデルの間には倚くの類䌌点がありたす。



ドミノ



オヌプンプラットフォヌムずコラボレヌションに重点を眮いおいたす。ビゞネスナヌザヌは無料で入堎できたす。圌らのデヌタラボはシェアポむントに非垞に䌌おいたす。 そしおその名前からIBMに匷く䞎えたす。すべおの実隓は元のデヌタセットにリンクされおいたす。どれほど銎染みがあるか:)私たちの実践のように-いく぀かのデヌタがモデルにドラッグされ、次にそれがクリヌンアップされおモデルに敎理されたした、そしおこれはすべおモデルにすでに存圚し、初期デヌタで終わりを芋぀けるこずができたせん。



Dominoにはクヌルなむンフラストラクチャ仮想化がありたす。私はマシンに1秒あたりのコア数を収集し、カりントしたした。それがどのように行われたかは、すぐには完党には明らかではありたせん。どこでもDocker。たくさんの自由最新バヌゞョンの任意のワヌクスペヌスに接続できたす。䞊行しお実隓を実行したす。成功したものの远跡ず遞択。



DataRobotず同じ-結果はアプリケヌションの圢でビゞネスナヌザヌ向けに公開されたす。特に才胜のある「利害関係者」のために。たた、モデルの実際の䜿甚も監芖されたす。パグのためのすべお



耇雑なモデルがどのように生産されるのか完党には理解しおいたせんでした。それらにデヌタを䟛絊しお結果を取埗するために、いく぀かのAPIが提䟛されおいたす。



H2O



ドラむブレスAIは、監芖察象ML向けの非垞にコンパクトでわかりやすいシステムです。 1぀のボックスにすべお。バック゚ンドに぀いおすぐに明確ではありたせん。



モデルは自動的にRESTサヌバヌたたはJavaアプリにパッケヌゞ化されたす。これは玠晎らしいアむデアです。解釈可胜性ず説明可胜性に぀いおは倚くのこずが行われおきたした。モデルの操䜜結果の解釈ず説明本質的に説明できないものは䜕ですか、そうでなければ人は同じこずを蚈算できたすか。

初めお、非構造化デヌタずNLPに関するケヌススタディが詳现に怜蚎されたす。高品質の建築写真。䞀般的に、私は写真が奜きでした。



完党には明確ではない倧芏暡なオヌプン゜ヌスH2Oフレヌムワヌクがありたす䞀連のアルゎリズム/ラむブラリ。ゞュピタヌのようなプログラミングなしで自分のビゞュアルラップトップリンク。PojoずMojoに぀いおも読みたした-珟実に包たれたH2Oモデル。1぀目は額にあり、2぀目は最適化です。Gartnerがテキスト分析ずNLPを長所ずしお、たた説明可胜性の取り組みに぀いお曞いたのはH20だけです。それは非垞に重芁です



同䞊鉄ず雲の統合のための高性胜、最適化、および業界暙準。



そしお、それは匱点で論理的です-Driverles AIは、独自のオヌプン゜ヌスず比范しお匱くお狭いです。同じPaxataず比范するず、デヌタの準備が䞍十分です。そしお、産業デヌタストリヌム、グラフ、地理を無芖したす。たあ、すべおが正しいわけではありたせん。



KNIME



ホヌムペヌゞにある6぀の非垞に具䜓的な非垞に興味深いビゞネスケヌスが気に入りたした。匷力なオヌプン゜ヌス。



ガヌトナヌはリヌダヌからビゞョナリヌに昇栌したした。リヌダヌが垞に最良の遞択であるずは限らないこずを考えるず、貧しいお金を皌ぐこずはナヌザヌにずっお良い兆候です。



キヌワヌドはH2Oず同じです-拡匵された、それは貧しい垂民のデヌタ科孊者を助けるこずを意味したす。レビュヌでパフォヌマンスで叱られたのはこれが初めおです面癜い぀たり、蚈算胜力が非垞に高いため、パフォヌマンスがシステム䞊の問題になるこずはありたせんかGartnerには、この単語「Augmented」に関する別の蚘事がありたすが、私はそれを知るこずができたせんでした。

そしお、KNIMEはレビュヌで最初の非アメリカ人のようですそしお私たちのデザむナヌは圌らのランディングペヌゞが本圓に奜きでした。奇劙な人々。



MathWorks



MatLabは、誰もが知っおいる叀くからの名誉ある友人です。生掻ず状況のすべおの分野のためのツヌルボックス。非垞に異なる䜕か。実際、䞀般的にすべおの機䌚のためにたくさん、たくさん、たくさんの数孊



システム蚭蚈甚のSimulinkアドオン補品。Digital Twinsのツヌルボックスを掘り䞋げたした-それに぀いおは䜕も理解しおいたせんが、ここにはたくさんのこずが曞かれおいたす。以䞋のための石油産業。䞀般的に、これは数孊や工孊の深さずは根本的に異なる補品です。特定の数孊ツヌルキットを遞択したす。ガヌトナヌによれば、圌らは皆、賢い゚ンゞニアのような問題を抱えおいたす-コラボレヌションがありたせん-それぞれが圌のモデルの䞭で暎れ回っおいお、民䞻䞻矩も搟取可胜性もありたせん。



RapidMiner



私は以前、Matlabず䞀緒に優れたオヌプン゜ヌスのコンテキストで倚くのこずを知り、聞いたこずがありたす。い぀ものようにTurboPrepに少し埋めたした。ダヌティデヌタからクリヌンなデヌタを取埗する方法に興味がありたす。



繰り返しになりたすが、機胜のデモでは、2018幎のマヌケティング資料ずひどい英語を話す人が優れおいるこずがわかりたす。



そしお2001幎以来、ドむツの匷い過去を持぀ドルトムントの人々





オヌプン゜ヌスで正確に䜕が利甚できるのか、サむトからはわかりたせんでした。さらに深く掘り䞋げる必芁がありたす。展開ずAutoMLの抂念に関する優れたビデオ。



RapidMinerServerバック゚ンドに぀いおも特別なこずは䜕もありたせん。それはおそらくコンパクトで、箱から出しおすぐに構内でうたく機胜したす。 Dockerにパッケヌゞ化されおいたす。 RapidMinerサヌバヌのみの共有環境。そしお、スタゞオワヌクフロヌでSparkからのリズムを数えるRadoop、hadupからのデヌタがありたす。



ホットな若いベンダヌ「ストラむプスティックセラヌ」が期埅するようにそれらを抌し䞋げたした。ただし、Gartnerは、゚ンタヌプラむズ分野での将来の成功を予枬しおいたす。あなたはそこでお金を集めるこずができたす。ドむツ人はどれほど聖なるものかを知っおいたすSAPに぀いおは蚀及しないでください!!!



圌らは垂民のためにたくさんのこずをしたすしかし、このペヌゞでは、Gartnerが販売革新に苊劎しおおり、察象範囲の広さではなく収益性を求めお戊っおいるず蚀っおいるこずがわかりたす。



å·ŠSASおよびTibcoの䞀般的なBIは私のためにベンダヌ...そしお、䞡方が正垞なデヌタサむ゚ンスは、論理的に成長するこずを、私の信念を確認し、トップにある

BIからではなく、雲ずのHadoopむンフラの倖に。ビゞネスから、぀たりITからではありたせん。Gazpromneftの䟋linkのように、成熟したDSML環境は堅実なBIプラクティスから成長したす。しかし、おそらく圌女はMDMやその他のこずに汚染ず偏芋を持っおいたす。



SAS



蚀うこずはあたりありたせん。明癜なこずだけ。



TIBCO



戊略は、1ペヌゞに及ぶWikiペヌゞのショッピングリストで読み取られたす。はい、長い話ですが、28 !!! チャヌルズ。私のテクノの若者にBISpotfire2007を買収したした。たた、Jaspersoft2014、InsightfulS-plus2008、Statistica2017、Alpine Data2017、むベント凊理およびストリヌミングStreambase System2013、MDM Orchestra Networks2018の3぀の予枬分析ベンダヌによるレポヌトもありたす。 およびSnappy Data2019むンメモリプラットフォヌム。



こんにちはフランキヌ






All Articles