AmazonSageMakerでの分散トレーニング
Amazon SageMakerにより、大規模なモデルのトレーニングと大量のデータの処理がより簡単かつ迅速になりました。Amazon SageMaker製品の新しい分散トレーニングは、分散トレーニングを可能にし、データとモデルの並列処理の両方をサポートします。これには最小限のコード変更が必要です。これで、データを簡単にパーツに分割し、さまざまなGPUでトレーニングできます。モデル自体を分割して、複数のGPUをトレーニングに使用することもできます。これは、GPUだけでは不十分な大規模モデルに役立ちます。
詳細はこちら
Amazon SageMaker Clarify
機械学習モデルは多くの場合ブラックボックスです。モデルがなぜこれまたはその結果を生成したのかを理解するのは困難です。 Amazon SageMaker Clarifyは、モデルがどのように機能し、各結果に影響を与えた要因を理解するのに役立ちます。これは、モデルの監査にとって特に重要です。
さらに、データのバランスが取れていない可能性があります。 MLモデルがトレーニングされる履歴データは不完全であり、しばしば偏っています。たとえば、特定の年齢の初期の人々が少数の住宅ローンを取得した場合、そのようなデータでトレーニングされたモデルは、将来、この年齢の人々への住宅ローンを拒否する可能性があります。これはバイアスを強化するだけです。 Amazon SageMaker Clarifyを使用すると、データ内のこれらのタイプの不均衡とバイアスを特定できます。これにより、モデルはすべての人にとってより適切に機能します。
詳細はこちら
AmazonSageMakerデバッガー
Amazon SageMaker Debuggerは、モデルのデバッグとプロファイリング、トレーニングデータの収集と分析、レポートの生成、およびメトリックの視覚化に便利なツールです。SageMaker Debuggerは、今年、多くの更新と、完全に再設計されたユーザーインターフェイスを受け取りました。
詳細はこちら
Amazon SageMaker JumpStart
Amazon SageMaker JumpStartを使用すると、既製のソリューションまたはMLモデルをすばやく展開できます。手書き認識、需要予測、詐欺や悪意のあるユーザーの検出などのタスクには、すでに15のソリューションが利用できます。さらに、SageMaker JumpStartを使用すると、数回クリックするだけで、TensorFlowハブおよびPyTorchハブから150のオープンソースMLモデルの1つを展開できます。
詳細はこちら
Amazon SageMaker Edge Manager
スマートデバイスを、クラウドでトレーニングされたモデルを実行し、テレメトリを収集し、サンプルデータをクラウドに送り返して再トレーニングできるエッジスマートデバイスに変えるツールキット(MLOps)。Amazon SageMaker Edge Managerは、デバイス群の状態を監視し、SageMakerNeoで最適化されたモデルを更新するのにも役立ちます。
SageMaker Edge Agentは、モデルを実行し、テレメトリを収集し、サンプルデータをクラウドに送り返すことができるデバイスでホストされる小さなランタイムです。
SageMaker Neoは、エージェントランタイムにすでに含まれている低電力デバイス用にモデルを最適化するツールです。
SageMaker Edgeダッシュボードは、モデルをドリフトすることでデバイスの状態を監視するのに役立ちます。
詳細はこちら
アマゾンレッドシフトML
データを準備して最も適切なアルゴリズムを選択するSageMakerAutoPilotとの統合により、モデルをトレーニングし、RedshiftへのSQLクエリで直接推論を行うことができるようになりました。また、RedShiftクラスターのリソースを使用して、データをアンロードせずに、それ以降のすべての予測をすでに行うことができます。
これにより、開発者またはアナリストがデータを操作しやすくなり、ステージングストレージへのデータのアップロード、トレーニングプロセスの開始、モデルのホスト、予測プロセスなどの手順が不要になります。
詳細
アマゾンネプチューンML
Amazon Neptune MLは、グラフベースのマネージドデータベースの新機能であるAmazonNeptuneです。Deep Graph Libraryを使用して構築されているため、グラフデータソースに特化していない他のライブラリやアルゴリズムよりも精度を最大50%向上させることができます。
Amazon Neptune MLは、欠落しているノード(分類ノード)とエッジ(重み回帰)の両方を予測できます。
メトリックのAmazonルックアウト
ビジネス指標の異常を自動的に検出し、開発スキルや機械学習を必要としない新しいサービス。このサービスは、Salesforce、Marketo、Google Analytics、Slack、Zendeskなどのデータソースに接続できます。
異常を監視、特定、警告するために使用できます。また、Webページの表示、顧客の解約率、1日のアクティブユーザー(DAU)、トランザクション、モバイルアプリのインストールなどのデータで異常の潜在的な原因を示すこともできます。 ..。
Plarixはすでにプレビューにアクセスしており、データを分析するためにこのサービスをテストしています。
「ユーザー獲得データを実験して、サービスがどのように機能するかを理解し、異常をすばやく特定してグループ化することで、より速く、より良く作業できるようになりました」 -PlayrixのCTO、MikhailArtyugin氏。
詳細はこちら
ロシア語のTwitchセッション
今日、次のロシア語のけいれんストリームが行われ、機械学習の分野での目新しさがあります。AWS re:Inventの重要な日にストリームが行われていることをお知らせします。ストリームは、数時間の会議のニュースと発表から最も興味深く有用なものを選択する主要なAWSソリューションアーキテクトによって準備および実施されます。まだ接続していない方のために-登録リンク。
トピックの詳細:
AWS re:Invent。AWS re:Inventの初日(パート1)の主な発表
。初日の主な発表(パート2)