Webキャスティングにおける人工知能と機械学習:最近の傾向





こんにちは、Habr。私の名前はアレクサンダーアルパーンです。ウェビナーグループのCEO兼創設者です。今日は、インターネット放送における機械学習や人工知能技術の利用、メディアコンテンツの処理とユーザーへの配信などの問題についてお話したいと思います。



それはなんのためですか?ビューの増加、視聴者の忠誠心、プログラムの情報コンテンツ、およびネットワークの負荷の軽減は、最新のテクノロジーによって提供される利点のほんの一部です。



パンデミック+トラフィック=問題



世界のインターネットトラフィックの為替レートを分析したTeleGeographyによると、2020年にトラフィック消費量が急増しました。したがって、世界平均は約120から170 Tbpsに増加し、ピーク時には300Tbpsでした。



画像



原則として、成長はすでにかなり大きかったが、昨年はすべての記録が破られた-成長は47%だった。棺は簡単に開きます。何億人もの人々が家に閉じ込められたため、インターネットメッセンジャー、オンライン学習プラットフォーム、クラウドゲームサービス、そしてもちろんYouTubeのようなビデオプラットフォームを使用する活動が劇的に増加しました。



最も負荷の高いトラフィック交換ポイントは、ドイツのフランクフルト(DE-CIX FRA)とオランダのアムステルダム(AMS-IX)でした。 3月、DE-CIXピアツーピアセンターは、9.1Tbpsの史上最高のトラフィックに達しました



ロシアでも同様の状況が見られました。2020年3月から4月にかけて、オンライン映画館の トラフィック2〜4倍に増加しました。理由は同じです-パンデミックと自己隔離のために、人々は自分のアパートや家に隔離されていたので、インターネットは彼ら自身を楽しませる方法の1つになりました。同じ期間のモバイルトラフィックは、主ビデオチャットとインスタントメッセンジャーにより、10〜30%増加しました



NetflixとYouTubeが下がるまでになりまし ヨーロッパのユーザー向けのビデオ品質。YouTubeはHDではなく標準解像度で動画を表示し始め、Netflixは解像度を25%下げました。



何をすべきか?



理想的には、ローカルとグローバルの両方で、ネットワークインフラストラクチャの容量とスループットを向上させます。インターネット、携帯電話通信、その他の電気通信サービスのプロバイダーは常に多額のリソースを投資できるとは限らないため、ここではすべてが複雑です。



2番目のオプションは、コンテンツを最適化することです。これは、他の方法のように、ビデオやオーディオの品質を下げることを意味するものではありません。以下で検討します。



さまざまなビデオの圧縮を最適化する



Netflixはメディアコンテンツの最大のプロバイダーです。数年前、彼女は、ビデオの特性を考慮して、ビデオごとに異なる圧縮プロファイルを選択する方法を紹介しました。



Netflixには、コンテンツの圧縮など、豊富なビデオ体験があります。同社は独自の開発を使用して、低レベルのビデオ属性を評価し、クラスを決定し、各クラスに最適なパラメータを見つけるニューラルのようなシステムをトレーニングしました。



画像のダイナミクス、明瞭度、プロットの全体的な複雑さなどのパラメータが評価されます。ほんの数分で、システムはプロットのダイナミクス、明瞭さの程度、および「画像」の全体的な飽和度を評価します。分析データに基づいて、システムはビデオの最適化を決定します。したがって、番組や放送があまり動的でない場合は、ビデオの品質が低下する可能性があります。画像が急速に変化し、色が飽和し、プロットが複雑な場合、品質はわずかに低下するか、同じレベルのままになります。



画像



したがって、ビデオ伝送の最適化が達成され、ネットワークインフラストラクチャの負荷が軽減されます。ビデオでの作業は、最終結果がコンテンツの消費者に見えないように実行されます。言い換えれば、聴衆は何も気づかないだけです。圧縮には、同社 4K VMAFを含むさまざまなコーデックと圧縮モデル。 これにより、4Kビデオをストリーミングする場合でもネットワークが混雑することはありません。



最適な品質のビデオソースを選択する



高解像度、したがって大量の送信データは、受信者に高品質のビデオが配信されることを意味しません。この例は、上記のgifです。



良質のビデオのソースを選択することは、TVチャンネルパッケージのディストリビューターにとって緊急の問題です。Ssimwaveは、最高品質のコンテンツソースを自動的に選択する機械学習ソリューションを考案しました。



画像



例はCNNチャンネルの放送です。一方のソースでは、ビデオパラメータは1080 @ 29.97i、MPEG-2、40 Mbpsであり、もう一方のソースでは、720p60、H264、22Mbpsです。上記のように、高解像度は受信者にとって良いビデオ品質を意味するわけではありません。品質は、圧縮とカラーフォーマット、ダイナミックレンジ、トランスコーディング手順、配信テクノロジ、サブスクライバープレーヤーのバージョンなど、多数の要因の影響を受けます。



これらすべてを手動で評価することは不可能です。しかし、ニューラルネットワークは問題なくタスクに対処することができます。Ssimwaveは、最高品質で最小のデータ量の送信元を数秒で選択できるソリューションを開発することができました。



交通だけではない



機械学習、人工知能、ニューラルネットワークは、送信されるコンテンツの量を最適化するだけではありません。現在、テクノロジーが単に不可欠である分野は他にもたくさんあります。



ビデオカタログナビゲーション



多くのメディアコンテンツ会社には、ゲーム、ビデオ、映画、番組などのカタログがあります。Netflixによると、視聴する映画を選択するとき、加入者は映画のポスターアイコンに注意を払う可能性が最も高いとのことです。同社のクリエイティブディレクターであるニックネルソンによる と、 82%のケースで、映画の選択は提示されたアイコン/ポスターによって決定されます。



したがって、画像が成功すればするほど、視聴者がこの特定のコンテンツを選択する可能性が高くなります。これはすべて、ビデオだけでなく、他のデジタル商品にも関連しています。



画像



ネルソンの意見を確認または反証するために、AccedoはAWSおよびBritish Television Corporation ITVと提携して、ユーザーの選択に影響を与える要因を特定するためのA / Bテストを実行しました。結論はそれほど驚くべきことではありません。ユーザーはスクリーンショットを表示するときの感情に基づいて映画を選択します。スクリーンショットの評価には2秒もかかりません。



したがって、機械学習とAIテクノロジーを使用して、最適な変換でスクリーンショットを選択できます。映画の場合、このようなスクリーンショットには通常、顔が感情を表現しているヒーローの画像が含まれており、ほとんどの場合、敵対者の写真が選択されます。ヒーローのグループを含むスクリーンショットはあまり興味がありません。



さらに、人工知能は、視聴者のさまざまなカテゴリ/セグメントに対して、社会的および地理的にさまざまなコレクションを形成するのに役立ちました。現在、カタログが国や同じ国の地域によって異なって見えることは驚くべきことではありません。しかし、ちょうど10〜20年前は、状況は異なっていました。



ビデオの情報コンテンツを増やす



画像



これは、スポーツビデオなど、さまざまなビデオのマルチメディアメタデータを作成および構造化することです。ここでは、人工知能を内蔵したIBMスーパーコンピューターであるIBMWatsonが特に際立っていました。彼はリアルタイムで視覚的な説明を作成し、音声を書き起こし、編集メモを追加することができます。



これらのスキルは、ワールドカップ、全米オープン、スーパーボウルなどの人気のあるスポーツイベントでの作業中に使用されます。



AIはブロードキャストストリームを処理し、その中の重要なポイントをマークし、メモとコメントを追加します。さらに、処理済みのストリームは、放送番組の編集者に送信されるか、視聴者に直接放送されます。



顧客離れの減少



機械学習と人工知能は、顧客離れを防ぐのに最適です。これは、コンテンツに対するユーザーの関心が低下した場合に発生します。私たちのデータによると、興味のないコンテンツや過度に複雑なコンテンツは、ユーザーの4分の1にチャーンを引き起こす可能性があります。これはたくさんあり、これは許可されるべきではありません。



解約率を下げるには、次のことが重要です。



  • 解約の原因を理解する
  • 分析を自動化する
  • 予測ツールを使用する


Analyticsは、ユーザー情報、コンテンツの視認性、ユーザーの評価、サポート付きのユーザーインタラクションアクティビティ(ここでは、ビデオだけでなく、この場合のようにオンラインコースについても話すことができます)などのデータを使用します。たとえば、We.Studyプラットフォーム では、システム自体が定期的にコースを「監視」し、コースを改善するための具体的な推奨事項を提供して、参加者の行動を追跡し、解約を予測できるようにします。



分析の結果に基づいて、コンテンツを変更するための特定のアクション、コースの場合はトレーニングプログラムを実行して、ユーザーとの対話を改善することができます。



注目のコンテンツのパーソナライズ



画像



すべてのYouTubeユーザーは、推奨コンテンツが何であるかを知っています。推奨が成功すればするほど、ユーザーがビデオを見たり、別の種類のコンテンツを表示したりする可能性が高くなります。



実例-IBMWatsonプロジェクトとIris.tvプラットフォーム。パートナーは、最適なコンテンツのパーソナライズを実現することができました。これを行うために、ビデオは最初にメタデータを収集するスーパーコンピューターを通過します。次に、プラットフォームはこのデータを分析して、映画ライブラリの新しいカテゴリとタイトルを作成します。



さらに、機械学習の助けを借りて、プラットフォームは特定のユーザーの興味を分析するようにトレーニングすることができ、次の番組を見た後にその人に興味深いビデオを提供することを保証しました。



次は何ですか?



AIや機械学習を利用するケースは多いので、この記事では最もわかりやすい点だけを示しています。一般的な結論は、これらのテクノロジーが体系的に使用され始めているということです。以前は、テストとしてのみ使用されていました。現在、何百、何千ものコンテンツ企業が機械学習を使用して、コンテンツの最適化、ビジネスプロセスのデバッグ、新しいユーザーの誘致、古いユーザーの維持を行っています。



今後3〜5年で、圧倒的多数のメディアコンテンツプロバイダーは、個々の顧客とビジネス全体の両方の問題を解決できるという事実から、最新のテクノロジーの使用に切り替えるでしょう。



All Articles