著者:Roman Zykov、データベースエキスパート、LENNUF.ruの独立AIコンサルタント
パーソナライズされた推奨事項について話すとき、さまざまなタイプの推奨事項があることを忘れがちです。この記事では、長期的な推奨事項と短期的な推奨事項の主な違いについて説明します。
個人的な推奨とは、ユーザーの個人的な興味を考慮し、ユーザーのシグナルを考慮して、ユーザーに何かを推奨することを意味します。シグナル自体には2つのタイプがあります。ユーザーが好きなことを言ったときの明示的なものです(曲の評価、製品のレビューなど)。そして暗黙的に、ユーザーがいくつかのアクション(製品を見たり、曲を聴いたり、何かを探したり)を実行すると、ユーザーが何かを好きか嫌いかを明確に評価することはできません。レコメンダーシステムの最初のバージョンでは、明示的なデータのみを使用するのが通例でした。これは、当時の文献と科学記事の両方で見ることができます。通常、はるかに多くの暗黙のデータがあります-購入する前に見た製品の数(暗黙のシグナル)を覚えておいてください、それから、いくつの製品についてレビューを残しましたか(明確なシグナル)?したがって、過去10年間で、暗黙の推奨へのシフトがありました。 Netflixの代表者でさえ、5年前のRecSysカンファレンスでそのようなデータの重要性を発表しました。どうすればこれを見ることができますか?たとえば、YouTubeのおすすめは、視聴した動画や気に入った動画に応じて常に調整されています。同じことが、ストリーミング音楽サービス、ソーシャルネットワーク、オンラインストアのレコメンデーションシステムでも行われます。同じことが、ストリーミング音楽サービス、ソーシャルネットワーク、オンラインストアのレコメンデーションシステムでも行われます。同じことが、ストリーミング音楽サービス、ソーシャルネットワーク、オンラインストアのレコメンデーションシステムでも行われます。
長期的/短期的な推奨事項の問題に戻りましょう。長期的な関心とは、長期間にわたって関連するユーザーの関心を意味します。これらは、製品カテゴリ、ブランド、音楽のジャンル、バンドなどです。ユーザーの短期的な利益の下で-彼の現在のニーズのために即座に満たされる必要があるもの。たとえば、女の子はブーツを選びます-色、かかとの長さ、靴底の厚さ、価格、ブランド-は短期的な興味に非常に適しています。どちらのタイプの推奨事項も、これらの利益を満たす必要があります。音楽の場合-リズム、ボーカルの有無。
長期的な推奨事項
, (Recency, RFM!) (Frequency) , , … 80% . “” , -, . , , . , , .
, - , , , (batch) . , , - Recency Frequency. .
. , . - , . , , - "Application of Kullback-Leibler divergence for short-term user interest detection”.
, KL ( ) (, , ..). - . “” “”, . ? , , , .
- real-time , . . KL- - embeddings .
/ (recall- diversity tradeoff). , . , - , . “” , . explore-exploit reinforcement learning, . , (diversity) / .