この新しいエンティティに関する情報が不足しているために、新しいユーザーまたはアイテムがシステムに入るときに推奨を行うことが問題になる「コールドスタート」問題を克服するための方法/アプローチは何ですか。
予測に基づいた推奨(性別、国籍など)を行うことを考えることができます。
この新しいエンティティに関する情報が不足しているために、新しいユーザーまたはアイテムがシステムに入るときに推奨を行うことが問題になる「コールドスタート」問題を克服するための方法/アプローチは何ですか。
予測に基づいた推奨(性別、国籍など)を行うことを考えることができます。
レコメンデーションシステムをコールドスタートできます。
レコメンデーションシステムには2つのタイプがあります。協調フィルタリングとコンテンツベース。コンテンツベースのシステムは、推奨事項に関するメタデータを使用します。問題は、どのメタデータが重要かということです。2番目のアプローチは、メタデータを気にしない協調フィルタリングです。これは、アイテムについて人々が行ったことや言ったことを使用して、推奨を行います。協調フィルタリングを使用すると、メタデータのどの用語が重要であるかを心配する必要はありません。実際、推奨を行うためにメタデータは必要ありません。協調フィルタリングの問題は、データが必要なことです。十分なデータが得られる前に、コンテンツベースの推奨事項を使用できます。両方の方法に基づいた推奨事項を提供できます。最初は100%コンテンツベースであり、その後、より多くのデータを取得すると、協調フィルタリングベースで混合を開始します。それは私が過去に使用した方法です。
もう1つの一般的な手法は、コンテンツベースの部分を単純な検索問題として扱うことです。ドキュメントのテキストまたは本文としてメタデータを入力し、ドキュメントにインデックスを付けます。これは、コードを記述せずにLucene&Solrを使用して実行できます。
基本的な協調フィルタリングがどのように機能するかを知りたい場合は、TobySegaranによる「集合知プログラミング」の第2章を確認してください。
たぶん、あなたはただ推薦をするべきではない時がありますか?「不十分なデータ」は、そのような場合の1つと見なされます。
「性別、国籍など」に基づく予測の推奨がステレオタイプ以上のものになるかどうかはわかりません。
IIRC、Amazonなどの場所は、推奨事項を展開する前にしばらくの間データベースを構築しました。それはあなたが間違えたいようなものではありません。不十分なデータに基づく不適切な推奨事項については、多くの話があります。
自分でこの問題に取り組んでいますが、ボルツマンマシンに関するマイクロソフトのこの論文は価値があるようです:http ://research.microsoft.com/pubs/81783/gunawardana09__unified_approac_build_hybrid_recom_system.pdf
これは以前に何度か尋ねられました(当然、今はそれらの質問を見つけることができません:/、しかし一般的な結論はそのような推奨を避ける方が良いということでした。世界のさまざまな部分で同じ名前が異なる性別に属しているなど...
「類似ユーザーが気に入った...」に基づく推奨事項は、明らかに待たなければなりません。ユーザーの類似性に基づいて予測を行うことに絶対的に取り組んでいる場合は、回答者を調査するためのクーポンやその他のインセンティブを提供できます。
レコメンデーションエンジンをコールドスタートする方法は他に2つあります。
これらすべてに潜在的な落とし穴がたくさんありますが、これは常識的には言及できません。
ご想像のとおり、ここには無料のランチはありません。しかし、このように考えてください。推奨エンジンはビジネスプランではありません。それらは単に事業計画を強化するだけです。
コールドスタートの問題に対処するために必要なものは3つあります。
データは、多くの異なる機能を持つようにプロファイルされている必要があります(製品データでは、「機能」に使用される用語は「分類ファセット」であることがよくあります)。データがドアに入ってきたときにデータを適切にプロファイリングしない場合、レコメンデーションを分類するためのデータがないため、レコメンデーションエンジンは「コールド」のままになります。
最も重要:ユーザーがパーソナライズエンジンの提案を確認できるユーザーフィードバックループが必要です。たとえば、「この提案は役に立ちましたか?」の「はい/いいえ」ボタン。あるトレーニングデータセット(つまり、「推奨」トレーニングデータセット)の参加者のレビューを別のトレーニングデータセット(つまり、トレーニングデータセットを推奨しない)のキューに入れる必要があります。
(推奨/推奨しない)提案に使用されるモデルは、万能の推奨と見なされるべきではありません。顧客に提案する製品またはサービスを分類することに加えて、会社が各特定の顧客をどのように分類するかも重要です。正しく機能している場合、さまざまな機能を持つ顧客が、特定の状況で(推奨/推奨しない)についてさまざまな提案を受け取ることを期待する必要があります。これは、パーソナライズエンジンの「パーソナライズ」部分になります。