問題タブ [recommendation-engine]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - プリファレンスを評価に変換する
(例)レストランのリストがあるとします。多くのユーザーは、レストランのペアのリストを取得し、好みの 2 つのうちの 1 つを選択します (ホトルノット風)。
これらの結果を絶対的な評価に変換したいと思います。各レストランについて、1 ~ 5 つ星 (必要に応じて、評価は整数でなくてもかまいません)。
この問題を解決する一般的な方法は何ですか?
ありがとう
c# - SPARQL クエリ プログラムを探しています
テストしたいさまざまな sparql クエリがあります。これらのクエリをテストできる Web サイトまたは簡単なプログラムはありますか?
このようなバリデーターは必要ありませんが、実際にクエリを実行して結果を取得したいと思います。
recommendation-engine - 「tastekid」と「clerkdogs」レコメンダー システムの分類方法
Tastekid と clerkdogs は、レコメンダー システムのどのカテゴリに属しているのでしょうか。どちらもユーザーからの評価は必要ないようです。
java - JSR303 検証 - カスタム クラス バリデータからのグループの使用
次のようなフィールドを含むかなり貧弱に構築された Bean があるユースケースがあります。
フラグ [1|2] が true の場合にのみ、電話/住所/都市/州 [1|2] を検証する必要があります。悪い、悪いデザイン、当然です。
私たちの現在の戦略は、「実際の」データフィールドのそれぞれに @NotNull (または必要な検証) を使用し、次のようにグループ インジケーターを使用することです。
この Bean を検証するビジネス ロジック (「デフォルト」検証グループによって検証される他のさまざまなフィールドが含まれる) では、「デフォルト」グループの違反を取得し、flag1 が true かどうかを確認します。そのため、Info.First.class の検証を実行し、flag2 が true かどうかを確認してから、Info.Second.class の検証を実行します。
ここで質問です...カスタムクラスバリデーターからこれらのグループにフックする方法はありますか? flag1/flag2 プロパティとそれに対応するカスタム グループを取得するクラス バリデータを用意し、isValid が呼び出されると、グループに対してこれらの 2 次/3 次呼び出しを行うことを想定しています。目的は単純に、カスタム クラス バリデーターをデフォルト グループに入れることです。そのため、このクラスを検証するビジネス ロジックは、検証を個別に呼び出さなければならないため、この醜いレガシー デザインの詳細が内部に漏れることはありません。
考え?ありがとう!
recommendation-engine - Movielens/Netflix タイプのデータセットで SVD を使用するための基本的な擬似コード
私は、評価予測のために MovieLens/Netflix タイプのデータ セットを使用して SVD の使用を開始する方法を正確に理解するのに苦労しています。Python/Java の単純なサンプル、または関連するプロセスの基本的な擬似コードをいただければ幸いです。全体的な概念を要約した論文や投稿が多数ありますが、提案されたライブラリをいくつか使用しても、実装を開始する方法がわかりません。
私の知る限り、初期データセットを次のように変換する必要があります。
初期データセット:
次のようにピボットする必要があります。
この時点で、利用可能なライブラリによって提供されるように、このマトリックスを SVD アルゴリズムに挿入し、(何らかの方法で) 結果を抽出するだけでよいのでしょうか?
私が読んだいくつかの情報:
http://www.netflixprize.com/community/viewtopic.php?id=1043
http://sifter.org/~simon/journal/20061211.html
http://www.slideshare.net/NYCPredictiveAnalytics/building-a -recommendation-engine-an-example-of-a-product-recommendation-engine
http://www.slideshare.net/bmabey/svd-and-the-netflix-dataset-presentation
.. および他の多くの論文
一部のライブラリ:
LingPipe(java)
Jama(java)
Pyrsvd(python)
特に基本的なデータセットについては、どんなヒントでも大歓迎です。どうもありがとう、オリ
java - 世界に一つしかない「商品」のレコメンドエンジン
私たちが構築している市場では、人々が販売する商品をリストすることができますが、バッチ/バッグ/ボックスで. このためのレコメンデーション エンジンを組み込むことを検討していますが、そこにある記事のほとんどは、多くの製品を大量に「販売」する市場 (Amazon、netflix など) により適しているようです。レコメンデーションエンジンの最善のアプローチは? 関連する記事はありますか?
私たちは、人々が過去に購入したアイテムを知っています。私たちは、彼らが探しているサイズや年齢の適切さを知っています.
リストされたバンドルには、カテゴリ、ブランド、サイズ/年齢、色、および自由形式のテキストがあります。
始めるのに役立つアイデアはありますか?データを MySQL に保存する場合に最適だと思われる特定の言語はありますか?
mahout - 次のような製品推奨の問題を解決する方法:ユーザー__bought__XXXも__viewed__YYY
私は現在レコメンダーシステムを学んでおり、協調フィルタリング、ユーザーCF、アイテムCFについて何かを学びました。これらのアルゴリズムを使用して、次のような問題を解決することは明らかです。
私の質問は次のような問題を解決する方法です:1)ユーザーがXXXもYYYを購入しました2)ユーザーがXXXを購入しYYYも購入しましたか?
更新:タイトルを次のように修正しました:「ユーザーはXXXを購入し、 YYYも表示しました」
recommendation-engine - ユーザーベースのCFまたはアイテムベースのCFが推奨を行うには、どのくらいのデータが必要ですか?
ユーザーCF、アイテムCFが推奨を行うには、どのくらいのデータが必要ですか?
小さなデータセットを手動で作成したので、アルゴリズムがどのように機能しているかをよく理解できます。
私が作成した小さなデータセットの場合、Slope-Oneは推奨を提供できますが、UserCFまたはItemCFは推奨を提供できないことがわかりました。
その背後にある理由は何ですか?
データ量のしきい値はどれくらいですか?
algorithm - この推奨アルゴリズムを実装する方法は?
私が読んだレコメンデーション アルゴリズムの記事のほとんどは、ユーザーがアイテムを評価する Netflix モデルに焦点を当てています。やりたいことがちょっと違う(と思う)。
代わりに、ユーザーに 2 枚の車の写真が表示されるサイトを作成したいとします。ユーザーは、好みの車を選択できます。ユーザーはこのプロセスを好きなだけ繰り返すことができますが、うまくいけば、ユーザーが好きなものに向かって写真がどんどん洗練されていきます。
このアルゴリズムをどのように実装しますか? 単純に ELO ランキング アルゴリズムを実装し、それらの結果の順序を「評価」として使用することが 1 つの方法のように思えますが、これには、複数のアイテムに最大評価を与えることができないという重大な欠陥があります。アイテム自体を評価する機能が与えられている場合)。
私にはより有望に思われる別の方法は、各車両の一般的な特性 (たとえば、色、ボディ タイプ、2 ドアと 4 ドアなど) を事前に決定し、それらを使用して各ユーザーが好む特性の一般的なアイデアを得るというものです。そしてそれから推奨事項をベースにします。
algorithm - 不動産レコメンデーション エンジンの実装方法
映画・アイテムのおすすめみたいなことを言っているのですが、不動産の方がややこしいようです。Web サイトにアクセスして RE を検索すると、ユーザーにいくつかの提案が表示されます。タスクを 2 つのタスクに分けましょう。
a) ユーザーはまだ個人情報を入力していません - アイテムベースの推奨事項 b) ユーザーはすでに収入、場所などの詳細を入力しています - アイテム/ユーザーベースの推奨事項
タスク a) で最初に頭に浮かぶのは、RE フィーチャのモデリングを開始することですが、正確な値ではなく、いくつかの範囲を使用します。例えば:
面積(m2)
- 40 - 50 「1」のマークを付けることができます
- 50~70は「2」
- など...
価格:
- 20 - 30千€は1としてマークされます
- 30 - 40 は 2 になります
- など...
市内中心部への近さ:
- REが市内中心部にある場合は1
- ゾーン 2 の場合は 2、または中心から 2/3 キロメートルまで
- ゾーン 3 の場合は 3、または中心から 7 km
したがって、範囲を持つことで、ベクトルを各 RE プロパティに割り当てることができます。これにより、ユークリッド距離、ピアソン相関、いくつかの最近傍アルゴリズムを使用できるようになります。
私のアプローチについてコメントするか、新しいアプローチを提案してください。