問題タブ [collective-intelligence]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - メディアレコメンデーションエンジン-シングルユーザーシステム-開始方法
メディアレコメンデーションエンジンを実装したい。これについても同様の投稿を見ましたが、私の要件はそれらとは少し違うと思うので、ここに投稿してください。
これが取引です。
VLCのようなメディアプレーヤー用のレコメンデーションエンジンを実装したいと思います。これは、シングルユーザーのみを処理する必要があるエンジンです。同様に、通常はシングルユーザーが使用するPCのメディアプレーヤーに埋め込まれます。そして、ユーザーの好き嫌いを学び始め、徐々にユーザーが好きなものを学びます。ここでは、シングルユーザーシステムとして推奨するためにデータを使用するための同様のユーザーを見つけることができません。それで、これについてどうやって行くのですか?
または、iPodなどに搭載する必要があるレコメンデーションエンジンと見なすことができます。iPodは、1人のユーザーについて学習し、そのコレクションから音楽/映画をレコメンデーションする必要があります。
ユーザーが視聴している音楽/映画のジャンル(おそらくアーティスト名)を集めて、最も視聴されているジャンルの映画を推薦することを考えましたが、非常に粗雑に見えますね。
では、使用できるアルゴリズムや参照できるリソースはありますか?
よろしく、
MicroKernel :)
business-intelligence - ビジネスインテリジェンスの意味
「インテリジェンス」という言葉には2つの意味があります。
1:学習、知識の応用、または抽象的に考える能力。
2:a:そのような情報を収集するタスクを持つ敵または組織またはグループに関する情報。b:あらゆる種類のニュースまたは情報。
ビジネスインテリジェンスという用語で、インテリジェンスの意味はどれですか?1または2?
この区別についての記事はウェブ上にありますか?
cluster-analysis - コンテンツベースのアイテム推奨のアプローチ
私は現在、同様のアイテムをグループ化するアプリケーションを開発しています。アイテム(ビデオなど)はユーザーが作成でき、属性は後で変更または拡張できます(新しいタグなど)。ほとんどの協調フィルタリングメカニズムのようにユーザーの好みに依存するのではなく、アイテムの属性(類似した長さ、類似した色、類似したタグのセットなど)に基づいてアイテムの類似性を比較したいと思います。計算は、2つの主な目的で必要です。x特定のアイテムに類似したアイテムを提案することと、類似したアイテムのグループにクラスタリングすることです。
これまでの私のアプリケーションは非同期設計に従っており、このクラスタリングコンポーネントを可能な限り分離したいと考えています。新しいアイテムの作成または既存のアイテムの新しい属性の追加は、コンポーネントが消費できるイベントを公開することによってアドバタイズされます。
計算はベストエフォートで「スナップショット」で提供できます。つまり、結果の品質は最終的には向上しますが、特定の時点で可能な限り最高の結果が得られます。
そのため、私は現在、類似したアイテムとクラスターの両方を計算するための適切なアルゴリズムを探しています。重要な制約はスケーラビリティです。最初はアプリケーションが数千のアイテムを処理する必要がありますが、後で数百万のアイテムも処理できる可能性があります。もちろん、計算は追加のノードで実行されますが、アルゴリズム自体はスケーリングする必要があります。また、アルゴリズムがデータの部分的な変更に対してある種のインクリメンタルモードをサポートしていると便利です。
各アイテムを相互に比較し、数値の類似性を保存するという私の最初の考えは、少し粗雑に聞こえます。n*(n-1)/2また、すべての類似性を保存するためのエントリが必要であり、変更または新しいアイテムがあると、最終的にn類似性の計算が行われます。
前もって感謝します!
更新tl;dr
私が欲しいものを明確にするために、これが私のターゲットシナリオです:
- ユーザーがエントリを生成する(ドキュメントを考えてください)
- ユーザー編集エントリのメタデータ(タグを考えてください)
そして、これが私のシステムが提供するものです:
- 推奨事項としての特定のアイテムに類似したエントリのリスト
- 同様のエントリのクラスター
両方の計算は、以下に基づく必要があります。
- エントリのメタデータ/属性(つまり、同様のタグの使用)
- したがって、適切なメトリックを使用した2つのエントリの距離
- ユーザーの投票、設定、またはアクションに基づくものではありません(協調フィルタリングとは異なります)。ユーザーはエントリを作成して属性を変更できますが、計算ではアイテムとその属性のみが考慮され、関連付けられているユーザーは考慮されません(アイテムのみが存在し、ユーザーが存在しないシステムのように)。
理想的には、アルゴリズムは以下をサポートする必要があります。
- エントリの属性の永続的な変更
- 変更時に類似のエントリ/クラスターを段階的に計算する
- 規模
- 可能であれば、単純な距離テーブルよりも優れたもの(O(n²)スペースの複雑さのため)
algorithm - ソーシャルランキングシステムでカテゴリの多様性を確保できるアルゴリズムはありますか?
私は、ユーザーがアイテムを「好き」にするRedditに似たシステムを構築しています。「いいね」は、アイテムのランキングを決定するために使用されます。「老化」の要因もあり、最近の「いいね」は古代の「いいね」よりも重要です。
全体として、これはここで説明するアルゴリズムに似ています。
私の問題は、結果ランキングの項目の多様性を確保する必要があるということです。各アイテムはカテゴリに属しています。特定のカテゴリは、不釣り合いに人気がある場合があります。フロントページ(または2ページ目)のすべてのアイテムをカテゴリAに含めたくありませんが、他のカテゴリのアイテムはどこにも見つかりません。
では、ここで結果の多様性を確保できる巧妙なアルゴリズムはありますか?すべてのページにさまざまなカテゴリがうまく混在していることを確認するためですか?
ありがとう
ruby-on-rails - ブール値データ用のRailsアイテムからアイテムへのレコメンデーションエンジンデータベース設計?
私はプログラミング集団知能を研究しており、アイテムからアイテムへの推奨を行うためのアルゴリズムはこれまでのところ十分に理解できますが、著者が説明するものから実際のデータベースに基づくシステムを作成する方法に行き詰まっています. 私はacts_as_recommendableを見つけましたが、私が知る限り、放棄されているようです.
私が疑問に思っているのは、次のようにレイアウトされたデータベースがあるとしましょう。
ユーザー:
ID
ユーザー名
ブックマーク:
ID
URL
ユーザーブックマーク:
ユーザーID
ブックマーク_id
(シンプル、ユーザーは多くのブックマークを持つことができ、ブックマークは多くのユーザーを持つことができます)
本のデリシャスの例のアルゴリズムを見ると、URL をブックマークしたユーザーとそうでないユーザーの両方の記録があるようです。1000 人のユーザー システムで 1 つの新しいブックマークを作成するには、1000 の新しいデータベース レコードが必要になるため、これは明らかにデータベースにはまったく適していません。それとも、ここで何かをまったく得ていないだけですか?
上記のデータベース スキーマにどのように追加して、集合知のプログラミングのおいしいリンクの推奨アルゴリズムに従ってブックマークの推奨を計算できるようにしますか?
理想的には、許可ブックマークの類似性をおそらく 1 時間ごとに計算し、ページの読み込み時に推奨される URL をデータベースに照会するだけです。これは、Rails の標準の mysql に裏打ちされたシステムで可能ですか?
前もって感謝します。
computer-science - 「集合知」についてどこで学べますか?
集合知の研究に適したリソースはどれですか?.
私は 1 年間ソフトウェア開発者であり、基本的に Java および Flex プラットフォームで働いています。私は今、「コレクティブ インテリジェンス」の PHD を申請したいと考えています。申請をより強力にするために、申請する前に PHD についてよく読みたいと思っています。
複雑さに浸る前に、いくつかの優れたチュートリアル/ブログが必要です....ありがとう!!
python - Python と集合知: 第 2 章: アイテムの推奨
私は集合知がどのように機能するかを学んでいて、第 2 章の例の recommends.py 問題を実行する練習をしていました。リンクは次のとおりです。
http://cdn.jampad.net/Library/collectiveintelligence/#calibre_link-201
このコードをコピーして貼り付けたとき:
Recommendations.py ファイルに追加し、ファイルをリロードすると、構文エラーが発生します。
それが私が受け取ったメッセージです。コードを正しくコピーして貼り付けたのか、指定されたコード行が間違っているのかわかりません。
search - ユーザーのクリックに基づいてsolr結果をソートしていますか?
ユーザーのクリック ログに基づいて Solr の結果をソートするという問題に直面しています。よりアクセスされた結果が最初に来ることを望みます。Solrでそのようなプロパティを構成または実装する方法を知っている人はいますか?
どうもありがとうございました。
machine-learning - AUCと平均11ポイントの適合率/再現率をどのように組み合わせることができますか?
私はレコメンダーを評価しており、ROC曲線と適合率-再現率曲線があります。一部のパラメーターを変更すると、ROC曲線とPR曲線の変化が少し異なります。ROC曲線がPR曲線よりも良く見える場合、またはその逆の場合があります。したがって、両方の曲線が必要です。ROC曲線をAUCに要約できます。また、11ポイントのPR曲線があるため、11ポイントの平均をとって単一の数値を取得できます。
これらの対策をなんとかして1つの数値にまとめることはできますか?そして、これは人々が行うことですか、それとも不要ですか?
私は曲線を解釈するのが苦手なので、ROCがPRよりも見栄えがするのは主観的なものですか、それとも一方が他方よりも優れている可能性があるというのは妥当ですか?(完全に異なるわけではありませんが、それでも注目に値すると思います)
編集:基本的に私はたくさんのプロットを表示したくありません、私は数字の表が欲しいです。これらの数字を1つのテーブルにまとめますか?または、各メジャーのテーブルを作成しますか?