0

おすすめの音楽プレイリストをリアルタイムで生成できる音楽レコメンデーション システムを実装したいと考えています。これは Prediction.io で実装できると思います...

ただし、Prediction.io の設計により、ユーザーが行った新しいアクション (音楽など) で学習モデルを更新するために、pio train、pio deploy を呼び出す必要があります。したがって、これらのコマンドを実行する必要があります。 2 時間ごと (または別の適切な時間間隔)。

私は最近 Apache Storm に出会いました。「リアルタイム Hadoop」処理の概念がとても気に入っています。したがって、Prediction.io を Apache Storm に組み込んで学習を「オンライン」で行うことができるかどうかを考えていました。これにより、ユーザーを待たせる代わりに、アプリがユーザーによるいくつかのいいね/アクション内で音楽を推奨できるようになります。学習モデルが更新されるまで。

これが実行できない場合、Spark の Mllib を Apache Storm ボルト (Java) に組み込むことは可能ですか?

前もって感謝します!

4

1 に答える 1

0

ユースケースは実行可能に思えますが、「数時間ごとに何かを実行する必要がある」ということは、storm を使用する良い動機とは考えられません。一方、学習データが「ストリーミング」されている場合は、ストーム トポロジをモデル化して、新しいデータが到着するたびに内部の知識ベースを更新できます。これにより、ユーザーが何かをクエリするたびに、最新のナレッジ ベースを使用できます。

どのライブラリを Storm で使用できるかについては、任意の Java ライブラリ (実際には、Java とインターフェースできる場合は任意の言語の任意のライブラリ) が機能するはずです。

于 2015-07-24T18:59:22.467 に答える