1

私は非常に大きなコーパスを持っており、各要素は大量の高次元データで構成されています。要素は常にコーパスに追加されています。潜在的に、コーパスの一部のみを各相互作用について考慮する必要があります。要素にはラベルが付けられており、複数のラベルとそれらのラベルの強度に関連付けられた重みが付けられている可能性があります。私が理解している限り、データはまばらではありません。

入力データは、約(10-1000)入力間の-1...1の範囲のパラメーターのセットです。これは、どの機械学習方法が最も適切かによって、多少柔軟になる場合があります。

私はハイエンドのスマートフォンデバイスをターゲットにしています。理想的には同じデバイスで処理を行うことができますが、私はそれを控えめなサーバーに送信する可能性を開いています。

この種の状況に適した機械学習アプローチは何でしょうか?

私はランダムフォレスト決定木、制限付きボルツマンマシン、深層学習ボルツマンマシンなどについて読んでいますが、経験豊富な手のアドバイスを実際に使用して、条件をうまく与える研究へのいくつかのアプローチに導くことができました。

私の説明がおかしいと思われる場合は、私がまだアイデアを理解しているので、私に知らせてください。根本的にいくつかの側面を誤解している可能性があります。

4

1 に答える 1

0

最も単純な k 最近傍アルゴリズムを使用してみてください。マンハッタン距離関数を使用して、クイック距離関数を実現できます。次に、最も近いポイントに基づいて加重平均または多数派クラスを取得できます。

これは、カーネル回帰にも似ています。ポイントを効率的に保存するには、kd ツリーなどのデータ構造を使用することをお勧めします。

于 2013-02-11T19:30:43.993 に答える