1

整数で識別される大量のプロパティ (~20) を持つ多数のアイテム (~500,000) を持つデータベースがあります。約 50,000 の異なるプロパティがあります。

アイテムのプロパティに基づいて、アイテム間の最適な一致を見つけるプログラムを作成したいと考えています。マッチングの良さを定義するメトリックが利用可能ですが、マッチングが行われてからしばらく時間がかかります。2 つのアイテムが同じプロパティを共有しているからといって、それがうまく一致するとは限りません。このプログラムは、既に作成された一連の一致 (メトリックがわかっている各一致) から、どのグループのプロパティを組み合わせて最適な一致を作成するかを学習する必要があります。

学習プロセスの後、よく学習されたものと部分的に同じ特性を持つ新しいアイテムに最適な一致を作成できるはずです。さらに、プログラムは、メトリックが利用可能になるとすぐに、それ自体を改善するために行う各一致から学習する必要があります。

どうすればこれを引き受けることができますか? これが AI のどのドメインに該当するかはわかりませんが (タイトルの由来)、手動で行う方法なので、プログラムがプロパティによってアイテムを分類し始めると思いました... どのアルゴリズムを使用すればよいでしょうか?確かに調べますか?

編集:アイテムのプロパティの一部またはすべてがカテゴリにつながるホップフィールド ネットワークについて考えましたが、この規模で機能するかどうかはわかりません。

4

1 に答える 1

0

This is typical clustering problem in machine learning, there are Algorithms like K-means can help you. You can experiment with your data using Weka/Orange and choose which algorithms best suits to you. Once you determine right algorithms, you can do the same programatically.

于 2014-08-09T17:29:16.087 に答える